Próximas Turmas
- Frequência: Terça e Quinta
- Horário: 18:00/21:30h
- Término Previsto: 16/07/2026
- Modalidade: Presencial/online
- Professor: Sergio Luiz
12XR$693,69 no cartão ou Entrade R$ 915,67 até 36x R$ 437,60 (em boleto)*sujeito a análise de crédito
O que você vai aprender nesse curso
Objetivo:
Capacitar o aluno a utilizar Python para realizar análise de dados e aplicar conceitos fundamentais de ciência de dados, incluindo preparação, exploração, visualização, modelagem estatística e técnicas introdutórias de machine learning, utilizando ferramentas e bibliotecas amplamente adotadas no mercado.
Capacidades adquiridas:
Ao concluir o curso, o aluno será capaz de programar em Python aplicado à análise de dados, manipular e transformar datasets, explorar e visualizar informações com bibliotecas como Pandas, NumPy, Matplotlib e Seaborn, aplicar conceitos de estatística e treinar modelos de machine learning com scikit-learn. Também estará apto a conduzir projetos completos de análise e modelagem, do tratamento de dados à apresentação de resultados de forma profissional.
Conteúdo do curso
MÓDULO 1 — Fundamentos de Python e Programação (24h)
1.1 Instalação e Configuração do Ambiente
- Instalação do Python 3.11+
- Instalação do PyCharm Community
- Configuração de ambientes virtuais (venv)
- Execução e depuração de scripts
- Estrutura de projetos Python
1.2 Lógica de Programação
- Variáveis e tipos de dados
- Estruturas condicionais
- Estruturas de repetição
- Operadores lógicos e relacionais
- Entrada e saída (input/output)
- Manipulação de strings
- Estruturas de dados
- listas
- tuplas
- sets
- dicionários
- Compreensão de listas
- Tratamento de exceções (try/except)
1.3 Funções
- Funções com e sem retorno
- Funções com parâmetros
- Lambda Functions
- Recursividade
- Decorators (introdução)
1.4 Programação Orientada a Objetos
- Classes e objetos
- Atributos e métodos
- Encapsulamento
- Herança
- Polimorfismo
- Construtores
MÓDULO 2 — Ambiente de Análise de Dados + Bibliotecas Essenciais (6h)
2.1 Instalação do Ambiente Científico
- Instalação do Anaconda
- Criação e gerenciamento de ambientes Conda
- Instalação das principais bibliotecas:
- NumPy
- Pandas
- Matplotlib
- Seaborn
- Scikit-learn
- Plotly
2.2 Ambiente Jupyter
- Uso do Jupyter Notebook e JupyterLab
- spyder
- Organização de cadernos
- Boas práticas para análise de dados
2.3 Preparação para Análises
- Leitura de arquivos CSV, Excel, JSON
- Visualização básica de dados
- Testes simples com NumPy e Pandas
MÓDULO 3 — Análise de Dados com Python (12h)
3.1 NumPy Avançado
- Arrays, operações vetorizadas
- Broadcasting
- Agregações, estatísticas e performance
3.2 Pandas Completo
- Séries e DataFrames
- Importação (CSV, Excel, JSON, SQL)
- Limpeza e tratamento de dados
- Joins, merges, concat
- GroupBy, pivot, melt
- Otimizações de dtype
3.3 Visualização de Dados
- Matplotlib
- Seaborn
- Plotly
3.4 SQL para Análise
- Criação de tabelas
- SELECT, WHERE, GROUP BY
- Consultas avançadas
- Acesso via SQLAlchemy
MÓDULO 4 — Estatística Aplicada para Ciência de Dados (12h)
4.1. Estatística descritiva
- Média, mediana, moda
- Variância e desvio-padrão
- Boxplots e identificação de outliers
4.2. Probabilidade
- Eventos, combinatória
- Distribuição Normal, Binomial e Poisson
4.3. Inferência
- Intervalos de confiança
- Testes de hipótese (t-test, qui-quadrado)
- Correlação e covariância
MÓDULO 5 — Machine Learning com Scikit-Learn (16h)
5.1 Preparação dos Dados
- Normalização, padronização
- One-hot encoding
- Feature engineering
- Pipelines
5.2 Modelos Supervisados
- Regressão Linear, Ridge, Lasso
- KNN
- Naive Bayes
- SVM
- Árvores
- Random Forest
- Gradient Boosting
5.3 Não-Supervisionados
- K-Means
- DBSCAN
- PCA
5.4 Validação e Métricas
- Accuracy, F1
- MAE, RMSE
- Cross-validation
- GridSearchCV
5.5 Redes Neurais com Scikit-Learn
- MLPClassifier
- Camadas, funções de ativação
- Overfitting e regularização
MÓDULO 6 — Deep Learning com TensorFlow/Keras e PyTorch (14h)
6.1. Fundamentos
- Neurônios artificiais
- Pesos, bias e função de ativação
- Backpropagation
- Taxa de aprendizado
- Batch, epochs, early stopping
6.2. TensorFlow / Keras
- Construindo modelos sequenciais
- Camadas densas
- Dropout
- Callbacks
- Métricas e erros
- Treinamento com GPU
- Salvando e carregando modelos
6.3. PyTorch
- Tensores
- Autograd
- DataLoader e datasets
- Criando redes personalizadas com nn.Module
- Loop de treino manual
- Avaliação e métricas
MÓDULO 7 — Projeto Final Integrado (6h)
- Coleta de Dados:seleção e obtenção de datasets reais, podendo ser de fontes públicas ou simuladas.
- Limpeza e Preparação:tratamento de dados faltantes, inconsistências, outliers e formatação adequada para análise.
- Análise Exploratória:exploração e visualização dos dados para identificação de padrões, tendências e insights.
- Modelos de Machine Learning:aplicação de técnicas supervisionadas e não supervisionadas utilizando scikit-learn.
- Redes Neurais:desenvolvimento de modelos de deep learning utilizando Keras ou PyTorch, incluindo treinamento e avaliação.
- Apresentação Final:elaboração de dashboard interativo ou relatório técnico, sintetizando os resultados e insights de forma clara e profissional.