Próximas Turmas

  • Frequência: Terça e Quinta
  • Horário: 18:00/21:30h
  • Término Previsto: 16/07/2026
  • Modalidade: Presencial/online
  • Professor: Sergio Luiz
Investimento:

12XR$693,69 no cartão ou Entrade R$ 915,67 até 36x R$ 437,60 (em boleto)*sujeito a análise de crédito

Quero mais informações

O que você vai aprender nesse curso

Objetivo:
Capacitar o aluno a utilizar Python para realizar análise de dados e aplicar conceitos fundamentais de ciência de dados, incluindo preparação, exploração, visualização, modelagem estatística e técnicas introdutórias de machine learning, utilizando ferramentas e bibliotecas amplamente adotadas no mercado.

Capacidades adquiridas:
Ao concluir o curso, o aluno será capaz de programar em Python aplicado à análise de dados, manipular e transformar datasets, explorar e visualizar informações com bibliotecas como Pandas, NumPy, Matplotlib e Seaborn, aplicar conceitos de estatística e treinar modelos de machine learning com scikit-learn. Também estará apto a conduzir projetos completos de análise e modelagem, do tratamento de dados à apresentação de resultados de forma profissional.

Conteúdo do curso

MÓDULO 1 — Fundamentos de Python e Programação (24h)

1.1 Instalação e Configuração do Ambiente

  • Instalação do Python 3.11+
  • Instalação do PyCharm Community
  • Configuração de ambientes virtuais (venv)
  • Execução e depuração de scripts
  • Estrutura de projetos Python

1.2 Lógica de Programação

  • Variáveis e tipos de dados
  • Estruturas condicionais
  • Estruturas de repetição
  • Operadores lógicos e relacionais
  • Entrada e saída (input/output)
  • Manipulação de strings
  • Estruturas de dados
    • listas
    • tuplas
    • sets
    • dicionários
  • Compreensão de listas
  • Tratamento de exceções (try/except)

1.3 Funções

  • Funções com e sem retorno
  • Funções com parâmetros
  • Lambda Functions
  • Recursividade
  • Decorators (introdução)

1.4 Programação Orientada a Objetos

  • Classes e objetos
  • Atributos e métodos
  • Encapsulamento
  • Herança
  • Polimorfismo
  • Construtores

MÓDULO 2 — Ambiente de Análise de Dados + Bibliotecas Essenciais (6h)

2.1 Instalação do Ambiente Científico

  • Instalação do Anaconda
  • Criação e gerenciamento de ambientes Conda
  • Instalação das principais bibliotecas:
    • NumPy
    • Pandas
    • Matplotlib
    • Seaborn
    • Scikit-learn
    • Plotly

2.2 Ambiente Jupyter

  • Uso do Jupyter Notebook e JupyterLab
  • spyder
  • Organização de cadernos
  • Boas práticas para análise de dados

2.3 Preparação para Análises

  • Leitura de arquivos CSV, Excel, JSON
  • Visualização básica de dados
  • Testes simples com NumPy e Pandas

MÓDULO 3 — Análise de Dados com Python (12h)

3.1 NumPy Avançado

  • Arrays, operações vetorizadas
  • Broadcasting
  • Agregações, estatísticas e performance

3.2 Pandas Completo

  • Séries e DataFrames
  • Importação (CSV, Excel, JSON, SQL)
  • Limpeza e tratamento de dados
  • Joins, merges, concat
  • GroupBy, pivot, melt
  • Otimizações de dtype

3.3 Visualização de Dados

  • Matplotlib
  • Seaborn
  • Plotly

3.4 SQL para Análise

  • Criação de tabelas
  • SELECT, WHERE, GROUP BY
  • Consultas avançadas
  • Acesso via SQLAlchemy

MÓDULO 4 — Estatística Aplicada para Ciência de Dados (12h)

4.1. Estatística descritiva

  • Média, mediana, moda
  • Variância e desvio-padrão
  • Boxplots e identificação de outliers

4.2. Probabilidade

  • Eventos, combinatória
  • Distribuição Normal, Binomial e Poisson

4.3. Inferência

  • Intervalos de confiança
  • Testes de hipótese (t-test, qui-quadrado)
  • Correlação e covariância

MÓDULO 5 — Machine Learning com Scikit-Learn (16h)

5.1 Preparação dos Dados

  • Normalização, padronização
  • One-hot encoding
  • Feature engineering
  • Pipelines

5.2 Modelos Supervisados

  • Regressão Linear, Ridge, Lasso
  • KNN
  • Naive Bayes
  • SVM
  • Árvores
  • Random Forest
  • Gradient Boosting

5.3 Não-Supervisionados

  • K-Means
  • DBSCAN
  • PCA

5.4 Validação e Métricas

  • Accuracy, F1
  • MAE, RMSE
  • Cross-validation
  • GridSearchCV

5.5 Redes Neurais com Scikit-Learn

  • MLPClassifier
  • Camadas, funções de ativação
  • Overfitting e regularização

MÓDULO 6 — Deep Learning com TensorFlow/Keras e PyTorch (14h)

6.1. Fundamentos

  • Neurônios artificiais
  • Pesos, bias e função de ativação
  • Backpropagation
  • Taxa de aprendizado
  • Batch, epochs, early stopping

6.2. TensorFlow / Keras

  • Construindo modelos sequenciais
  • Camadas densas
  • Dropout
  • Callbacks
  • Métricas e erros
  • Treinamento com GPU
  • Salvando e carregando modelos

6.3. PyTorch

  • Tensores
  • Autograd
  • DataLoader e datasets
  • Criando redes personalizadas com nn.Module
  • Loop de treino manual
  • Avaliação e métricas

MÓDULO 7 — Projeto Final Integrado (6h)

  1. Coleta de Dados:seleção e obtenção de datasets reais, podendo ser de fontes públicas ou simuladas.
  2. Limpeza e Preparação:tratamento de dados faltantes, inconsistências, outliers e formatação adequada para análise.
  3. Análise Exploratória:exploração e visualização dos dados para identificação de padrões, tendências e insights.
  4. Modelos de Machine Learning:aplicação de técnicas supervisionadas e não supervisionadas utilizando scikit-learn.
  5. Redes Neurais:desenvolvimento de modelos de deep learning utilizando Keras ou PyTorch, incluindo treinamento e avaliação.
  6. Apresentação Final:elaboração de dashboard interativo ou relatório técnico, sintetizando os resultados e insights de forma clara e profissional.