Próximas Turmas

  • Frequência: Sábado
  • Horário: 09:00/13:00h
  • Término Previsto: 31/08/2024
  • Modalidade: Presencial/online
  • Professor: Sergio Luiz
Investimento:

12xR$280,00

Realizar matrícula

O que você vai aprender nesse curso

O curso de Cientista de dados – Python e R tem como objetivo apresentar as linguagens Python E R voltadas unicamente para análise de dados. Iremos abordar  análises descritivas, modelos estatísticos e modelos preditivos.

No primeiro módulo faremos analises descritivas utilizando o Numpy e Pandas (dataframe) no Python, no R utilizaremos os conceitos de vetores, matrizes e dataframes, acesso a dados via arquivos e banco de dados. 

No segundo módulo iremos falar de conceitos de probabilidade e estatística como: distribuições e regressões

No módulo final entraremos nos conceitos de Machine learning e Deep learning efetuando os treinamentos supervisionadas e não supervisionados, criaremos os modelos e faremos as avaliações de desempenho. 

Após toda essa jornada o aluno estará apto para entender os conceitos básicos das linguagens Python e R e analisar e construir seus próprios modelos preditivos, assim podendo dar início a sua carreira como cientista de dados. 

Pré-requisitos: Lógica de programação e banco de dados (conceitos iniciais)

Conteúdo do curso

Estatística, Machine Learning e Deep Learning com python (16 horas)

  • Configurando o Ambiente Python
    • Baixando e instalando Python 3.6/ 3.7
    • Instalação do anaconda
    • IDE Jupyter
    • IDE Spyder
  • Introdução a programação
    • Tipos de dados
    • Tipagem dinâmica
    • Strings
    • Listas
    • Dicionários
    • Tuplas
    • Escrita e leitura de arquivos
    • Funções blocos
    • Classes e métodos
  • Analise de dados
    • Numpy
      • Introdução a biblioteca
      • Array VS python list
      • Eficiência com NumPy
      • Slicing Arrays
      • Matrizes com listas
      • Matrizes com NumPy
      • Operações com matrizes
      • Visualizando dados com matplotlib
      • Inserindo elementos em um array
      • Adicionando elementos ao final de um array
      • Deletando elementos do array
      • Titile em um array
      • Dividindo um array
      • Arrays de zeros e uns
    • Biblioteca Pandas
      • Series
      • DataFrame
      • Index
      • Datasets
      • Datasets com db.py
      • Datasets com CSV / Excel
      • Filtro em um DataFrame
      • Dados Categóricos
      • Dados perdidos em um dataset
      • Operações de agregação e agrupamento
      • Joins
      • Pivot tables
      • Visualização com matplotlib
      • Series Temporais
    • Biblioteca Matplotlib
      • Gráficos
      • Barra
      • Linha
      • Dispersão
      • Seaborn
      • Customizando
      • Histograma e Gráfico de Pizza
    • Regressão Linear
      • Linear simples
      • Entendo o método dos mínimos quadrados
    • Machine learning
      • Naive Bayes
        • Introdução
        • Classificação
        • Correlação de laplaciana
        • Naive Bayes – scikit-learn
        • Naive Bayes – Iris dataset
        • Naive Bayes – credit dataset
        • Naive Bayes
      • Aprendizado baseado em arvores (Tree)

 

 

  • Introdução
  • Conceito
  • Arvores com scikit-learn
  • Arvores com scikit-learn Iris dataset
  • Random Forest
  • Random Forest scikit-learn

 

  • Maquina de vetor de suporte (SVM)
    • Introdução
    • Conceito
    • Linear x não linear
    • SVM scikit-learn
    • SVM scikit-learn Iris dataset
    • SVM credit dataset
  • Aprendizado baseado em instancia (KNN)
    • Introdução ao KNN
    • Funcionamento
    • Calculando a distância euclidiana
    • Distancia euclidiana e distancia Manhattan
    • Determinação da classe
    • Vantagens e desvantagens
    • Implementação do KNN – python
    • Implementação do KNN - sklearn
    • Implementação do KNN – sklearn e NumPy
    • Utilizando o model selection e score
    • KNN com sklearn – Dataset Iris
    • KNN - Regressão
    • Introdução a Regressão com KNN
    • Implementação da Regressão com KNN
    • Regressão com sklearn
    • Erro quadrático médio
    • Regressão em um datasets
  • Apriori (Aprendizagem não supervisionada)
    • Introdução
    • Conceito
    • Suporte, confiança e lift
    • Regras de associação
    • Regras de associação base de compras

 

  • Agrupamento (k-means)
    • Introdução
    • Calculo da distancia
    • Inicialização
    • Iris dataset
  • Deep learning
    • Redes Neurais
    • Conceito
    • Pratica
    • Exemplos
    • Redes neurais artificiais
    • Conceito
    • Prática
    • Exemplos
  • Conhecendo a rede perceptron
    • Processo de treinamento em perceptron
    • Algoritmo de treinamento em perceptron
    • Implementação da perceptron
    • Camadas ocultas
    • Calculo do erro, pesos, e bias.
    • Backpropagation, taxa de aprendizagem e momento
    • Ajustes dos pesos
    • Redes com pybrain
    • Redes scikit-learn
    • Redes scikit-learn Iris dataset

Introdução a análise de dados em R (16 Horas)

  • Baixando e configurando o R
    • RStudio
  • Introdução ao R
    • Vetores
    • Matrizes
    • Arrays
    • Data frames
    • Listas
    • Funções
  • Importação de dados
    • Arquivos de texto
    • Csv
    • Acessando banco de dados
    • Executando rotinas 
  • Introdução a Estatística
    • Amostragem
    • Medidas de Centralidade e Variabilidade
    • Probabilidade
    • Distribuição Binomial
    • Distribuição Normal
    • Distribuição de Poisson
    • Intervalos de Confiança
    • Testes de Hipótese
  • Introdução a Regressão Linear
    • Correlação
    • Regressão Linear - Previsão
    • Regressão Linear – Residual
    • Outliers e Extrapolação
    • Regressão múltipla
    • Cálculos e fórmulas
    • Regressão logística 
  • Series Temporais
    • Introdução
    • Componentes de Uma Serie Temporal
    • Decomposição
    • Previsão
  • Machine Learning
    • Classificação com naive Bayes
    • Arvore decisão rpart
    • Aprendizado baseado em instancia (KNN)
    • Agrupamentos
    • Regra de associação
    • Regra de associação com apriori
    • Regras de associação com Eclad
  • Gráficos e dashboards
    • Histograma
    • Densidade
    • Dispersão
    • Dispersão com legendas
    • Split da tela
    • Boxplot
    • Usando lattice
    • Gráfico 3D com lattice
  • Redes Neurais e Deep Learning
  • Deep Learning
    • Conceito
    • Pratica
    • Exemplos
  • Redes neurais artificiais
    • Conceito
    • Prática
    • Exemplos
  • Conhecendo a rede perceptron
  • Processo de treinamento em perceptron
  • Algoritmo de treinamento em perceptron
  • Implementação da perceptron
  • Redes neurais com sklearn
  • Mineração de texto
    • Introdução
    • Conceito
    • Criação do corpus
    • Geração da nuvem de palavras
    • Matriz de freqüência
  • Finalização e definição de projeto (opcional)
  • Escolha do dataset do projeto
  • Pode ser aplicado no mundo real
  • Aplicar suposições
  • Gráficos
  • KNN
  • Apresentação e conclusão do curso