Próximas Turmas

  • Frequência: Segunda e Quarta
  • Horário: 18:00/21:30h
  • Término Previsto: 27/08/2025
  • Modalidade: Presencial/online
  • Professor: Sergio Luiz
Investimento:

12xR$539,60 no cartão de crédito consulte-nos para financiamento em boleto pela princípia

Quero mais informações

O que você vai aprender nesse curso

O curso de Cientista de dados – Python e R formação completa tem como objetivo apresentar as linguagens de programação Python e R voltadas para a construção de análises descritivas, modelos estatísticos e modelos preditivos. O curso vai abordar conceitos básicos e avançados das tecnologias.

No primeiro módulo do curso teremos conceitos da linguagem Python como: variáveis, funções, estruturas de controles, loops, condicionais e orientação a objetos e na  linguagem R: Variáveis, loops, condicionais, vetores, matrizes e dataframes. 

No segundo módulo vamos dar início aprendendo a fazer acesso a dados via arquivos e banco de dados, continuaremos o estudo iniciando os conceitos de probabilidade e estatística.

 No módulo final entraremos nos conceitos de Machine learning e Deep learning efetuando os treinamentos supervisionadas e não supervisionados, criaremos os modelos e faremos as avaliações de desempenho. 

Após toda essa jornada o aluno estará apto para entender os conceitos básicos das linguagens Python e R e analisar e construir seus próprios modelos preditivos, assim podendo dar início a sua carreira como cientista de dados.

 Pré-requisitos à nenhum pré-requisito é necessário.

Conteúdo do curso

Introdução a programação em Python (28 horas)

  • Softwares
    • Linguagem Python 3.7
    • IDE Pycharm
  • Lógica de programação
    • Introdução
      • Variáveis
      • Tipos de dados
      • Int
      • Float
      • String
      • Boolean
      • Nomenclatura de variáveis
      • Executando o código
      • Criando algoritmos
    • Operadores
      • Relacionais
      • Lógicos
    • Estruturas
      • Condicionais
      • IF
      • ELSE
      • ELIF
      • Repetição
      • WHILE
      • FOR
      • Instrução break
    • Manipulação de string
      • Convertendo listas em Strings
      • Strings Maiúsculas e minúsculas
      • Verificação em String
      • Contagem em String
      • Dividindo String
    • Coleções
      • Criando
      • Acessando
      • Inicializando
      • Varrendo
      • Fatiando
      • Listas
      • Dicionários
      • Tuplas
    • Funções
      • Não Retornáveis
      • Retornáveis
      • Parametrizadas
      • Recursividade
      • Funções lambda
    • Introdução a programação orientada a objetos
      • Classes
      • Métodos
      • Atributos
      • Relacionamento
      • Construtores
      • Encapsulamento
      • Sobrescrita
    • Trabalhando com arquivos
      • Criando
      • Acessando
      • Gravando dados em arquivos
      • Lendo dados do arquivo

Introdução a análise de dados em python (16 horas)

  • Instalação e softwares
    • Python 3.7
    • Plataforma anaconda
    • IDE jupyter / spider
  • Numpy
    • Introdução a biblioteca
    • Array VS python list
    • Eficiência com NumPy
    • Slicing Arrays
    • Matrizes com listas
    • Matrizes com NumPy
    • Operações com matrizes
    • Visualizando dados com matplotlib
    • Inserindo elementos em um array
    • Adicionando elementos ao final de um array
    • Deletando elementos do array
    • Titile em um array
    • Dividindo um array
    • Arrays de zeros e uns
    • Exercicios complementares
  • Biblioteca Pandas
    • Series
    • DataFrame
    • Index
    • Datasets
    • Datasets com db.py
    • Datasets com CSV / Excel
    • Filtro em um DataFrame
    • Dados Categóricos
    • Dados perdidos em um dataset
    • Operações de agregação e agrupamento
    • Joins
    • Pivot tables
    • Visualização com matplotlib
    • Series Temporais
    • Exercícios complementares
  • Biblioteca matplotlib
    • Gráficos
    • Barra
    • Linha
    • Dispersão
    • Seaborn
    • Customizando
    • Histograma e Gráfico de Pizza
    • Exercícios complementares
  • Análise de dados via banco de dados POSTGRESQL
    • Instalação do PostgreSQL
    • Configuração
    • Construindo a estrutura de dados (tabelas)
    • Efetuando consultas
    • Analisando as consultas via Numpy e pandas
    • agrupamento
    • Contagens
    • Pivotagem
    • Filtros
    • Rankeamento
    • Exercícios complementares

Estatística, Machine Learning e Deep Learning com python (24 horas)

  • Introdução a linguagem R
    • Variáveis
    • Vetores, Matrizes, Listas, Arrays
    • Dataframe
    • Funções
    • Exercícios complementares
  • Regressão Linear
    • Simples
    • Múltiplas
    • Logísticas
    • Entendo o método dos mínimos quadrados
    • Exercícios complementares
  • Machine learning
    • Classificação
    • Correlação de laplaciana
    • Naive Bayes – scikit-learn
    • Naive Bayes – Iris dataset
    • Naive Bayes – credit dataset
    • Naive Bayes
    • Exercícios complementares
  • Aprendizado baseado em arvores (Tree)
  • Introdução
  • Conceito
  • Arvores com scikit-learn
  • Arvores com scikit-learn Iris dataset
  • Random Forest
  • Random Forest scikit-learn
  • Exercícios complemtares
  • Maquina de vetor de suporte (SVM)
    • Introdução
    • Conceito
    • Linear x não linear
    • SVM scikit-learn
    • SVM scikit-learn Iris dataset
    • SVM credit dataset
    • Exercícios complementares
  • Aprendizado baseado em instancia (KNN)
    • Introdução ao KNN
    • Funcionamento
    • Calculando a distância euclidiana
    • Distancia euclidiana e distancia Manhattan
    • Determinação da classe
    • Vantagens e desvantagens
    • Implementação do KNN – python
    • Implementação do KNN - sklearn
    • Implementação do KNN – sklearn e NumPy
    • Utilizando o model selection e score
    • KNN com sklearn – Dataset Iris
    • KNN - Regressão
    • Introdução a Regressão com KNN
    • Implementação da Regressão com KNN
    • Regressão com sklearn
    • Erro quadrático médio
    • Regressão em um datasets
    • Exercícios complementares
  • Apriori (Aprendizagem não supervisionada)
    • Introdução
    • Conceito
    • Suporte, confiança e lift
    • Regras de associação
    • Regras de associação base de compras
    • Exercícios complementares
  • Agrupamento (k-means)
    • Introdução
    • Calculo da distancia
    • Inicialização
    • Iris dataset
  • Deep learning
    • Redes Neurais
      • Conceito
      • Pratica
      • Exemplos
    • Redes neurais artificiais
      • Conceito
      • Prática
      • Exemplos
    • Conhecendo a rede perceptron
      • Processo de treinamento em perceptron
      • Algoritmo de treinamento em perceptron
      • Implementação da perceptron
      • Camadas ocultas
      • Calculo do erro, pesos, e bias.
      • Backpropagation, taxa de aprendizagem e momento
      • Ajustes dos pesos
      • Redes com pybrain
      • Redes scikit-learn
      • Redes scikit-learn Iris dataset
      • Exercícios complementares
  • Projeto Final Python ( Machine learning ou Deep Learning)
    • Seleção de um DataSet
    • Aplicar técnicas para tratamento de dados
    • Selecionar o tipo de tarefa que será aplicada
    • Efetuar o treinamento
    • Simular o projeto em produção e avaliar o rendimento

Introdução a análise de dados em R (18 Horas)

  • Linguagem R
    • Baixando e configurando o R
      • RStudio
    • Introdução ao R
      • Vetores
      • Matrizes
      • Arrays
      • Data frames
      • Listas
      • Funções
      • Exercícios complementares
    • Importação de dados
      • Arquivos de texto
      • Csv
      • Acessando banco de dados
      • Executando rotinas 
      • Exercícios complementares
    • Introdução a Estatística
      • Amostragem
      • Medidas de Centralidade e Variabilidade
      • Probabilidade
      • Distribuição Binomial
      • Distribuição Normal
      • Distribuição de Poisson
      • Intervalos de Confiança
      • Testes de Hipótese
      • Exercícios complementares
    • Introdução a Regressão Linear
      • Correlação
      • Regressão Linear - Previsão
      • Regressão Linear – Residual
      • Outliers e Extrapolação
      • Regressão múltipla
      • Cálculos e fórmulas
      • Regressão logística 
      • Exercícios complementares
    • Series Temporais
      • Introdução
      • Componentes de Uma Serie Temporal
      • Decomposição
      • Previsão
      • Exercícios complementares
    • Machine Learning
      • Classificação com naive Bayes
      • Arvore decisão rpart
      • Aprendizado baseado em instancia (KNN)
      • Agrupamentos
      • Regra de associação
      • Regra de associação com apriori
      • Regras de associação com Eclad
      • Exercícios complementares
    • Gráficos e dashboards
      • Histograma
      • Densidade
      • Dispersão
      • Dispersão com legendas
      • Split da tela
      • Boxplot
      • Usando lattice
      • Gráfico 3D com lattice
      • Exercicios complementares
    • Redes Neurais e Deep Learning
    • Deep Learning
      • Conceito
      • Pratica
      • Exemplos
  • Redes neurais artificiais
    • Conceito
    • Prática
    • Exemplos
  • Mineração de texto
    • Introdução
    • Conceito
    • Criação do corpus
    • Geração da nuvem de palavras
    • Matriz de freqüência
  • Finalização e definição de projeto
    • Escolha do dataset do projeto
    • Pode ser aplicado no mundo real
    • Aplicar suposições
    • Gráficos
    • KNN
    • Apresentação e conclusão do curso