Próximas Turmas

Nenhuma turma disponível no momento

Quero mais informações

O que você vai aprender nesse curso

Objetivo: Capacitar o aluno a manipular, analisar e tratar dados, aplicar conceitos estatísticos e construir modelos preditivos utilizando a linguagem R.

Competências adquiridas ao final do curso: O aluno será capaz de manipular, limpar e transformar dados em R, aplicar técnicas de estatística descritiva e inferencial, construir e avaliar modelos de Machine Learning supervisionados e não supervisionados, implementar conceitos básicos de Deep Learning e desenvolver um projeto prático aplicando todo o conhecimento adquirido.

Conteúdo do curso

Módulo 0 — Ambiente de Desenvolvimento (1h)

  • Instalação do R (versão 4.3.x)
    • Instalação do RStudio Desktop ou uso do RStudio Cloud
    • Configuração de diretórios, scripts e preferências da IDE
    • Instalação e atualização de pacotes essenciais (dplyr, tidyr, readr, ggplot2, caret, randomForest, rpart, arules, keras, tensorflow)
    • Integração com Python para Deep Learning
    • Primeiros scripts: leitura de dados, manipulação de data frames e plotagem de gráficos

Módulo 1 — Fundamentos de R e Manipulação de Dados (8h)

  • Tipos de dados: vetores, matrizes, listas e data frames
    • Operações básicas com dados
    • Importação e exportação de dados (CSV, Excel, banco de dados)
    • Limpeza e transformação de dados
    • Visualização básica de dados com ggplot2
    • Exercícios práticos de manipulação e visualização

Módulo 2 — Estatística Descritiva e Inferencial (6h)

  • Estatística Descritiva:
    • Medidas de centralidade: média, mediana, moda
    • Medidas de dispersão: variância, desvio padrão, amplitude
    • Quartis, percentis, boxplots
    • Visualização estatística: histogramas, densidade, gráficos de dispersão
  • Probabilidade e Distribuições:
    • Probabilidade básica e eventos
    • Distribuições discretas e contínuas: Binomial, Poisson, Normal
    • Uso de funções do R: dbinom, dpois, dnorm
  • Inferência Estatística:
    • Amostragem e erros amostrais
    • Intervalos de confiança
    • Testes de hipótese: t-test, qui-quadrado, ANOVA
    • Correlação e regressão linear simples
    • Identificação e tratamento de outliers

Módulo 3 — Machine Learning em R (10h)

  • Aprendizado Supervisionado:
    • Regressão Linear Múltipla
    • Classificação:
    • Naive Bayes (e1071)
    • KNN (class)
    • Árvores de decisão (rpart)
    • Validação de modelos: acurácia, matriz de confusão, precisão, recall, F1-score
  • Aprendizado Não Supervisionado:
    • Agrupamento: k-means
    • Avaliação de clusters
    • Regras de associação: Apriori (arules)
  • Projeto Parcial:
    • Escolha de dataset real
    • Tratamento e limpeza de dados
    • Aplicação de técnicas de Machine Learning
    • Interpretação dos resultados e avaliação de desempenho

Módulo 4 — Introdução a Deep Learning e Projeto Final (5h)

  • Deep Learning:
    • Conceitos de Redes Neurais Artificiais
    • Estrutura de uma rede: neurônios, camadas, pesos e bias
    • Função de ativação e forward propagation
    • Treinamento e backpropagation
  • Implementação em R:
    • Uso dos pacotes kerase tensorflow
    • Criação de redes simples e perceptron
    • Treinamento de modelos com datasets pequenos (ex.: Iris, credit dataset)
    • Avaliação de desempenho do modelo (loss, accuracy)
  • Projeto Final:
    • Escolha de dataset aplicável ao mundo real
    • Tratamento de dados e análise exploratória
    • Aplicação de Machine Learning e/ou Deep Learning
    • Apresentação de resultados com gráficos e métricas
    • Conclusão e discussão de aprendizados