Próximas Turmas
Nenhuma turma disponível no momento
Quero mais informaçõesO que você vai aprender nesse curso
Objetivo: Capacitar o aluno a manipular, analisar e tratar dados, aplicar conceitos estatísticos e construir modelos preditivos utilizando a linguagem R.
Competências adquiridas ao final do curso: O aluno será capaz de manipular, limpar e transformar dados em R, aplicar técnicas de estatística descritiva e inferencial, construir e avaliar modelos de Machine Learning supervisionados e não supervisionados, implementar conceitos básicos de Deep Learning e desenvolver um projeto prático aplicando todo o conhecimento adquirido.
Conteúdo do curso
Módulo 0 — Ambiente de Desenvolvimento (1h)
- Instalação do R (versão 4.3.x)
• Instalação do RStudio Desktop ou uso do RStudio Cloud
• Configuração de diretórios, scripts e preferências da IDE
• Instalação e atualização de pacotes essenciais (dplyr, tidyr, readr, ggplot2, caret, randomForest, rpart, arules, keras, tensorflow)
• Integração com Python para Deep Learning
• Primeiros scripts: leitura de dados, manipulação de data frames e plotagem de gráficos
Módulo 1 — Fundamentos de R e Manipulação de Dados (8h)
- Tipos de dados: vetores, matrizes, listas e data frames
• Operações básicas com dados
• Importação e exportação de dados (CSV, Excel, banco de dados)
• Limpeza e transformação de dados
• Visualização básica de dados com ggplot2
• Exercícios práticos de manipulação e visualização
Módulo 2 — Estatística Descritiva e Inferencial (6h)
- Estatística Descritiva:
• Medidas de centralidade: média, mediana, moda
• Medidas de dispersão: variância, desvio padrão, amplitude
• Quartis, percentis, boxplots
• Visualização estatística: histogramas, densidade, gráficos de dispersão - Probabilidade e Distribuições:
• Probabilidade básica e eventos
• Distribuições discretas e contínuas: Binomial, Poisson, Normal
• Uso de funções do R: dbinom, dpois, dnorm - Inferência Estatística:
• Amostragem e erros amostrais
• Intervalos de confiança
• Testes de hipótese: t-test, qui-quadrado, ANOVA
• Correlação e regressão linear simples
• Identificação e tratamento de outliers
Módulo 3 — Machine Learning em R (10h)
- Aprendizado Supervisionado:
• Regressão Linear Múltipla
• Classificação:
• Naive Bayes (e1071)
• KNN (class)
• Árvores de decisão (rpart)
• Validação de modelos: acurácia, matriz de confusão, precisão, recall, F1-score - Aprendizado Não Supervisionado:
• Agrupamento: k-means
• Avaliação de clusters
• Regras de associação: Apriori (arules) - Projeto Parcial:
• Escolha de dataset real
• Tratamento e limpeza de dados
• Aplicação de técnicas de Machine Learning
• Interpretação dos resultados e avaliação de desempenho
Módulo 4 — Introdução a Deep Learning e Projeto Final (5h)
- Deep Learning:
• Conceitos de Redes Neurais Artificiais
• Estrutura de uma rede: neurônios, camadas, pesos e bias
• Função de ativação e forward propagation
• Treinamento e backpropagation - Implementação em R:
• Uso dos pacotes kerase tensorflow
• Criação de redes simples e perceptron
• Treinamento de modelos com datasets pequenos (ex.: Iris, credit dataset)
• Avaliação de desempenho do modelo (loss, accuracy) - Projeto Final:
• Escolha de dataset aplicável ao mundo real
• Tratamento de dados e análise exploratória
• Aplicação de Machine Learning e/ou Deep Learning
• Apresentação de resultados com gráficos e métricas
• Conclusão e discussão de aprendizados