Bootcamp Machine Learning

O participante aprenderá a identificar oportunidades de uso e como aplicar técnicas de ML para descobrir padrões em seus próprios dados, construir modelos preditivos para estimar alguma variável de interesse em função dos demais dados disponíveis e melhorar a compreensão do fenômeno subjacente à geração dos dados, para apoio a decisão e otimização de resultados.

Icone presencial

Remoto

130h

Carga horária

Nenhuma turma para este ano até o momento.

Quem pode se inscrever?

Servidores públicos federais de nível superior que atuem diretamente ou pretendam atuar na área temática do curso.

Objetivos

O objetivo deste curso é ensinar os fundamentos de machine learning (ML, ou aprendizado de máquina) em que, em vez do programador descrever explicitamente os procedimentos a serem realizados para se criar o resultado esperado, são fornecidos exemplos de resultados e o próprio algoritmo de aprendizado mapeia o padrão de relações entre os dados de entrada e o resultado esperado, realizando assim previsões para novos casos ainda não encontrados. Por exemplo, dispondo de dados de desempenho passado de alunos no Enem, e de metadados que descrevem esses alunos, é possível treinar um modelo para prever o desempenho esperado de futuros alunos, permitindo conceber intervenções personalizadas e suportar decisões apoiadas em dados.

 

Metodologia

Alternância entre conteúdo expositivo curto, exercícios com codificação para consolidar o domínio das técnicas apresentadas e aplicações em novos conjuntos de dados, de forma guiada, para facilitar a experimentação das técnicas sobre dados reais e o ganho de autonomia do aluno.

 

Principais tópicos

  1. Diferenças entre programação tradicional e aprendizado de máquina (ML): O desafio de prever resultados de um fenômeno sem um modelo explícito de seu funcionamento.
  2. Categorias de machine learning (ML): Supervisionado, não supervisionado e por reforço.
  3. Diversidade de aplicações.
  4. Desafio: estimativa de preço de imóveis em função de suas características.
  5. Regressão linear:
    • Intuição, cenários de uso.
    • Preparação de dados para modelização.
    • Uso da biblioteca python scikit-learn.
  6. Conceitos gerais de ML, aplicados ao caso básico de regressão linear:
    • particionamento dos dados em treinamento/teste/validação;
    • Over e under fitting;
    • Determinantes de desempenho: mais dados, controle de complexidade do modelo, regularização, data augmentation; otimização e gradiente descendente.
  7. Regressão logística: Extensão da regressão linear como primeiro classificador.
  8. Árvore de decisão:
    • Construção e interpretação.
    • Extensão para Random Forest, aplicação sistemática em tarefas de previsão.
    • Desafio: prever sobreviventes do naufrágio do Titanic.
  9. Visão geral de redes neurais: conceito, modelos pré-treinados, aplicações em dados tabulares e processamento de linguagem natural (NLP), com vetorização de palavras e categorias.

Perguntas Frequentes

Ainda com dúvidas? Consulte as perguntas frequentes sobre Cursos