Ciência de Dados

Especialização em Ciência de Dados aplicada a Políticas Públicas

Especialização

Presencial

375h

Carga Horária

Prorrogadas as inscrições do processo seletivo até 31/10. Editais 108 e 127/2020. O curso, agora com aulas presenciais e online, está fundamentado em 3 eixos temáticos: Ciência da Computação, Matemática/Estatística e Políticas Públicas. A proposta curricular é norteada pela relação entre a Ciência de Dados, o entendimento dos problemas organizacionais e a tomada de decisões baseada em evidências.

Público Alvo

Servidores ou empregados públicos federais que:

  • Atuem em área diretamente relacionada à análise e avaliação de políticas públicas do Governo Federal ou em áreas/unidades que trabalham diretamente com coleta, manipulação, limpeza e integração de dados para tratar problemas no contexto de políticas públicas;
  • Tenham necessidade de desenvolver competências requeridas na coleta, manipulação, limpeza e integração de dados de políticas públicas.

 

Servidores públicos federais ocupantes de cargo efetivo e empregados públicos concursados em exercício na Controladoria-Geral da União; e

Demais servidores públicos federais ocupantes de cargo efetivo, empregados públicos federais concursados e militares das Forças Armadas.

Obejtivo do curso:

Desenvolver e aprimorar a capacidade e competência profissional de servidores públicos federais possibilitando aplicar os conhecimentos de Ciências de Dados na análise e avaliação de Políticas Públicas no âmbito do governo brasileiro em suas diferentes esferas.


Objetivos de Aprendizagem

  • Entender o processo de elaboração de políticas públicas;
  • Conhecer técnicas de avaliação de políticas públicas;
  • Desenvolver habilidades básicas de programação;
  • Desenvolver proficiência na análise estatística de dados com estatística descritiva e inferencial;
  • Criar e avaliar modelos baseados em dados;
  • Desenvolver análises estatísticas em linguagem de programação apropriada;
  • Desenvolver habilidades de coleta, manipulação, limpeza e integração de dados;
  • Aplicar conceitos e métodos de ciência de dados para tratar problemas no contexto de políticas públicas e comunicar suas soluções efetivamente.


Metodologia

O curso, ofertado na modalidade presencial com 40% da carga horária total a distância com aulas online, será um espaço de aprendizagem coletiva, integrando a teoria e a prática.  A participação ativa dos estudantes será demandada nas aulas online e presenciais, bem como no ambiente virtual de aprendizagem, para a fundamentaçao teórica em Ciência de Dados e a aplicação de conceitos nos eixos temáticos de Políticas Públicas, Ciência da Computação e Matemática/Estatística. 

As atividades envolverão aulas expositivas dialogadas; flash cards de revisão teórica; atividades práticas elaboradas na forma de Jupyter Notebooks; discussões em grupos; participação no ciclo de palestras Conhecimentos Conexos; laboratório de casos com utilização de bases de dados robustas, onde serão incentivadas as discussões de experiências e a prática na manipulação e análise de bases de dados de Políticas Públicas de Infraestrutura, de Saúde e Sociais.

As avaliações de aprendizagem abrangerão a aplicação de conceitos, técnicas e reflexões realizadas durante as aulas. As avaliações formativas serão realizadas por meio de trabalhos em grupo e individuais, testes práticos, dentre outras. As somativas incluem o Trabalho de Conclusão de Curso (TCC), que tem o foco na aplicação prática como um diferencial metodológico do curso.

 


Principais Tópicos

Para mais informações, acesse o Edital nº 108/2020 e Anexos e o Edital nº 127/2020 que retifica o Edital nº 108/2020

As inscrições estarão abertas a partir do dia 08 de setembro e encerram em 31 de outubro, às 23h59, horário de Brasília.

Leia também:

 


Turma Tipo da turma Local Período de inscrição Período das aulas Inscrições
Especialização em Ciência de Dados aplicada a Políticas Públicas - 2ª edição Turma aberta - 08/09/2020 - 31/10/2020 05/04/2021 - 24/05/2022 INSCREVA-SE

Outras Informações

EMENTAS E CARGA HORÁRIA 

D1. Análise de Políticas Públicas e Processo Decisório (online)

Dimensões de análise das políticas públicas: tipos de políticas públicas, atores de políticas públicas, fases do processo de elaboração de políticas públicas (formação da agenda, formulação de alternativas, tomada de decisão, implementação, avaliação, extinção). Conceitos, Métodos de Estudo e Avaliação. Formulação e implementação das políticas públicas.

D2. Desenho e Avaliação Ex-Ante de Políticas Públicas (online)

O papel da avaliação ex-ante das políticas públicas. Diagnóstico do problema e modelo lógico: identificação do problema; relação de sobreposição e complementaridade entre as ações estatais; avaliação de desenho de política pública e definição de indicadores. Desenho e suporte da política pública: objetivo e ações; fundamentação; público-alvo; atores envolvidos e seleção de beneficiários. Análise SWOT para entendimento dos contextos internos e externos. Estratégia de construção da confiança e do suporte da implementação e aprovação da política pública.

D3. Políticas Públicas baseadas em evidências (online)

O que são evidências. Como se distingue evidência de opinião. Como se produzem evidências. Como se prospectam evidências. O papel da meta-avaliação em particular das revisões sistemáticas. Como as evidências instruem as diversas fases do ciclo da política pública. O que é política pública baseada em evidências. Como orientar a prática da política pública baseada em evidências. Quais os limites e dificuldades dessa abordagem.

D4. Monitoramento e Avaliação Ex-Post de Políticas Públicas (online)

Breve histórico da avaliação de programas e políticas públicas. programas e políticas como intervenções na realidade. tipologias de avaliação e técnicas de análise (avaliação normativa e pesquisa avaliativa). pesquisa avaliativa (avaliação diagnóstica, avaliação de implementação, avaliação de efeitos (impacto)). projeto de avaliação (desenho, gestão e disseminação). problemas e desafios da avaliação de programas e políticas. Estudos de caso de avaliação de políticas públicas.

D5. Introdução a Programação em Python (presencial)

Algoritmos. Operação de atribuição. Tipos e variáveis. Desvios condicionais. Comandos   de seleção múltipla. laços de repetição. Listas, arrays multidimensionais e dicionários. Operadores matemáticos. Expressões e funções. Depuração de programas e exceções. Algoritmos gulosos, divisão e conquista. Busca sequencial e busca binária. Manipulação de arquivos de texto e arquivos JSON. Ferramenta de log em arquivo texto. Funções de array em nível de elemento (element-wise array functions).

D6. Estatística Descritiva (presencial)

Distribuição de frequências e histograma. Principais medidas de posição: média, mediana, moda, quartis e box plots. Principais medidas de dispersão: amplitude, variância e desvios médio e padrão. Medidas de assimetria e curtose. Medidas envolvendo duas variáveis: covariância e correlação. Análise de dados anômalos ou discrepantes. Aplicações com dados públicos.

D7. Introdução a Banco de Dados e Linguagem SQL (presencial)

Banco de Dados:  Histórico e Características. Projeto de Banco de Dados: Conceitos, Dependência Funcional, Restrições de Integridade e Formas Normais. Modelo Entidade-Relacionamento (ER). Linguagem SQL. Conceitos de transações e propriedades ACID. Mapeamento Objeto Relacional (Object Relational Mapping - ORM). Bancos de dados NoSQL.

D8. Introdução a Ciência de Dados (presencial)

Introdução ao Pandas (Python): Estruturas de dados do Pandas e Numpy. Importação, exportação, manipulação e limpeza de dados. Filtro e Agregação de dados. Análise de Dados Exploratória. Análise de Dados Exploratória Automatizada. Story telling with data. Web scrapping. Regressão Linear. Causalidade em Ciência de Dados.

D9. Laboratório de Casos - Políticas Públicas Sociais (presencial)

Laboratório sobre pobreza e políticas de redistribuição de renda. Laboratório sobre o mercado de trabalho e empregos. Laboratório sobre criminalidade e justiça com foco no público jovem.

D10. Estatística Inferencial (presencial)

Definição e tipos de amostragem. Distribuições da média amostral e do desvio padrão amostral. Estimações pontual e intervalar. Intervalo de confiança para a média, para a proporção e para a variância. Hipóteses estatísticas. Teste de Hipóteses. Teste para n médias (ANOVA). Teste para n Proporções (Teste do Qui-Quadrado).

D11. Laboratório de Casos - Políticas Públicas de Saúde (presencial)

Laboratório sobre atendimentos da saúde básica e atenção familiar. Laboratório sobre a pandemia do COVID-19. Laboratório sobre políticas de vacinação.

D12. Machine Learning (online)

Introdução ao aprendizado de máquina. Aprendizado supervisionado e Não supervisionado. Introdução a framework de programação de aprendizado de máquina. Regressão linear. Overfitting, complexidade, treinamento, validação, dados de teste. Problemas de classificação, fronteiras de decisão, métodos de vizinhos mais próximos. Árvore de decisão e Random Forest. Redes Neurais.

D13. Sistemas de Informação Geográfica (SIG) (presencial)

Representação computacional do espaço. Conceitos: Espaço, Escala, Modelo, Dependência Espacial. Tipos de Dados Geográficos. Estruturas de Dados em SIG. Conceitos básicos de cartografia para Sistemas de Informação Geográfica. Interoperabilidade de Dados Geográficos. Padrões Abertos e Especificações - OGC. Modelagem Numérica de Terreno.    Introdução à Geoestatística. Álgebra de Mapas. Inferência Geográfica e Suporte à Decisão. Estudos de caso: Saúde Coletiva. Estudos Populacionais

D14. Design Sprint e Lean Inception (online)

Introdução ao Lean Inception. Visão do produto. Objetivos do produto. Personas. Jornada de usuários. Funcionalidades. Nivelamento das Funcionalidades. Sequenciamento das Funcionalidades. Canvas MVP. Introdução ao Design Sprint. Dia 1 - Entender/Definir. Dia 2 – Divergir. Dia 3 – Decidir. Dia 4 – Prototipar. Dia 5 – Validar.

D15. Laboratório de Casos - Políticas Públicas de Infraestrutura (presencial)

Laboratório sobre Demografia, habitação, déficit habitacional. Laboratório sobre o uso e racionamento dos recursos hídricos. Laboratório sobre produção e distribuição de energia elétrica.

D16. Diálogos Metodológicos (presencial e online)

Os tipos de conhecimento: uma breve história da Ciência. Métodos científicos: indutivo, dedutivo, hipotético-dedutivo e dialético. Fatos, leis e teorias. Tipos de produção e publicação científica. O projeto de pesquisa: o processo de planejamento do trabalho científico (tema, problema e possíveis respostas; justificativa, objetivos. Elaboração do aporte teórico. Regras da redação científica -citações e referências). Cronograma de projeto. Metodologias de pesquisa: métodos, tipos e natureza. Métodos qualitativos e quantitativos: características, técnicas de coleta, tratamento, análise e apresentação de dados. Estrutura do projeto capstone. Orientação da forma do pré-projeto de pesquisa.

D17. Disciplina Integradora Aplicada (presencial e online)

Trabalhos em grupo com temas específicos escolhidos pelos professores das disciplinas recentemente ministradas para estimular o aluno a articular conceitos e evidenciar o desenvolvimento da capacidade de aplicação do conhecimento adquirido ao longo do curso, conectando teoria e prática.

D18. Conhecimentos Conexos (presencial e online)

Palestras, com conteúdo de curta duração, com temas específicos escolhidos pelos professores das disciplinas recentemente ministradas.

D19. Avaliação de Impacto de Programas e Políticas Sociais- EaD

Avaliação de impacto. Avaliação aleatorizada. Teoria da Mudança. Realização de avaliação aleatorizada. Tamanho amostral e poder estatístico. Medição. Aspectos operacionais. Desafios após o desenho. Uso de evidência. Avaliação do início ao fim.

D20. Monitoria em Ciência da Computação

Comandos de terminal. Caminhos absolutos e relativos. Variáveis de ambiente. Versionamento de código, git e Github. Tabela verdade dos operadores AND, OR e NOT e sentenças SE/ENTÃO. Revisão de conceitos de cartografia.

D21. Monitoria em Matemática e Probabilidade

Regra de três e conceitos elementares de matrizes, conjuntos e funções. Conceitos elementares de probabilidade. Introdução a algebra linear (matrizes, sistemas lineares). Espaços vetoriais e transformações lineares. Ortogonalidade. Tipos de distribuições (Uniforme, Gaussiana). Noções intuitivas de cálculo diferencial.

CARGA HORÁRIA TOTAL: 375 HORAS


Cursos Relacionados
Ciência de Dados