O curso tem como objetivo discutir diferentes metodologias para estudar e analisar conjuntos de dados, o que possibilita a toma de decisões mais informadas. O curso é dividido em várias aulas, sendo que cada aula é composta por aulas teóricas e práticas.
Março, 2023
Plano de ensino proposto para a disciplina. Nesse material é informado o programa da disciplina e as referências bibliográficas sugeridas para o acompanhamento dos assuntos.
Março, 2023
Nessa aula é apresentada uma breve história da ciência de dados, desde a sua origem até os dias atuais. São discutidos os principais conceitos e métodos utilizados na área.
Março, 2023
Nessa aula é apresentado um exemplo de portfólio em ciência de dados. São discutidos os principais passos para a criação de um portfólio, desde a escolha do tema até a apresentação dos resultados.
Abril, 2023
Nessa aula é apresentado o Git, um sistema de controle de versão distribuído. São discutidos os principais conceitos e comandos utilizados no Git.
Abril, 2023
Nessa aula é apresentado o GitHub, uma plataforma de hospedagem de repositórios Git. São discutidos os principais conceitos e comandos utilizados no GitHub.
Abril, 2023
Nessa aula é apresentado o R, uma linguagem de programação e ambiente computacional para análise de dados. São discutidos os principais conceitos e comandos utilizados no R.
Abril, 2023
É apresentada uma breve introdução à linguagem de programação Python e sua utilidade na análise de dados.
Maio, 2023
Na estatística robusta são discutidos cenários nos quais a presença de valores atípicos, influentes ou discrepantes podem comprometer os resultados estatísticos tradicionais. Neste curso exploraremos os fundamentos da Estatística Robusta e suas aplicações práticas.
Junho, 2023
Nesta aula são discutidas algumas métricas para verificar o desempenho dos modelos preditivos em diferentes contextos.
Abril, 2025
A disciplina abrange conceitos essenciais, como o modelo de regressão linear simples e múltipla, inferência estatística em regressão, diagnóstico de modelos, seleção de variáveis e suposições do modelo.
Agosto, 2025
A disciplina tem como objetivo discutir diferentes metodologias para a análise de séries temporais univariadas. Ao longo dessas discussões são apresentados conceitos fundamentais e práticos para o tratamento de dados com estrutura de dependência. Várias aplicações práticas são desenvolvidas para melhor compreensão dos conceitos.
As referências bibliográficas estão compostas por livros físicos, livros online e alguns sites com assuntos relacionados à áreas. Os livros online são gratuitos e podem ser acessados diretamente no link. Os livros físicos podem ser adquiridos em livrarias ou em sites de vendas online.
Scripts em R e Python estão disponíveis para ilustrar algumas técnicas utilizadas para a análise de dados. Para execução do exemplos são utilizados conjuntos de dados disponíveis na seção de Datasets. Não esqueça de verificar a seção de Referências Bibliográficas para obter mais informações sobre os métodos utilizados.
Os conjuntos de dados disponíveis também são proporcionados por diversas plataformas de análise de dados ou por instituições dedicadas ao tratamento estatístico de dados. A maioria dos conjuntos de dados são disponibilizados em formato csv e podem ser baixados diretamente dos links abaixo.
Laboratório de Estatística e Computação Natural -- LECON
Departamento de Estatística | Universidade Federal do Espírito Santo
Av. Fernando Ferrari, 514 - Goiabeiras, Vitória - ES, 29075-910.