GitHub - tarcisobraz/ufc_data_science: Materiais da Especialização de Ciência de Dados na UNIFACISA

Pré-processamento de Dados - Ciência de Dados UNIFACISA

Índice

Instalação
Motivação
Estrutura e Arquivos
Licença, Autores e Créditos

Instalação

O código assume que você usa Anaconda (Python 3) com as bibliotecas da instalação padrão.

Motivação

O objetivo desse repositório é abrigar o código e dados utilizados na ministração da disciplina de Pré-processamento de Dados na Especialização de Ciência de Dados da UNIFACISA.

A disciplina cobriu os seguintes tópicos:

Preparando do Ambiente
Acessando os Dados
Conhecendo os Dados
- Tipos de Dado
- Análise Exploratória
Preparando os Dados
- Validação do Dado
- Lidando com Problemas no Dado
  - Dados Faltantes (Missing Data)
  - Dados Destoantes (Outliers)
Transformando os Dados
- Uniformização do Dado
  - Normalização e Estandardização
- Redução de Dimensionalidade
- Agrupamento

Estrutura e Arquivos

A pasta notebooks contém os notebooks Jupyter com o código usado nas seções práticas das aulas para cada assunto. A pasta dados contém os dados usados nas seções práticas das aulas para cada assunto.

Licença, Autores e Créditos

Os datasets famosos dos Índios Pima e do Titanic foram obtidos em UCI Machine Learning Repository e Kaggle respectivamente.

Informações de Descrição e Licença do dado podem ser encontradas nos links acima.

Os dados de autores e documentos da Câmara e Senado Federal foram extraídos das APIs de Dados Abertos de cada casa legislativa utilizando o pacote leggoR.

Boa parte do código foi feita com base em exemplos encontrados em sites como o TowardsDataScience.

Sinta-se à vontade para usar o código assim como contribuir.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
preproc-dados		preproc-dados
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Pré-processamento de Dados - Ciência de Dados UNIFACISA

Índice

Instalação

Motivação

Estrutura e Arquivos

Licença, Autores e Créditos

About

Releases

Packages

Languages

tarcisobraz/ufc_data_science

Folders and files

Latest commit

History

Repository files navigation

Pré-processamento de Dados - Ciência de Dados UNIFACISA

Índice

Instalação

Motivação

Estrutura e Arquivos

Licença, Autores e Créditos

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages