Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Análise exploratória de dados #1

Open
4 of 5 tasks
omadson opened this issue Jul 19, 2024 · 1 comment
Open
4 of 5 tasks

Análise exploratória de dados #1

omadson opened this issue Jul 19, 2024 · 1 comment

Comments

@omadson
Copy link
Member

omadson commented Jul 19, 2024

A equipe deve entregar e apresentar uma análise exploratória dos dados (exploratory data analysis, EDA). Nesse ponto, o projeto terá finalizado a fase de entendimento dos dados na metodologia CRISP-DM. Desse modo, os pontos a serem observados na execução são:

  • Proposta do projeto: a equipe deve compreender completamente, de uma perspectiva de negócios, o que realmente deve ser feito no projeto, em seguida, modificar o arquivo README.md, contendo um resumo do projeto que será construído. Tente apresentar uma justificativa para o projeto. É desejável que também se insira um graphical abstract.
  • Coleta inicial de dados: a equipe deve apresentar um conjunto de dados "cru", no repositório do projeto, salvo na pasta data/raw/.
  • Criação do dicionário de dados: a equipe deve criar um arquivo (ou vários) de dicionário de dados, contendo informações referentes aos conjuntos de dados utilizados no projeto. Serão arquivos no formato CSV, que devem ser guardados na pasta data/external/;
  • Exploração de dados: a equipe deve criar um notebook de análise exploratória notebooks/01-exploratory_data_analysis.ipynb, contendo as seguintes seções de texto: Descrição dos dados, Perguntas de partida e hipóteses, Insights, de acordo com o conteúdo visto em aula;
  • Apresentação de resultados: a equipe deve produzir uma apresentação de slides de no máximo 5min para ser apresentada ao professor e o restante da turma.
@omadson
Copy link
Member Author

omadson commented Aug 5, 2024

Proposta do projeto (README.md)

  • Resumo do projeto
  • Nome do projeto
  • Nome dos colaboradores
  • Resumo gráfico
  • Logomarca
  • Adicionou outras informações

Coleta inicial de dados e criação do dicionário de dados

  • Adicionou o conjunto de dados na pasta data/raw/?
  • Criou e salvou o dicionário de dados na pasta data/external/?

Exploração de dados

Pontos positivos

  • Escreveu uma descrição dos dados?
  • Falou sobre dados faltantes?
  • Escreveu perguntas e partidas de hipóteses?
  • Utilizou mais que 3 tipos de gráficos?
  • Escreveu um sumário dos insights no final?
  • Criou gráficos que não foram vistos em aula?
  • Fez análise univariada?
  • Fez análise bivariada?
  • Fez análise multivariada?

Pontos negativos

  • Usou canal de cor sem necessidade?
  • Utilizou rótulos inclinados?
  • Utilizou gráfico de dispersão quando deveria ter utilizado gráfico de boxplot?
  • Não ordenou gráficos de barra quando deveria?

Comentários

  • Gente, parabéns pelo trabalho realizado. Vocês foram muito bem. Conseguiram realizar muita coisa até agora.
  • O README.md está lindo, o resumo gráfico está fantástico! Eu só adicionaria mais sobre a equipe de vocês, colocaria a logo.
  • A análise exploratória também está muito boa, vocês realmente conseguiram tirar informação dos dados que tinham, talvez falte só uma descrição dos dados e revisão de alguns gráficos.
  • Parabéns, gente, continuem assim!

ernandes0 added a commit that referenced this issue Aug 26, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant