Skip to content

Latest commit

 

History

History
48 lines (30 loc) · 2.88 KB

README.md

File metadata and controls

48 lines (30 loc) · 2.88 KB

Curso de introduccion a la ciencia de datos

En este curso se aprendio desde lo basico de Markdown y sus comandos, las librerias numpy y pandas, tambien las librerias de visualizacion matplotlib, seaborn y Plotly. Y por ultimo se desarrollo un proyecto de ciencia de datos donde se aplicaron todos los conocimientos aprendidos. A continuacion se desarrollara de manera mas detallada de que va este proyecto, ya que es la parte interesante de este repositorio. Revisar la carpeta notebook del curso, ya que estan los ejercicios realizados en clase con su respectiva explicacion.

Proyecto Data Science sobre Pokemon

Utilizamos un datasets con datos de 1044 pokemon, que en teoria deberian ser todos los pokemon existentes hasta la 8va generacion. La fuente de estos datasets son muy posiblemente kaggle, el mismo fue suministrado en un curso de introduccion al DataScience de la academia Mastermind.

Motivacion.

Aprender y practicar dentro de la rama de la ciencia de datos.

Problema que soluciona.

El problema planteado en el proyecto de pokemon, fue para resolver algunas preguntas:

  • Cual es el tipo de Pokemon mas comun?
  • Cuantos Pokemon legendarios hay en cada generacion?
  • Su podercambia generacion tras generacion?
  • Cual es el tipo de Pokemon mas poderoso?
  • Cuales son los pokemones mas grandes? Y mas pesados? Y menos densos?
  • Cuandos Pokemon son machos? Y hembras?
  • Que pokemon tienen mas ataque que defensa, y viceversa?

Que aprendiste.

A arreglar datos de mis dataset, a lidiar con outliders, con NaN, hacer cambio de mis variables para poderlas manejar mas facilmente, etc.

Caracteristicas.

  • El proyecto se realizo en un notebook de jupyter labs.
  • Dentro del proyecto se van resolviendo dudas y escribiendo las observaciones conforme se avanzo en el proyecto.
  • Se puede interactuar con muchas de las graficas ya que se uso la libreria Plotly.
  • No deberia tener fallas de estilo en el codigo, ya que fue multiples veces revisado.

Participantes.

El proyecto se realizo de manera individual como parte final del curso de introduccion a la ciencia de datos de la academia mastermind, se avanzo muchas veces sin ayuda de las clases, aunque se apoyo otras veces en las clases para comparar y/o resolver dudas. El codigo fue escrito 100% por mi persona, no se copio codigo de los notebooks de las clases del curso, igualmente se dejan en una carpeta llamada 'Notebook del curso' todos los notebooks que aparecian para descarga, sientase libre de revisarlos.

Puedes utilizar Deepnote para trabajar interactivamente con los notebooks siguiendo el enlace de este botón:

Licencia.

Este proyecto es OpenSource, siente en libertad de copiarlo y mejorarlo tanto como deesees.