Skip to content

A list of awesome public datasets for projects, divided into heuristic and actionable datasets

License

Notifications You must be signed in to change notification settings

tom-prokop/datasets-geniales

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

Datasets Geniales

Una lista de interesantes conjuntos de datos públicos para proyectos, divididos en conjuntos de datos heurísticos y procesables.

Heurístico vs. Factible

Heurístico

Un conjunto de datos heurístico es aquel cuya finalidad es exclusivamente desarrollar la competencia técnica. Estos conjuntos de datos suelen caracterizarse por su complejidad y desorden, y ofrecen a los alumnos la oportunidad de practicar la limpieza, transformación y manipulación de datos. Son muy valiosos para el aprendizaje práctico, ya que ayudan a desarrollar las habilidades necesarias para preparar y procesar datos para su análisis, que es una parte fundamental del ciclo de vida de los datos.

Factible

Este término es ideal para los conjuntos de datos utilizados en el análisis y la toma de decisiones. Un conjunto de datos procesable es aquel que está preparado para el análisis, con datos claros, relevantes y fiables. Está estructurado y formateado de tal manera que está listo para ser utilizado en herramientas de inteligencia empresarial, análisis estadísticos o modelos de aprendizaje automático. La clave aquí es que el conjunto de datos informe directamente los procesos de toma de decisiones, impulsando acciones que repercutan en los resultados empresariales, las decisiones políticas o la investigación científica. Un conjunto de datos procesable puede necesitar algún tipo de formateo, modelado o limpieza, pero lo ideal es que se pueda utilizar para visualizaciones, ML, análisis estadísticos u otras aplicaciones.

Archivos de datos públicos

Agencias gubernamentales

Agregadores de conjuntos de datos

Conjuntos de datos heurísticos

Limpieza y preprocesamiento de datos

Modelado de Datos

Gestión de Bases de Datos

Análisis de Series Temporales

Visualización de Datos

Tratamiento de Big Data

ETL

Streaming de Datos

Integración y Gestión de APIs

Seguridad y Gobernanza de Datos

Machine Learning

Análisis Estadístico

Conjuntos de datos útiles

Comercio electrónico

Retail

Sanidad

Marketing

Finanzas

Manufacturing

Education

Real Estate

Transporte y Logística

Turismo

About

A list of awesome public datasets for projects, divided into heuristic and actionable datasets

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published