- Evaluar los Datos: Realizar un análisis exploratorio y descriptivo para comprender ciertas características y patrones en el conjunto de datos y algunas caracteristicas del perfil del cliente.
- Modelado Predictivo: Evaluar una serie de modelos de clasificación para predecir la columna 21, que indica si un cliente se suscribe al servicio correspondiente. Seleccionar el modelo que proporcione los mejores resultados en términos de precisión y eficacia.
Analisis_sistema_educativo_Argentina/
│
├── data/ # Datasets
│ ├── bronze/ # Datos brutos
│ ├── silver/ # Datos limpios y transformados para ML y EDA
│ └── gold/ # Datos listos para visualización de datos
│
├── models/ # Mejores modelo para predecir la variable target
│
└── notebooks and scripts # cuadernos con las diferentes etapas de crisp-dm
├── 1_adquisicion_comprension_datos.ipynb
├── 2_procesamiento.ipynb
├── 3_eda_bi.ipynb
└── 4_ml.ipynb
- Python
- Bibliotecas para análisis de datos:
- NumPy
- pandas
- missingno
- Bibliotecas para visualización de datos:
- Seaborn
- Plotly
- Bibliotecas para aprendizaje automático:
- scikit-learn
- joblib
- Bibliotecas para gestion de directorios y archivos
- os
- zipfile
- Bibliotecas para web-scraping
- lxml
- requests
- Bibliotecas para análisis de datos:
- Finalizado