En esta materia realizarás la primera iteración de un proyecto de analítica de datos que constituirá la monografía de la especialización.
- Definir objetivo de negocio y de analítica de datos
- Definir métricas de negocio y analítica
- Identificar fuentes de datos y realizar adquisición inicial
- Establecer baseline de referencia (human level performance?)
- Carga inicial de datos y preprocesamiento
- Implementar un primer ciclo de analítca (i.e. modelo predictivo + métricas)
- Iterate 1-6 with increasing data, models, preprocessing, etc.
Inspecciona los contenidos del curso de Inteligencia Artificial para las Ciencias y las Ingenierías. Realiza los siguientes laboratorios:
- LAB 01.02 - Metrics
- LAB 03.01 - Model generation
- LAB 03.02 - Timeseries model
- LAB 05.01 - Predictions impact
- LAB 05.02 - Model evaluation
- REPRODUCIBILIDAD 25%: Notebooks publicados en un repositorio de github, ejecutables sin modificaciones desde Google Colab, cargando los datos desde Google Drive (instrucciones)
- CLARIDAD 25%: Los notebooks están bien organizados en la carpeta, contienen texto explicativo asociado al código, etc. Se entiende el flujo de trabajo realizado.
- COMPLECIÓN 25%: Se realizó un flujo de trabajo de analítica de datos completo, desde la carga de datos, hasta la construcción de métricas de desempeño de los modelos.
- INFORME 25%: El informe presenta la estructura indicada, la descripción es clara y las conclusiones son coherentes a los resultados obtenidos.
El objetivo no es necesariamente tener un desempeño competitivo, sino que el proceso realizado sea completo, claro, coherente y reproducible.
1.Conjunto de notebooks reproducibles PRIMERA ITERACIÓN
- Carpeta en drive, ejecutable en Google Colab
- Datos en drive accesibles desde los notebooks ejecutados en Google Colab
- Notebooks ejecutables
2. Informe borrador PRIMERA ITERACIÓN
- Descripción objetivos y métricas
- Descripción de fuentes de datos
- Descripción de baseline de referencia
- Objetivos y foco inicial para las siguientes iteraciones (segundo semestre)
1. Conjunto de notebooks reproducibles
- Carpeta en drive, ejecutable en Google Colab
- Datos en drive accesibles desde los notebooks ejecutados en Google Colab
- Notebooks for fase y por itearación
2. Informe de evaluación
- Descripción objetivos y métricas
- Descripción de fuentes de datos
- Descripción de baseline de referencia
- Descripción de procesos y modelos
- Reporte de métricas y resultados
- Evaluación e interpretación de resultados
- Análisis de impacto esperado en la organización y aspectos legales