Responsable: Matthieu Vernier, [email protected]
Curso obligatorio de la carrera de Ingeniería Civil en Informática (UACh) y material de nivelación para el Magíster en Informática. Se recomienda mantener una copia local del material del curso clonando este repositorio.
La asignatura de Taller de Base de Datos tiene como principal propósito que los estudiantes integren técnicas de procesamiento de datos no estructurados con técnicas de Machine Learning, utilizando librerías de tratamiento automático del lenguaje, de visión artificial y Machine Learning y describiendo las características principales de los algorítmos utilizadas por estas librerías.
-
Unidad 1: Talleres de resolución de problemas de clasificación automática
- Introducción a Regresión Lineal y Regresión Logística: [Notebook 1]:
- ¿Cómo estimar los paramétros de los modelos de Regresión Lineal y Logística?: [Slides], [Notebook 2-a], [Notebook 2-b]:
- Introducción a algorítmos de árboles de decisión: [Notebook 3-a], [Notebook 3-b]
- Introducción a algoritmos de clustering (KMeans): [Notebook 4]
- Técnicas de Ensemble Learning
- Otros datasets para experimentar:
-
Unidad 2: Talleres de análisis de datos textuales
-
Unidad 3: Talleres de análisis de imágenes
- Srinivasa-Desikan B., (2018). Natural Language Processing and Computational Linguistics: A practical guide to text analysis with Python, Gensim, spaCy and Keras. Packt Publishing.
- Garrido G., Joshi P., (2018). OpenCV 3.x with Python by Example Packt Publishing.
- Lenguaje: Python3
- Ambiente: IPython, Jupyter
- Librerías: Numpy, Pandas, Scipy, Scikit-learn, Matplotlib, bokeh, spaCy, gensim, openCV,
- Slack: https://escueladeinformatica.slack.com Canal #268
- Programa del curso