Skip to content

TeachingTextMining/TextClassification

Repository files navigation

TextClassification

Repositorio de cuadernos Jupyter Notebook para mostrar diferentes casos de Máquinas de Aprendizaje de cómo tratar el problema de Clasificación Textual. Siguiendo la enumeración 01 hasta 06, los cuadernos muestran una evolución en la complejidad al tratar el problema, y finalmente la simplificación de esta con el uso de AutoML.

  • 01-SA-Pipeline: Describe la construcción, entrenamiento y aplicación de predicción, por etapas, de un pipeline utilizando algoritmos tradicionales como SVM, Arboles de Decisión, y Regresión Lineal.
  • 02-SA-Transformers-Basic: Introduce el uso de la librería Transfomers en particular el uso de modelos listos para ser utilizados.
  • 03-SA-Transformers-Training-FineTuning: Describe, con la librería Transformers, cómo realizar un reentrenamiento de modelos pre-entrenados para ajustarlos a un problema concreto.
  • 04-SA-Transformers-Training-Custom: Describe, con la librería Transformers, cómo extraer características de un modelo Trasformer y de otras técnicas complementarias. Este vector personalizado de características servirá para reentrenar el modelo Transformers.
  • 05-SA-Ensemble: Describe, con la librería Transformers y Sklearn, cómo crear un meta-algoritmo que tome decisiones entre las propuestas de clasificación de varios clasificadores.
  • 06-SA-AutoGOAL: Describe, con la librería AutoGOAL de autoML, cómo crear un buscador de Pipeline optimizados para un problema de clasificación textual. Se proporcionan dos variantes: 1) extrayendo manualmente las características que alimentan al Pipeline; 2) Alimentar al Pipeline con texto plano y la elección de pre-procesamiento de datos la elige el sistema.

Contacts:

Yoan Gutiérrez <ygutierrez[📧]dlsi.ua.es>

José Ignacio Abreu Salas <ji.abreu[📧]ua.es>

License

MIT License

How to cite

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published