- Elvira García
- Alfonso Martínez
- Andrés Vasco
Pleno parlamentario ==> Pleno en txt
-
document.pdf ==> text.txt
-
document1.pdf ==> text1.txt
-
document2.pdf ==> text2.txt
-
document3.pdf ==> text3.txt
-
sumtext.txt = text.txt+text1.txt+text2.txt+text3.txt
2 Notebooks: - análisis_parlamento.ipynb - clasificador_parlamento.ipynb
La versión de Python utilizada es la 3.6
Todos los requisitos para ejecutar el cuaderno están en requirements.txt
Para instalarlos, ejecutar el comando pip install -r requirements.txt
Después ejecutar python -m spacy download es_core_news_md
Y finalmente en la consola de python ejecutar
import nltk
nltk.download('stopwords')
nltk.download('punkt')
Para ejecutar los cuadernos es necesaria la instalación previa de jupyter notebooks.