Contenuto
Il seguente progetto è stato fatto con lo scopo di avere una vista generale sulle notizie principali della giornata. Partendo dai testi dei tweets delle principali testate giornalistiche italiane, l'obiettivo è quello di ottenere un ranking delle parole più frequenti nei diversi tweets che identificano le notizie più importanti della giornata.
I testi dei tweets vengono prima ripuliti e poi viene utilizzata la funzione TF-IDF per decretare l'importanza dei token contenuti nei tweets.
Keywords: twitter, TF-IDF, Lemmatization, StopWord, WordCloud, Python
Marzorati Stefano
