Skip to content
/ MPEI-2024 Public

Categorization of news descriptions, and finding similar news in a big dataset

License

Notifications You must be signed in to change notification settings

IX-0/MPEI-2024

Repository files navigation

MPEI-2024

Antes de começar a executar o programa é preciso fazer uma filtragem no ficheiro json e transforma-lo em csv para tal é necessário correr o ficheiro py dataset.py que se encontra na pasta data

Para correr o programa main é só executar a script de matlab

Caso ainda não tenha sido feito o treino do naive bayes, bf e minhash estes devem ser executados com as scripts naivebayes.m bloomfilter.m e minhash.m respetivamente e por esta ordem

Os testes e os scripts devem ser todos corrido a partir da raiz do repositório

About

Categorization of news descriptions, and finding similar news in a big dataset

Resources

License

Stars

Watchers

Forks