Projeto de mineração de dados em Notas Fiscais Eletrônicas (NFE)
Conda 4.11.0 or latest Docker 20.10.14 or latest
In terminal, type:
./setup.sh
The above script will setup a conda environment to run scripts and also build a docker image to run fastText.
conda activate egov
- RUN
pre_processamento/pre_proc_anvisa.ipynb
- RUN
pre_processamento/pre_proc_medicamentos.ipynb
- RUN
data_augmentation/medicamentos_augmentation.sh
- RUN
data_augmentation/anvisa_prod_augmentation.sh
- RUN
data_augmentation/anvisa_pa_augmentation.sh
- MOVE
datasets/medicamentos/medicamentos_aumentado.csv
TOdatasets/medicamentos/augmented/medicamentos_aumentado.csv
- MOVE
datasets/avisa/anvisa_principio_ativo_aumentado.csv
TOdatasets/anvisa/augmented/anvisa_principio_ativo_aumentado.csv
- MOVE
datasets/avisa/anvisa_produto_aumentado.csv
TOdatasets/anvisa/augmented/anvisa_produto_aumentado.csv
- RUN
pre_processamento/pre_proc_anvisa_augmented.ipynb
- RUN
pre_processamento/pre_proc_medicamentos_augmented.ipynb
- RUN
ean_key_map_builder
(not implemented) - RUN
pre_processamento/mapeamento_ean_chave.ipynb
- RUN
oversampling/oversampling.py
- RUN
training/train_test_split.py
docker run --rm -it -v $PWD:/home fasttext /bin/bash
fasttext supervised -input datasets/data.train.txt -output model/model
fasttext test model/model.bin datasets/data.test.txt
The output of test will be displayed similar as below, where P@1
and R@1
are Precision
and Recall
values respectively.
N 734
P@1 0.00681
R@1 0.00681
fasttext predict model/model.bin datasets/data.test.txt
In fastText docker container prompt, type:
exit
To deactivate conda environment, type:
conda deactivate