NLP-Models-Tensorflow/language-detection at master · PajariPy/NLP-Models-Tensorflow

README.md

wget http://downloads.tatoeba.org/exports/sentences.tar.bz2
bunzip2 sentences.tar.bz2
tar xvf sentences.tar

awk -F"\t" '{print"__label__"$2" "$3}' < sentences.csv | shuf > all.txt