Free Resources Available at FalaBrasils 🦊 GitLab 🦊 Account
🦊 We have moved to GitLab: https://gitlab.com/falabrasil 🦊
🇧🇷 Versão em Português Brasiliro disponível em README.md 🇧🇷
- GitLab Group Tree
- Audio Corpora
- Text Corpora
- Automatic Speech Recognition
- Speech Synthesis
- Natural Language Processing
Localização: https://gitlab.com/fb-audio-corpora
Localização: https://gitlab.com/fb-audio-corpora/constituicao16k
Corpus de voz da Constituição Federal. Os arquivos de áudio foram reamostrados para 16.000 Hz com 16 bits. Em seguida, os arquivos foram segmentados em arquivos menores, com aproximadamente 30 segundos de duração cada, e por fim transcritos. Atualmente, o corpus é composto por um único locutor do sexo masculino. Os arquivos totalizam aproximadamente 9 horas de áudio. O ambiente de gravação utilizado é bastante controlado.
Localização: https://gitlab.com/fb-audio-corpora/codigodefesaconsumidor16k
Localização: https://gitlab.com/fb-audio-corpora/lapsmail16k
Corpus de voz que representa o contexto de uma aplicação de correio eletrônico, utilizado para a avaliação de sistemas LVCSR para tarefas de comando e controle. Atualmente, composto por 86 sentenças (43 comando e 43 nomes próprios) gravados por 25 voluntários (21 homens e 4 mulheres), o que corresponde a 84 minutos minutos de áudio com um vocabulário de 95 palavras. As gravações foram realizadas com um microfone de alta qualidade (Shure PG30) em um ambiente de gravação não controlado.
Localização: https://gitlab.com/fb-audio-corpora/lapsbm16k
Corpus de voz utilizado para avaliação de desempenho de sistemas LVCSR. Atualmente composto por 700 frases, o corpus possui 35 locutores com 20 frases cada, sendo 25 homens e 10 mulheres, o que corresponde a aproximadamente 54 minutos de áudio. Este corpus será expandido de forma a ter 50 locutores com a mesma distribuição, totalizando 1.000 frases. Todas as gravações foram realizadas em computadores utilizando microfones comuns. A taxa de amostragem utilizada foi de 16.000 Hz e cada amostra foi representada com 16 bits. O ambiente não foi controlado, existindo a presença de ruído nas gravações, com isso busca-se caracterizar ambientes onde software de reconhecimento de voz são utilizados.
Localização: https://gitlab.com/fb-text-corpora
Localização: https://gitlab.com/fb-asr
Localização: https://gitlab.com/fb-asr/fb-asr-resources
- CMU Sphinx: https://gitlab.com/fb-asr/fb-asr-resources/cmusphinx-resources
- Kaldi: https://gitlab.com/fb-asr/fb-asr-resources/kaldi-resources
- HTK: https://gitlab.com/fb-asr/fb-asr-resources/htk-resources
- DeepSpeech: https://gitlab.com/fb-asr/fb-asr-resources/deepspeech-resources
Localização: https://gitlab.com/fb-asr/fb-am-tutorial
- CMU Sphinx: https://gitlab.com/fb-asr/fb-am-tutorial/cmusphinx-am-train
- Kaldi: https://gitlab.com/fb-asr/fb-am-tutorial/kaldi-am-train
- HTK: https://gitlab.com/fb-asr/fb-am-tutorial/htk-am-train
- DeepSpeech: https://gitlab.com/fb-asr/fb-am-tutorial/deepspeech-am-train
Localização: https://gitlab.com/fb-asr/fb-lm-tutorial
- HTK: https://gitlab.com/fb-asr/fb-lm-tutorial/htk-lm-train
- SRILM: https://gitlab.com/fb-asr/fb-lm-tutorial/srilm-lm-train
Localização: https://gitlab.com/fb-tts
Localização: https://gitlab.com/fb-nlp
- Software gerador de recursos: https://gitlab.com/fb-nlp/nlp-generator
- G2P: conversor grafema-fonema
- Syll: separador silábico
- Stress: identificador de vogal tônica
- HH: desambiguador de homófonos-heterófonos
⚠️
- Recursos prontos
⚠️ : https://gitlab.com/fb-nlp/nlp-resources- Lista de Palavras?
- Dicionários Fonéticos (seed lexicon)
- Dicionário de separação silábica
FalaBrasil Group (2019)
Federal University of Pará (UFPA)
Cassio Batista - [email protected]