Free Resources Available at FalaBrasils 🦊 GitLab 🦊 Account

🦊 We have moved to GitLab: https://gitlab.com/falabrasil 🦊

🇧🇷 Versão em Português Brasiliro disponível em README.md 🇧🇷

Summary

GitLab Group Tree
Audio Corpora
Text Corpora
Automatic Speech Recognition
Speech Synthesis
Natural Language Processing

Árvore de Grupos do GitLab

📂 🌎 fb-text-corpora/
📂 🌎 fb-apps/
📂 🌎 fb-tts/
📂 🌎 fb-asr/
- 📂 🌍 fb-lm-tutorial/
- 📂 🌍 fb-asr-resources/
- 📂 🌍 fb-am-tutorial/
📂 🌎 fb-nlp/
📂 🌎 fb-audio-corpora/

🌳 🌎 Text Corpora
🌳 🌎 Speech Applications
🌳 🌎 Speech Synthesis
🌳 🌎 Automatic Speech Recognition
- 🍃 🌍 Recursos prontos para ASR
- 🍃 🌍 Tutorials for training language models
- 🍃 🌍 Tutorials for training acoustic models
🌳 🌎 Natural Language Processing
🌳 🌎 Audio Corpora

Audio Corpora

Localização: https://gitlab.com/fb-audio-corpora

Federal constitution

Localização: https://gitlab.com/fb-audio-corpora/constituicao16k

Corpus de voz da Constituição Federal. Os arquivos de áudio foram reamostrados para 16.000 Hz com 16 bits. Em seguida, os arquivos foram segmentados em arquivos menores, com aproximadamente 30 segundos de duração cada, e por fim transcritos. Atualmente, o corpus é composto por um único locutor do sexo masculino. Os arquivos totalizam aproximadamente 9 horas de áudio. O ambiente de gravação utilizado é bastante controlado.

Código de defesa do consumidor

Localização: https://gitlab.com/fb-audio-corpora/codigodefesaconsumidor16k

Laps mail

Localização: https://gitlab.com/fb-audio-corpora/lapsmail16k

Corpus de voz que representa o contexto de uma aplicação de correio eletrônico, utilizado para a avaliação de sistemas LVCSR para tarefas de comando e controle. Atualmente, composto por 86 sentenças (43 comando e 43 nomes próprios) gravados por 25 voluntários (21 homens e 4 mulheres), o que corresponde a 84 minutos minutos de áudio com um vocabulário de 95 palavras. As gravações foram realizadas com um microfone de alta qualidade (Shure PG30) em um ambiente de gravação não controlado.

Laps benchmark

Localização: https://gitlab.com/fb-audio-corpora/lapsbm16k

Corpus de voz utilizado para avaliação de desempenho de sistemas LVCSR. Atualmente composto por 700 frases, o corpus possui 35 locutores com 20 frases cada, sendo 25 homens e 10 mulheres, o que corresponde a aproximadamente 54 minutos de áudio. Este corpus será expandido de forma a ter 50 locutores com a mesma distribuição, totalizando 1.000 frases. Todas as gravações foram realizadas em computadores utilizando microfones comuns. A taxa de amostragem utilizada foi de 16.000 Hz e cada amostra foi representada com 16 bits. O ambiente não foi controlado, existindo a presença de ruído nas gravações, com isso busca-se caracterizar ambientes onde software de reconhecimento de voz são utilizados.

Text Corpora

Localização: https://gitlab.com/fb-text-corpora

Automatic Speech Recognition

Localização: https://gitlab.com/fb-asr

Recursos prontos

Localização: https://gitlab.com/fb-asr/fb-asr-resources

CMU Sphinx: https://gitlab.com/fb-asr/fb-asr-resources/cmusphinx-resources
Kaldi: https://gitlab.com/fb-asr/fb-asr-resources/kaldi-resources
HTK: https://gitlab.com/fb-asr/fb-asr-resources/htk-resources
DeepSpeech: https://gitlab.com/fb-asr/fb-asr-resources/deepspeech-resources

Tutorials for training acoustic models

Localização: https://gitlab.com/fb-asr/fb-am-tutorial

CMU Sphinx: https://gitlab.com/fb-asr/fb-am-tutorial/cmusphinx-am-train
Kaldi: https://gitlab.com/fb-asr/fb-am-tutorial/kaldi-am-train
HTK: https://gitlab.com/fb-asr/fb-am-tutorial/htk-am-train
DeepSpeech: https://gitlab.com/fb-asr/fb-am-tutorial/deepspeech-am-train

Tutorials for training language models

Localização: https://gitlab.com/fb-asr/fb-lm-tutorial

HTK: https://gitlab.com/fb-asr/fb-lm-tutorial/htk-lm-train
SRILM: https://gitlab.com/fb-asr/fb-lm-tutorial/srilm-lm-train

Speech Synthesis

Localização: https://gitlab.com/fb-tts

Natural Language Processing

Localização: https://gitlab.com/fb-nlp

Software gerador de recursos: https://gitlab.com/fb-nlp/nlp-generator
- G2P: conversor grafema-fonema
- Syll: separador silábico
- Stress: identificador de vogal tônica
- HH: desambiguador de homófonos-heterófonos ⚠️
Recursos prontos ⚠️ : https://gitlab.com/fb-nlp/nlp-resources
- Lista de Palavras?
- Dicionários Fonéticos (seed lexicon)
- Dicionário de separação silábica

Up 🔝

FalaBrasil Group (2019)
Federal University of Pará (UFPA)
Cassio Batista - cassio.batista.13@gmail.com

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.en.md

README.en.md

Free Resources Available at FalaBrasils 🦊 GitLab 🦊 Account

Summary

Árvore de Grupos do GitLab

Audio Corpora

Federal constitution

Código de defesa do consumidor

Laps mail

Laps benchmark

Text Corpora

Automatic Speech Recognition

Recursos prontos

Tutorials for training acoustic models

Tutorials for training language models

Speech Synthesis

Natural Language Processing

Files

README.en.md

Latest commit

History

README.en.md

File metadata and controls

Free Resources Available at FalaBrasils 🦊 GitLab 🦊 Account

Summary

Árvore de Grupos do GitLab

Audio Corpora

Federal constitution

Código de defesa do consumidor

Laps mail

Laps benchmark

Text Corpora

Automatic Speech Recognition

Recursos prontos

Tutorials for training acoustic models

Tutorials for training language models

Speech Synthesis

Natural Language Processing