Skip to content
This repository has been archived by the owner on Mar 1, 2023. It is now read-only.

Latest commit

 

History

History
152 lines (130 loc) · 7.56 KB

README.en.md

File metadata and controls

152 lines (130 loc) · 7.56 KB

Free Resources Available at FalaBrasils 🦊 GitLab 🦊 Account

🦊 We have moved to GitLab: https://gitlab.com/falabrasil 🦊

🇧🇷 Versão em Português Brasiliro disponível em README.md 🇧🇷

Summary

Árvore de Grupos do GitLab

  • 📂 🌎 fb-text-corpora/
  • 📂 🌎 fb-apps/
  • 📂 🌎 fb-tts/
  • 📂 🌎 fb-asr/
    • 📂 🌍 fb-lm-tutorial/
    • 📂 🌍 fb-asr-resources/
    • 📂 🌍 fb-am-tutorial/
  • 📂 🌎 fb-nlp/
  • 📂 🌎 fb-audio-corpora/
  • 🌳 🌎 Text Corpora
  • 🌳 🌎 Speech Applications
  • 🌳 🌎 Speech Synthesis
  • 🌳 🌎 Automatic Speech Recognition
    • 🍃 🌍 Recursos prontos para ASR
    • 🍃 🌍 Tutorials for training language models
    • 🍃 🌍 Tutorials for training acoustic models
  • 🌳 🌎 Natural Language Processing
  • 🌳 🌎 Audio Corpora

Audio Corpora

Localização: https://gitlab.com/fb-audio-corpora

Federal constitution

Localização: https://gitlab.com/fb-audio-corpora/constituicao16k

Corpus de voz da Constituição Federal. Os arquivos de áudio foram reamostrados para 16.000 Hz com 16 bits. Em seguida, os arquivos foram segmentados em arquivos menores, com aproximadamente 30 segundos de duração cada, e por fim transcritos. Atualmente, o corpus é composto por um único locutor do sexo masculino. Os arquivos totalizam aproximadamente 9 horas de áudio. O ambiente de gravação utilizado é bastante controlado.

Código de defesa do consumidor

Localização: https://gitlab.com/fb-audio-corpora/codigodefesaconsumidor16k

Laps mail

Localização: https://gitlab.com/fb-audio-corpora/lapsmail16k

Corpus de voz que representa o contexto de uma aplicação de correio eletrônico, utilizado para a avaliação de sistemas LVCSR para tarefas de comando e controle. Atualmente, composto por 86 sentenças (43 comando e 43 nomes próprios) gravados por 25 voluntários (21 homens e 4 mulheres), o que corresponde a 84 minutos minutos de áudio com um vocabulário de 95 palavras. As gravações foram realizadas com um microfone de alta qualidade (Shure PG30) em um ambiente de gravação não controlado.

Laps benchmark

Localização: https://gitlab.com/fb-audio-corpora/lapsbm16k

Corpus de voz utilizado para avaliação de desempenho de sistemas LVCSR. Atualmente composto por 700 frases, o corpus possui 35 locutores com 20 frases cada, sendo 25 homens e 10 mulheres, o que corresponde a aproximadamente 54 minutos de áudio. Este corpus será expandido de forma a ter 50 locutores com a mesma distribuição, totalizando 1.000 frases. Todas as gravações foram realizadas em computadores utilizando microfones comuns. A taxa de amostragem utilizada foi de 16.000 Hz e cada amostra foi representada com 16 bits. O ambiente não foi controlado, existindo a presença de ruído nas gravações, com isso busca-se caracterizar ambientes onde software de reconhecimento de voz são utilizados.

Text Corpora

Localização: https://gitlab.com/fb-text-corpora

Automatic Speech Recognition

Localização: https://gitlab.com/fb-asr

Recursos prontos

Localização: https://gitlab.com/fb-asr/fb-asr-resources

Tutorials for training acoustic models

Localização: https://gitlab.com/fb-asr/fb-am-tutorial

Tutorials for training language models

Localização: https://gitlab.com/fb-asr/fb-lm-tutorial

Speech Synthesis

Localização: https://gitlab.com/fb-tts

Natural Language Processing

Localização: https://gitlab.com/fb-nlp

Up 🔝

FalaBrasil Group (2019)
Federal University of Pará (UFPA)
Cassio Batista - [email protected]