Skip to content

Fine tuning of the base model from OpenAI Whisper in Russian language on the dataset Sber-golos

Notifications You must be signed in to change notification settings

sovse/base_rus_whisper_stt

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 

Repository files navigation

base_rus_whisper_stt

Fine tuning of the base model from OpenAI Whisper in Russian language on the dataset Sber-golos

До обученная модель распознавания речи " base " от https://github.com/openai/whisper под русский язык на данных сбер-голса из этой статьи https://habr.com/ru/company/sberdevices/blog/559496/. Fine tuning модели длился 10 эпох.

До обученная модель можно скачать по адресу https://disk.yandex.ru/d/ogeKhA-PfNpf9w - файл base_ru.pt . Она имеет размер 290,5 МБ , 71М параметров.

Точность модели на тесте Сбер-голос Farfield wer=20.96% ( для сравнения , точность стандартной "base" модели от whisper на этом тесте имеет wer=73.45%). Hо новая модель забыла пунктуацию.

Пример использования , можно посмотреть в ноутбуке asr_inferens.ipynb

About

Fine tuning of the base model from OpenAI Whisper in Russian language on the dataset Sber-golos

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published