issues

常见问题

模型编译成功，但是一训练就报错，提示InvalidArgumentError

首先请检查数据的输入格式，尤其是使用有自己生成的数据文件时，一切格式以仓库中 datalist/ 目录下的文件格式和根目录下的 dict.txt 文件的格式为准。

参考issue
模型编译成功，但是一训练就报错，提示OSError: Unable to open file，No such file or directory

请检查是不是 ms.LoadModel() 中指定的加载保存好的模型文件名路径不存在，当这个文件不存在时会触发错误。还需要注意一下python在windows系统和linux系统上文件路径字符串在表示上的区别，是用'/'还是'\\'等，以及，linux系统对文件路径区分大小写，也就是说A11_183.WAV和A11_183.wav是不一样的，但是在Windows系统下，这两个却是指向一样的文件，所以，应该避免同一个字母不同大小写的文件名。

参考issue 参考issue
一运行就提示cannot import module xxx / ModuleNotFoundError: No module named xxx

请检查python依赖库是否全部安装成功，如果存在没有安装成功的库，请手动安装。

.

训练一个批次之后出现报错

请检查保存模型的路径是否存在，是否有model_speech这个目录，或者，如果代码中保存模型的路径还包含了“m22”“m24”“m25”等文本，请检查这个目录下是否有对应文本的目录路径名称，比如，是否有model_speech/m22这个路径。

.

训练过程中突然出错，找不到某wav文件，提示FileNotFoundError: [Errno 2] No such file or directory

请确保文件列表和数据标签与数据集中的wav文件名和存储路径相对应，如果用到了自己生成的文件，请务必保证这一点。

参考issue
程序一运行就提示“xxx程序已停止工作”或者“非法指令(核心已转储)”

这应该是tensorflow和CPU的锅，tf默认编译的是通用指令集，在大部分计算机上都可以正常运行，但是唯独当前的CPU连这种通用指令集都不支持，所以解决办法就是自己手动编译一个tensorflow吧。或者也可以直接使用GPU版的tensorflow试试，前提是要有Nvidia的GPU。

语音模型直接识别出来的是汉语拼音，能不能转为汉字

语音模型是使用汉语拼音作为模型的输出的，如果需要转为汉字，还需要语言模型，仓库中的 LanguageModel.py 就是用来做这件事的，可以实现从拼音转为汉字。test.py文件包含了这整个一套的过程，可以实现从wav声音文件或序列，到最终的汉字。
自己电脑比较渣，在哪里可以下载作者已经训练好的模型

本项目已经预发布了若干个版本的完整软件，可以在Github本仓库下release里面的发布的软件的压缩包ASRT_vxx.xx.zip里获得完整源程序，包含有已经训练好的模型，每个版本具体使用到的模型都有说明，发布的版本基本上有着不错的语音识别字准确率。

对机器学习等方面有兴趣的欢迎来我的博客逛一逛：

AI柠檬一个科技爱好者的个人博客

也欢迎加入作者的技术博客交流QQ群：894112051