训练效果和公开模型差异问题 #24

lflyme · 2024-07-19T01:40:50Z

你好，非常感谢你开源的模型，模型里面借鉴的东西也很多！在复现你的模型，除了训练数据制作方面有些差异外，其他都一样，但是出来的效果和你公开模型跑出来效果差异还挺大的，请问数据合成这块脚本可否提供借鉴，非常感谢！邮箱：[email protected]

Xiaobin-Rong · 2024-07-21T06:58:19Z

数据合成的脚本没有什么特别的地方，如果想要达到比较好的泛化性的话，需要使用比较大的数据量，这个比较关键。另外 batch size 以及每条样本的长度对训练效果也有一定影响，我一般使用小batch（例如4、8）以及使用较长的音频片段（例如 8 s）来训练。希望对你有借鉴作用。

lflyme · 2024-07-22T03:34:41Z

非常感谢您的耐心解答，我再摸索摸索！

hulucky1102 · 2024-08-09T09:14:29Z

作者你好，请问是对所有人声数据添加混响，还是设置了比例，若存在一个比例，是否方便告知

Xiaobin-Rong · 2024-08-09T11:13:10Z

@hulucky1102 对所有人声数据都添加了混响

Provide feedback