Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

训练效果和公开模型差异问题 #24

Open
lflyme opened this issue Jul 19, 2024 · 4 comments
Open

训练效果和公开模型差异问题 #24

lflyme opened this issue Jul 19, 2024 · 4 comments

Comments

@lflyme
Copy link

lflyme commented Jul 19, 2024

你好,非常感谢你开源的模型,模型里面借鉴的东西也很多!在复现你的模型,除了训练数据制作方面有些差异外,其他都一样,但是出来的效果和你公开模型跑出来效果差异还挺大的,请问数据合成这块脚本可否提供借鉴,非常感谢!邮箱:[email protected]

@Xiaobin-Rong
Copy link
Owner

Xiaobin-Rong commented Jul 21, 2024

数据合成的脚本没有什么特别的地方,如果想要达到比较好的泛化性的话,需要使用比较大的数据量,这个比较关键。另外 batch size 以及 每条样本的长度 对训练效果也有一定影响,我一般使用小batch(例如4、8)以及使用较长的音频片段(例如 8 s)来训练。希望对你有借鉴作用。

@lflyme
Copy link
Author

lflyme commented Jul 22, 2024

非常感谢您的耐心解答,我再摸索摸索!

@hulucky1102
Copy link

作者你好,请问是对所有人声数据添加混响,还是设置了比例,若存在一个比例,是否方便告知

@Xiaobin-Rong
Copy link
Owner

@hulucky1102 对所有人声数据都添加了混响

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants