Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

发音好用着也简单,什么时候能上中英混合发音就好了 #19

Open
ifreecoding opened this issue Aug 2, 2023 · 5 comments

Comments

@ifreecoding
Copy link

No description provided.

@huakunyang
Copy link
Owner

中英文混合需要有较高质量的中英文混合的数据用于模型的训练,现在没有这样的开源数据,所以比较难。需要同一个人的中英文混合的语音和标注数据,并且要达到一定的时长足够训练才行,否则若使用拼接的方式,韵律过渡会不自然。当然,我会进一步留意这样的数据集和思考新的方案,谢谢你的关注和使用。

@shen2009fei
Copy link

魔塔,貌似有这个数据,但是不确定。

@Leroy-X
Copy link

Leroy-X commented Aug 14, 2023

开发可不可以像百度一样,用户只需要提供一百句语音文件,就可以训练出模型。做一个批处理,让用户自己做模型。这样版权问题就可以分割开来,先让软件发展起来,快速吸引用户群

@engineer1109
Copy link

还差中英混合就完美了

@huakunyang
Copy link
Owner

开发可不可以像百度一样,用户只需要提供一百句语音文件,就可以训练出模型。做一个批处理,让用户自己做模型。这样版权问题就可以分割开来,先让软件发展起来,快速吸引用户群

这样作是可行的,不过算法和代码的改动要大一点,后面考虑作吧。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants