您当前的位置: 首页 > 热点 > > 内容页

微软推出NaturalSpeech2语音模型:零样本生成唱歌唱歌

来源:中关村在线 2023-07-28 15:17:47
x


(资料图片)

微软近日推出了一款名为NaturalSpeech2的语音模型,该模型采用“潜在扩散”式设计,其在零样本语音合成层面的效果显著。微软表示,该模型提供了“商业级”的语音/歌唱解决方案,能够为用户提供高质量、多样化的语音合成体验。 微软对NaturalSpeech2进行了一系列演示,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格(如唱歌)的语音的能力。与传统的语音转文字(TTS)系统不同,NaturalSpeech2使用“连续向量”取代“离散标记”来表示语音,从而生成更完整的语音片段,不会产生“缺乏感情”的“棒读(一字一顿地讲话)”现象。 实验结果显示,NaturalSpeech2在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在LibriTTS和VCTK测试集上的自然度(以CMOS为度量)与真人语音难以区分。该项目的论文已经发布,感兴趣的人可以查阅。

上一篇 下一篇
x
推荐阅读 更多
微软推出NaturalSpeech2语音模型:零样本生成唱歌唱歌

微软近日推出了一款名为NaturalSpeech2的语音模型,该模型采用“潜在扩

中关村在线 2023-07-28
主人抓了个知了给金毛玩,没想到它一口就给吃掉了!狗:嘎嘣脆!

夏天到了,大家能听到最多的声音,估计就是在树上的知了吧!小时候

个人图书馆-萌宠治愈师 2023-07-28
Python:被忽视的核心功能

【编者按】这篇文章主要介绍了一些在Python编程中可能被忽视的核心功能

CSDN 2023-07-28
小米手机改密码在哪里

怎么修改小米手机账号的密码1 解锁手机后,找到桌面上的【设置】图标,

互联网 2023-07-28
猫咪品种之谜:有没有一种品种可以不掉毛?

尊敬的读者们,大家好!今天我们来聊聊一个备受关注的话题——猫咪品种

哔哩哔哩 2023-07-28
六公主报道黄牛倒卖演唱会门票:3种票源 很难根治

六公主报道黄牛倒卖演唱会门票:3种票源很难根治

快科技 2023-07-28
【光明时评】在成都大运会乐享绿色低碳时光

第三十一届世界大学生夏季运动会开幕式28日晚在四川成都举行。除了精彩

光明日报 2023-07-28
孩子在学校摔骨折怎样走保险?需要哪些材料?

当孩子在学校摔骨折时,家长首先要做的是及时将孩子送往医院进行治疗。

马蜂保 2023-07-28
佰维存储科技推出UFS 3.1高速闪存:写入速度翻倍,读取更快!

【ITBEAR科技资讯】7月28日消息,深圳佰维存储科技股份有限公司宣布推

ITBEAR 2023-07-28
房贷利率从4.25转为3.8如何转?看完你就明白了

对于房贷一族而言,最关心的自然是利率变化了,毕竟利率高低关乎着自己

互联网 2023-07-28