微软推出语音合成模型NaturalSpeech2，相对竞品语音重构更准确

IT之家 2023-07-27 16:53:53

【资料图】

IT之家 7 月 27 日消息，微软日前推出了一款名为 NaturalSpeech2 的语音模型，该模型采用“潜在扩散”式设计，在零样本语音合成层面效果出众，微软宣称该模型提供了“商业级”的语音 / 歌唱解决方案，能够给予用户高质量、多样化的语音合成体验。

微软对 NaturalSpeech2 进行了一系列演示，展示了其在零样本情况下生成具有不同说话人身份、韵律和风格（如唱歌）的语音的能力。

▲ 图源 NaturalSpeech 2 论文

据悉，与传统的语音转文字（TTS）系统不同，微软的 NaturalSpeech2 使用“连续向量”取代“离散标记”来表示语音，从而生成更完整的语音片段，不会产生“缺乏感情”的“棒读（一字一顿地讲话）”现象。

▲ 图源 NaturalSpeech 2 论文

实验结果表明，NaturalSpeech2 在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致，并且在 LibriTTS 和 VCTK 测试集上的自然度（以 CMOS 为度量）与真人语音难以区分。

关键词：

上一篇:2023年上半年工程机械产品进出口快报

下一篇:最后一页

微软推出语音合成模型NaturalSpeech2，相对竞品语音重构更准确

推荐阅读

微软推出语音合成模型NaturalSpeech2，相对竞品语音重构更准确

2023年上半年工程机械产品进出口快报

“书虫”爸爸

从百丽时尚和玛丝菲尔的实践，看如何利用数字零售弯道加速

黑盒测试和白盒测试的区别英语黑盒测试和白盒测试的区别

「穗安协作」加快心血管专科发展！广医五院与西秀区人民医院举行交流座谈会

朝鲜·韩国历史大事编年（关于朝鲜·韩国历史大事编年介绍）

精选

微软推出语音合成模型NaturalSpeech2，相对竞品语音重构更准确

2023年上半年工程机械产品进出口快报

“书虫”爸爸

从百丽时尚和玛丝菲尔的实践，看如何利用数字零售弯道加速

黑盒测试和白盒测试的区别英语黑盒测试和白盒测试的区别

「穗安协作」加快心血管专科发展！广医五院与西秀区人民医院举行交流座谈会

朝鲜·韩国历史大事编年（关于朝鲜·韩国历史大事编年介绍）

科技

数据

市场

快讯

大连将30个中风险地区调整为低风...

四川德格：非法猎杀濒危野生动物...

北京规划超270公里冬奥道路网 6...

民警剥开三角粽“秘密” 圆走失...

北京启动高速公路冬奥会专用车道...

运输

物流

微软推出语音合成模型NaturalSpeech2，相对竞品语音重构更准确

推荐阅读

微软推出语音合成模型NaturalSpeech2，相对竞品语音重构更准确

2023年上半年工程机械产品进出口快报

“书虫”爸爸

从百丽时尚和玛丝菲尔的实践，看如何利用数字零售弯道加速

黑盒测试和白盒测试的区别英语 黑盒测试和白盒测试的区别

「穗安协作」加快心血管专科发展！广医五院与西秀区人民医院举行交流座谈会

朝鲜·韩国历史大事编年（关于朝鲜·韩国历史大事编年介绍）

精选

微软推出语音合成模型NaturalSpeech2，相对竞品语音重构更准确

2023年上半年工程机械产品进出口快报

“书虫”爸爸

从百丽时尚和玛丝菲尔的实践，看如何利用数字零售弯道加速

黑盒测试和白盒测试的区别英语 黑盒测试和白盒测试的区别

「穗安协作」加快心血管专科发展！广医五院与西秀区人民医院举行交流座谈会

朝鲜·韩国历史大事编年（关于朝鲜·韩国历史大事编年介绍）

科技

数据

市场

快讯

大连将30个中风险地区调整为低风...

四川德格：非法猎杀濒危野生动物...

北京规划超270公里冬奥道路网 6...

民警剥开三角粽“秘密” 圆走失...

北京启动高速公路冬奥会专用车道...

运输

物流

黑盒测试和白盒测试的区别英语黑盒测试和白盒测试的区别

黑盒测试和白盒测试的区别英语黑盒测试和白盒测试的区别