互联网资讯 / 人工智能 · 2023年12月1日 0

开发自定义神经语音技术,实现逼真语音合成

3月4日,微软官方宣布,AzuRe 认知服务中的一部分——自定义神经语音(Custom Neural Voice)——的文本到语音(TTS)功能已全面推出。这项技术利用微软先进的神经文本到语音模型,帮助用户制作高度逼真、接近人类的个性化语音。由于生成的语音质量极高,微软对访问权限进行了限制,以确保技术的负责任使用。

微软表示,

“作为我们对负责任人工智能的承诺的一部分,自定义神经语音的设计和发布旨在保护个人隐私和社会权益,促进透明且自然的人机交流,同时防止深度伪造和误导性内容的传播。因此,我们对该技术的访问和使用进行了严格限制。”

创建专属语音非常简便,只需录制一段音频并上传作为训练数据,AzuRe 语音服务便会为你生成一个独特的语音模型。自定义神经语音不仅逼真自然,还能代表品牌,为用户提供流畅、自然的交互体验。

微软强调,目前已有多家客户在使用这项最新的语音技术。

AT&T / 华纳兄弟:他们在德克萨斯州达拉斯的AT&T体验店引入了创新的互动体验,顾客可以直接与“兔八哥”对话。 [[[IMG_1]]]

Progressive:借助标志性的保险发言人Flo的声音,开发了Flo聊天机器人,简化客户咨询流程,提升个性化服务水平。 [[[IMG_2]]]

Duolingo:为了增强学习新语言的趣味性和实用性,Duolingo采用多样化的声音风格,为课程配备个性化语音,提升用户体验。 [[[IMG_3]]]