互联网资讯 / 人工智能 · 2024年1月20日

人工智能研究推动1000种语言模型的发展

当微软和谷歌为谁的人工智能聊天机器人更出色而激烈竞争时,这一领域的应用远不止于此。除了传闻将在今年的年度 I/O 活动上展示的多款人工智能驱动产品之外,谷歌正朝着打造一个覆盖 1000 种语言的人工智能语言模型目标迈进。周一发布的更新中,谷歌把通用语音模型(USM)描述为实现这一目标的关键第一步。

去年 11 月,谷歌宣布计划创建一个覆盖全球前 1000 种最常用语言的语言模型,并披露了 USM 的相关信息。USM 被描述为“最先进的语音模型系列”,拥有约 20 亿参数,在 1200 万小时的语音数据和覆盖 300 多种语言的 280 亿句子上进行训练。YouTube 已经利用 USM 生成封闭式字幕,并支持自动语音识别,能够自动检测并翻译语言。

现在,谷歌称 USM 已经支持超过 100 种语言,并将作为基础来构建一个更为广泛的系统。Meta 公司也在开发类似的人工智能翻译工具,当前仍处于早期阶段。你可以在谷歌发布的研究论文中了解更多关于 USM 的工作原理与实现细节。

这一技术的一个远景目标,可能是在增强现实眼镜中实现实时翻译的能力——就像谷歌去年在 I/O 活动中展示的设想那样,翻译结果能在视线前方即时呈现。不过,这项技术仍有一定难度,谷歌在 I/O 大会上对阿拉伯语的表述错误也证明了这类系统容易出错。