互联网资讯 / 人工智能 · 2024年1月20日

openmagic_cn_banner

人工智能研究推动1000种语言模型的发展

当微软和谷歌为谁的人工智能聊天机器人更出色而激烈竞争时，这一领域的应用远不止于此。除了传闻将在今年的年度 I/O 活动上展示的多款人工智能驱动产品之外，谷歌正朝着打造一个覆盖 1000 种语言的人工智能语言模型目标迈进。周一发布的更新中，谷歌把通用语音模型（USM）描述为实现这一目标的关键第一步。

openmagic_cn_banner

去年 11 月，谷歌宣布计划创建一个覆盖全球前 1000 种最常用语言的语言模型，并披露了 USM 的相关信息。USM 被描述为“最先进的语音模型系列”，拥有约 20 亿参数，在 1200 万小时的语音数据和覆盖 300 多种语言的 280 亿句子上进行训练。YouTube 已经利用 USM 生成封闭式字幕，并支持自动语音识别，能够自动检测并翻译语言。

现在，谷歌称 USM 已经支持超过 100 种语言，并将作为基础来构建一个更为广泛的系统。Meta 公司也在开发类似的人工智能翻译工具，当前仍处于早期阶段。你可以在谷歌发布的研究论文中了解更多关于 USM 的工作原理与实现细节。

这一技术的一个远景目标，可能是在增强现实眼镜中实现实时翻译的能力——就像谷歌去年在 I/O 活动中展示的设想那样，翻译结果能在视线前方即时呈现。不过，这项技术仍有一定难度，谷歌在 I/O 大会上对阿拉伯语的表述错误也证明了这类系统容易出错。

You may also like...

openmagic_cn_banner