声音识别算法国际排名第一

近期，小米自主研发的声音识别算法取得了重大进展，其算法模型在国际上排名第一，领先其他机构。这一突破是在 Google 发布的 AudiOSet 音频标记任务中实现的，该任务被认为是声音领域的 imageNet，具有极高的权威性。

Google 将 AudiOSet 数据集划分为三个子集，其中前两个子集合并为 “AudiOSet-2M” 用于训练。在这个合并后的训练集中，小米的声音识别算法首次突破了50 MAP，刷新了音频标记技术的标准，成为当前性能最佳的模型。此外，小米还推出了一个迷你版模型，适合资源有限的场景，其参数量仅为原模型的九分之一，尽管体积小，但性能却优于所有其他机构的模型。

这一技术突破标志着小米在声音识别算法方面的能力再上层楼。运用此项技术的小米智能硬件设备，能够更敏锐地捕捉和识别环境声音，从而显著提升硬件的智能化水平，为用户带来更加便捷的智能生活体验。

此外，小米的音频标记技术也为业界的前沿研究提供了重要的技术支持，积极推动相关领域的研发进程。

经过改进的小米声音识别算法具有极高的应用价值，能够在小米的智能设备中广泛应用，显著提升用户的智能生活体验。具体而言，这项音频标记算法可识别多种环境声音，如婴儿哭声、动物叫声、汽车引擎声、爆炸声、烟雾警报、门铃声和水流声等，并将这些声音转化为文字等形式，使声音得以“可视化”。这使得硬件设备更加智能，为用户带来高效且准确的声音识别体验。

例如，小米手机中的“小米闻声”功能能够监测14种重要环境声音，包括火警声、婴儿哭声和烧水壶声等，并通过手机通知栏以文字形式进行推送。这使得听力障碍用户能够“看见”生活中的声音，享受与普通人相同的智能生活便利。同时，小米手环也可以同步显示和接收这些声音信息。

在智能家居设备中的应用更是广泛。小米的声音识别算法已被应用于多款智能家居产品中，例如米家摄像头的宝宝哭声监测功能，能在监测到宝宝哭声时，实时向用户手机发送通知。XiaoMi Sound 音箱也具备声音识别功能，能够识别家用报警器、婴儿哭声、火灾、流水声、猫叫声和狗叫声等六种常见家居环境声音。此外，小米健康 app 的睡眠鼾声监测功能，能够帮助用户跟踪睡眠时的鼾声和梦话。针对家庭场景，小米还对音箱的环境音监测进行了特别优化，例如将水流声的识别条件调整为一分钟内多次监测，以避免打扰用户。

这一算法技术也广泛应用于小米机器人的研发，显著增强了机器人的感知能力。小米历时10个月自主研发的第一代全尺寸人形机器人 CybeROne，能够识别85种环境声音，并通过听觉感知6类和45种人类情绪。而第二代仿生四足机器人 CybeRDog 2 则可以识别38种环境声音，具备更强大的动态响应能力。

小米强大的 AIoT 平台生态，为这一算法技术的应用提供了广阔的空间，这也是小米技术研发的内在优势，丰富的场景推动技术向应用层面发展，使科技成果真正惠及到大众。

ad

近期文章

互联网资讯 · 2023年12月4日 0

声音识别算法国际排名第一

You may also like...

发表评论取消回复

互联网资讯 · 2023年12月4日 0

You may also like...

格力预制菜装备公司开展异业合作

电商行业2023年内部增长趋势延续

用柱子营造购物中心场景美学。

发表评论 取消回复

发表评论取消回复