互联网资讯 · 2023年12月4日 0

声音识别算法国际排名第一

近期,小米自主研发的声音识别算法取得了重大进展,其算法模型在国际上排名第一,领先其他机构。这一突破是在 Google 发布的 AudiOSet 音频标记任务中实现的,该任务被认为是声音领域的 imageNet,具有极高的权威性。

Google 将 AudiOSet 数据集划分为三个子集,其中前两个子集合并为 “AudiOSet-2M” 用于训练。在这个合并后的训练集中,小米的声音识别算法首次突破了50 MAP,刷新了音频标记技术的标准,成为当前性能最佳的模型。此外,小米还推出了一个迷你版模型,适合资源有限的场景,其参数量仅为原模型的九分之一,尽管体积小,但性能却优于所有其他机构的模型。

这一技术突破标志着小米在声音识别算法方面的能力再上层楼。运用此项技术的小米智能硬件设备,能够更敏锐地捕捉和识别环境声音,从而显著提升硬件的智能化水平,为用户带来更加便捷的智能生活体验。

此外,小米的音频标记技术也为业界的前沿研究提供了重要的技术支持,积极推动相关领域的研发进程。

声音识别算法国际排名第一

经过改进的小米声音识别算法具有极高的应用价值,能够在小米的智能设备中广泛应用,显著提升用户的智能生活体验。具体而言,这项音频标记算法可识别多种环境声音,如婴儿哭声、动物叫声、汽车引擎声、爆炸声、烟雾警报、门铃声和水流声等,并将这些声音转化为文字等形式,使声音得以“可视化”。这使得硬件设备更加智能,为用户带来高效且准确的声音识别体验。

例如,小米手机中的“小米闻声”功能能够监测14种重要环境声音,包括火警声、婴儿哭声和烧水壶声等,并通过手机通知栏以文字形式进行推送。这使得听力障碍用户能够“看见”生活中的声音,享受与普通人相同的智能生活便利。同时,小米手环也可以同步显示和接收这些声音信息。

在智能家居设备中的应用更是广泛。小米的声音识别算法已被应用于多款智能家居产品中,例如米家摄像头的宝宝哭声监测功能,能在监测到宝宝哭声时,实时向用户手机发送通知。XiaoMi Sound 音箱也具备声音识别功能,能够识别家用报警器、婴儿哭声、火灾、流水声、猫叫声和狗叫声等六种常见家居环境声音。此外,小米健康 app 的睡眠鼾声监测功能,能够帮助用户跟踪睡眠时的鼾声和梦话。针对家庭场景,小米还对音箱的环境音监测进行了特别优化,例如将水流声的识别条件调整为一分钟内多次监测,以避免打扰用户。

这一算法技术也广泛应用于小米机器人的研发,显著增强了机器人的感知能力。小米历时10个月自主研发的第一代全尺寸人形机器人 CybeROne,能够识别85种环境声音,并通过听觉感知6类和45种人类情绪。而第二代仿生四足机器人 CybeRDog 2 则可以识别38种环境声音,具备更强大的动态响应能力。

小米强大的 AIoT 平台生态,为这一算法技术的应用提供了广阔的空间,这也是小米技术研发的内在优势,丰富的场景推动技术向应用层面发展,使科技成果真正惠及到大众。