智能汽车

CoFFee OS 2 提升语音交互能力与毫秒级响应

2024年4月6日 · admin
openmagic ad

近日公开课聚焦了 CoFFee OS 2 智能语音系统的实测能力,展示了该系统在座舱内的高效语音交互表现和更快的响应速度。

毫秒级响应、更强的模糊识别 长城汽车Coffee OS 2语音交互能力再升级

智能座舱正在从单一交通工具向更丰富的第三生活空间演进。用户对于人机交互的要求不仅要“能用”,更强调“好用”。因此,CoFFee OS 2 在满足驾驶需求的同时,进一步覆盖娱乐和场景化需求,提升整体使用体验。

在底层架构方面,系统以“1+2=N” 作为核心描述,包含一个自研中间件与两个自研统一接口的设计,面向多种硬件配置和应用服务生态,向下兼容高算力平台,向上可覆盖多品牌车型。

毫秒级响应、更强的模糊识别 长城汽车Coffee OS 2语音交互能力再升级

硬件层面,CoFFee OS 2 配备了满足不同视听需求的显示屏与高可靠性算力,搭载 16G 大内存、UFS 2.1 高速存储协议和千兆以太网等高性能组件。同时提供自研的舱内操作系统、语音、地图/导航与视觉算法等全链路自研软件。

在语音交互方面,设计目标是减少后排闲聊对前排交互的干扰、提升多指令场景的响应速度与准确性、避免需要先唤醒才执行指令的常见痛点。

系统设计团队提出了十大“灵魂拷问”,实测中 CoFFee OS 2 在多层面展现出出色的语音交互能力。

毫秒级响应、更强的模糊识别 长城汽车Coffee OS 2语音交互能力再升级

在响应速度方面,官方数据表明,CoFFee OS 2 的平均响应时间约为 250 毫秒,处于行业领先梯队的 300–350 毫秒区间之内。

在跨领域、多意图指令的识别与执行方面,系统可支持一句话内包含多领域、十个意图的复杂口令,且执行速度与准确度都表现优异。

毫秒级响应、更强的模糊识别 长城汽车Coffee OS 2语音交互能力再升级

对于后排抑制而言,系统通过多声道定位有效分离前排语音,后排闲聊不会干扰前排的语音交互,大幅降低误报与漏报。

毫秒级响应、更强的模糊识别 长城汽车Coffee OS 2语音交互能力再升级

在车载语音控制方面,系统具备强大的上下文理解与泛化理解能力,能够以口语化、自然的方式发出语音指令,不再拘泥于刻板的表达方式。

此外,CoFFee OS 2 还提供“可见即可说、免唤醒、全双工多轮对话、车机闲聊、跨域知识上下文”等多项行业领先的语音交互能力,并支持触控、手势、头姿等多种自然交互模式。