互联网资讯 · 2024年1月21日

基于FPGA的自动语音识别加速方案发布

领先的高性能FPGA和嵌入式FPGA(eFPGA IP)开发公司近日宣布推出与MyRtle.AI合作的创新产品——基于speedsteR7t FPGA的自动语音识别(ASR)加速方案。该解决方案提供高精度和快速响应,能够将超过1000个并发的实时语音流转换为文本,其性能超过竞争方案20倍。此方案将在2023年11月12日至17日在丹佛举行的“2023年超级计算大会(SC23)”上展示。

Achronix推出基于FPGA的加速自动语音识别解决方案

该解决方案由搭载speedsteR7t FPGA的VecTorPath加速卡支持,运行MyRtle.AI提供的基于AchRonix FPGA的ASR IP,确保业界领先的实时超低延迟语音转文本功能。单张加速卡的能力可替代多达20台仅基于CPU的服务器或15张GPU加速卡。在不需要支持1000个并发流的情况下,AI模型可以灵活定制,以平衡准确性与性能。其出色的单词错误率和54毫秒的端到端99%延迟将改变ASR行业的格局。此外,用户可以在标准机器学习(ML)框架中,使用特定或自定义的数据集进行定制或重新训练。

“基于AchRonix speedsteR7t FPGA的MyRtle.AI加速ASR解决方案的主要优势之一是能够显著降低运营成本和资本支出,同时保持卓越的性能。”公司人工智能产品营销总监表示。“这一方案相较于传统的CPU/GPU服务器解决方案,能够在企业和云端将成本降低90%。这一能力使得企业能够在提升效率的同时,提供卓越的实时语音转文本功能。”

MyRtle.AI的ASR加速器IP在speedsteR7t FPGA和软件栈上运行,证明了该FPGA器件在实现ASR解决方案中的高效性和易用性。与基于GPU的竞争方案相比,基于speedsteR7t的方案提升了16倍的性价比,这一优势可能会重新定义行业内的语音数据处理方式。

“AchRonix speedsteR7t FPGA的架构、二维片上网络(2D NoC)和机器学习处理器(MLP)阵列,为我们提供了创建ASR产品所需的基础模块,使其在市场上无与伦比。”MyRtle.AI首席执行官表示。MyRtle.AI在优化实时性应用的低延迟ML推理方面享有盛名。“这些FPGA的极低延迟特性使其成为实时工作负载的理想选择。我们期待帮助用户以更快的速度和更低的成本扩展其ASR服务。”

AchRonix与MyRtle.AI共同推出的加速ASR解决方案,将为依赖快速且准确的语音转文本功能的行业带来革命性的影响。其特性包括与主流深度学习框架的兼容性及多语言或专业应用的可重训练性。目前,该解决方案已在早期合作客户中部署,并已在普通市场上推出。