12月7日,位于中国上海的燧原科技推出了其第二代云端人工智能推理加速卡“云燧i20”。这是继今年7月发布的“云燧T20”云端人工智能训练加速卡后的又一创新产品,时隔仅五个月。

燧原科技推出第二代人工智能推理加速卡“云燧i20”。
作为新一代的云端AI推理加速解决方案,云燧i20具备业内最高的AI加速卡存储带宽,达到819 GB/s,远超同类产品。同时,它全面支持多种计算精度,包括FP32、TF32、FP16、BF16以及INT8。其单精度FP32的峰值算力为32 TFLOPS,TF32峰值算力为128 TFLOPS,而整型INT8的峰值算力则达到256 TOPS。与第一代推理产品相比,云燧i20的浮点算力提升了1.8倍,整型算力则增长了3.6倍。
升级后的“驭算TopsRideR”软件栈在性能、开发效率及模型覆盖方面有了显著提升。通过应用通用高层图优化和大规模算子融合技术,充分发挥了大容量片内存储和高带宽存储的优势,使模型平均性能提高了3.5倍,硬件算力利用率平均提升了2倍。此外,升级后的编程模型和算子自动分片、自动生成技术,使得自定义算子的开发效率翻倍,模型迁移成本也大幅降低。同时,驭算还增强了对动态应用的支持,使云燧i20在检测、语音识别和语义理解等方面更具竞争力。

燧原科技的CEO赵立东与COO张亚林共同发布了第二代云端AI推理产品。
赵立东表示:“云燧i20的发布表明燧原科技在云端AI算力加速领域已经实现了从训练到推理的完整产品线升级。我们致力于为互联网、智慧城市、智慧政务以及金融、交通、能源等传统行业客户提供更具竞争力的AI计算方案。”他进一步指出,当前中国的芯片产业正经历激烈的成长与变革,燧原科技以“做大芯片,拼硬科技”为使命,依靠原创的软硬件架构,持续加速技术创新与产品迭代。云燧i20的表现已经超越了行业内的一些旗舰GPU,成为我们的重要成果之一。
超大带宽推理加速卡,兼具高吞吐与低延时特性
当前,语音识别、图像识别及视频内容分析等感知类应用,以及内容推荐和欺诈交易拦截等决策类应用在云端大多以实时在线方式提供服务。随着神经网络参数的增加,数据带宽需求也在持续上升,因此兼顾高带宽与低延迟变得愈发重要。云燧i20创新性地采用了高带宽HBM2E存储,实现了819GB/s的超大带宽,确保各类云端推理业务的高吞吐和低延时性能,从而保障其准确、平稳及高效运作。
自主创新芯片架构,以更高性价比提供极致性能
新一代“邃思”AI推理芯片采用第二代高性能计算核心与数据引擎,基于12nm工艺制造。通过架构升级,显著提高了单位面积的晶体管效率,实现了与当前业内的7nm GPU相媲美的计算能力。同时,12nm工艺带来的成本优势,使得云燧i20在同等性能下具备更高的性价比。此外,稳定成熟的供应链体系能够及时满足客户需求。

燧原科技发布全新一代“邃思”云端AI推理芯片。
张亚林指出:“云燧i20全面提升了算力,兼顾全精度算力的同时大幅提高了整型运算能力,显著增强了模型覆盖率与泛化支持能力。在多个基准测试中,其模型性能和能效比均处于国内领先水平,能够满足云端推理业务的高度多样化需求。燧原科技目前已拥有第二代训练与推理产品,提供针对客户业务场景的原创创新、具备高性能及性价比的‘训练+推理’完整解决方案,并支持国产服务器与操作系统,助力客户进行云端系统部署,持续为客户创造价值。”
产学研协同,引领原始创新国产AI算力落地
自第一代云端AI推理加速卡“云燧i10”发布以来,燧原科技在构建原始创新的通用算力与自主生态方面做出了巨大努力。以国产AI算力产品为核心,结合商业生态与科研生态,成功实现了云端AI推理产品在互联网、金融、政务等多个领域的商业落地,并获得广泛认可。
