燧原科技近日推出了第二代人工智能训练产品组合,包括“邃思2.0”芯片、基于该芯片的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,以及升级后的“驭算TopsRideR”软件平台和全新的“云燧集群”,成为国内首家发布此类产品的企业。

燧原科技第二代通用人工智能训练芯片“邃思2.0”
经过全面升级,邃思2.0在计算能力、存储、带宽和互联能力上相较于第一代产品有了显著提升,特别是在支持超大规模模型方面的能力得到了明显增强。同时,配套升级的驭算TopsRideR软件平台为燧原科技构建创新软件生态奠定了基础。完全自主研发的软硬件架构,使燧原科技在知识产权和产品迭代上能够自主把握方向与节奏。

燧原科技第二代通用人工智能训练加速卡“云燧T20”

燧原科技第二代通用人工智能训练模组“云燧T21”
四大核心升级,构建全新产品矩阵与智算集群
架构升级带来算力飞跃:邃思2.0进行了全面的架构改进,采用新一代全自研的GCU-CARA全域计算架构,针对人工智能计算进行了深度优化,奠定了对通用异构计算的支持基础;同时,支持从FP32、TF32、FP16、BF16到INT8的多种计算精度,成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力则达到160 TFLOPS,均为国内领先。
HBM2E存储实现超大吞吐量:邃思2.0搭载了4颗HBM2E片上存储芯片,最高可支持64 GB内存,带宽达到1.8 TB/s,成为国内首个支持世界先进存储HBM2E及单芯片64 GB内存的产品。
高速互联支撑算力扩展:GCU-LARE全域互联技术是燧原为人工智能训练集群专门研发的互联技术,提供双向300 GB/s的互联带宽,支持数千张云燧CloudBlazeR加速卡的互联,确保优异的线性加速比。
全新软件驾驭强大算力:驭算TopsRideR是燧原科技自主知识产权的计算及编程平台,通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各种模型训练;结合HoROVod分布式训练框架与GCU-LARE互联技术,为超大规模集群的高效运行提供了有效解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了定制化的开发能力。
