互联网资讯 / 人工智能 · 2024年1月7日 0

新一代智能计算平台上线,AI训练效率提升11倍

8月30日,某云服务商正式推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心。该平台以公共云和专有云两种模式为科研、公共服务机构和企业提供智能计算服务,资源利用率有望提升3倍以上,AI训练效率提升11倍,推理效率提升6倍。

新一代智能计算平台上线,AI训练效率提升11倍

飞天智算平台基于磐久基础设施,提供融合算力与大数据AI一体化解决方案,能够在X86、GPU、ARM等多种芯片类型的服务器上运行,支持“一云多芯”,并实现最高10倍的I/O优化和5倍的通信性能提升,达到90%的并行计算效率。

智算不仅在于规模,更需要绿色高效并具备产业落地能力。

绿色技术方面,飞天智算通过技术减排、能源结构优化、区域布局优化、供应链减碳以及资源利用优化五个方面来降低单位算力的碳排放。在技术减排方面,通过液冷、智能运维等方式降低能耗,PUE最低可达1.09。

此外,开发人员可以在平台上完成数据存储、数据治理、数据分析、模型开发、模型训练与推理等工作,并提供了预训练模型,以及语音、图像、自然语言处理、决策等领域的模型能力,以帮助开发者更高效地推进AI应用。

目前,该平台正在支撑建设两座超大规模智算中心。张北智算中心规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心。乌兰察布智算中心规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力,位于“东数西算”内蒙古枢纽节点。

新一代智能计算平台上线,AI训练效率提升11倍

据介绍,该平台已在内部广泛应用,支撑日均AI请求量达到1万亿次,服务全球约10亿人。在具体案例方面,拍立淘训练速度提升了200倍,10亿张图片全量训练时间从2.5个月缩短至8小时。达摩院大模型M6仅使用512张GPU,在10天内完成了10万亿参数模型的训练,能耗仅为GPT-3在同等规模下的1%。

同时,该平台已服务于多家企业和机构,覆盖自动驾驶、药物研发、气象预测、工业能源等领域,显著提升AI训练与推理效率。