近日,在 NVIDIA 举办的 GTC 2023 全球开发者大会上,围绕 GPU 芯片与飞桨深度学习平台的合作进展,相关生态建设情况受到关注。随着人工智能基础设施持续演进,深度学习框架与硬件之间的协同优化,正成为提升算力利用率和完善 AI 基础设施的重要环节。
深度学习框架在软硬件体系中承担着连接作用。只有框架、AI 芯片和计算系统实现更紧密的联合优化,才能更充分地释放硬件性能,并提升整体开发与部署效率。
飞桨与硬件厂商合作持续深入
从发展路径来看,飞桨与硬件伙伴的合作经历了由适配到优化,再到协同创新的逐步升级。
早在 2020 年,飞桨便开始与国内外多家领先硬件厂商展开对接。到了 2021 年,双方进一步围绕适配方案复杂、成本较高等问题展开联合研发,形成了多层次、低成本的统一硬件适配方案。这一方案涵盖自定义算子库接入、自定义通信库等多项基础软件能力改造,硬件厂商可根据自身技术特性灵活选择适配方式,从而有效降低接入门槛与研发成本。
截至目前,已有超过 40 家硬件厂商与飞桨开展深度融合优化,国产芯片也已基本实现全面适配。
从适配优化走向协同创新
进入 2022 年后,飞桨与硬件伙伴的合作重点不再局限于基础适配,而是进一步迈向协同创新。硬件厂商希望通过定制化的飞桨框架、模型库等能力,补充和完善自身 AI 软件栈;而飞桨则借助底层开发体验的持续提升,帮助更多开发者以更低门槛开展人工智能应用创新。
在这一过程中,NVIDIA 与飞桨率先完成了联合创新实践。以双方合作为代表,飞桨随后又与更多国内外硬件伙伴共同推出了基于飞桨开源版的厂商定制框架和模型库,进一步丰富生态供给。
NVIDIA 与飞桨合作的三项重点成果
据介绍,NVIDIA 将飞桨视为全球前三的深度学习框架合作伙伴之一,并在中国设立专门工程团队提供支持。双方围绕开发环境、模型示例和人才培养等方向,联合推进了三项主要成果:
基于 NVIDIA GPU 定制优化的飞桨容器 NGC,集成 CUDA、DALI 等最新 NVIDIA 工具包以及优化版本的飞桨,为开发者提供更完善的开发环境。
NVIDIA Deep Learning Examples 提供便于训练和部署的飞桨模型示例,帮助用户更高效地开展实践。
在 NVIDIA 深度学习培训中心(DLI)推出系列免费课程和联名认证证书,帮助开发者提升训练与推理性能优化能力,同时简化代码开发流程。
13 家合作伙伴共同推出生态发行版
会上还披露,飞桨联合 NVIDIA、Intel、ARM 等 13 家合作伙伴共同发布了飞桨生态发行版,以推动软硬件协同的深度优化。
与此同时,飞桨“硬件生态共创计划”合作伙伴数量已增至 29 家。该计划主要围绕四项重点工作展开,包括联合研发、资源共享、联合授权和培训赋能,目标是与战略合作伙伴共同推进软硬一体化创新,更好地服务开发者与产业应用落地。
