互联网技术 / 互联网资讯 · 2024年3月7日

5G边缘云中的DPU关键作用

本文整理自多家机构在2021中国5G网络创新论坛上的讨论,聚焦DPU在5G边缘云中的进展与应用,供读者参考。

5G时代带来巨量带宽,使应用场景与数据处理需求快速增长。数据量激增和服务器网络带宽扩张超越计算能力,导致某些需要高速I/O的应用面临CPU与内存资源瓶颈,网络包处理性能波动与延迟成为关注点。

同时,5G带来终端数量的剧增和数据规模的爆发。2019年全球数据量约为45ZB,预计到2024年将达到142ZB,其中约24%的数据来自终端的实时数据。这带来低时延网络传输与就地数据处理的算力挑战。

5G时代还带来个性化的私域网络需求。5G不仅服务公众用户,更将赋能各行各业,作为新基建的重要组成部分,推动社会发展。大量边缘部署将提供实时应用与服务。在算力增长放缓的背景下,计算形态从“端-云”逐步向“端-边缘-云”一体化演进,云资源成为推动5G发展的基石之一。

5G MEC是一种分布式计算架构,将计算能力、业务与部分网络能力部署在网络边缘,以实现低时延的就地数据处理与本地数据保护。MEC特别适配对延迟和带宽敏感的场景,能够在靠近终端的边缘提供高带宽、低时延的网络连接、AI与图像渲染等计算能力,以及面向行业的安全能力。

[5G边缘云中的DPU关键作用]

边缘计算将从传统的集中式交换模式扩展为边缘交换模型。由于边缘更贴近用户,数据到达核心网络的距离缩短、传输成本下降,因此在边缘完成数据交换与互联成为趋势。随着边缘互联的发展,数据将更多在本地保留与处理,核心网的流量压力相对降低。

为了实现低延迟,网络需要在接近用户的边缘节点实现更高密度的部署,骨干网延伸至边缘,1-2跳内完成互联与数据交换。预计到2025年,约75%的数据将在工厂、医院、零售和城市等场景的边缘产生、处理、存储与分析。

5G要求更灵活的前导码与回传网络,以支撑日益增长的边缘计算需求。现有回传网络可能无法满足新数据产生的速度与容量需求,因此需要在边缘部署更快更大容量的路由与网络设备。

在云基础设施领域,虚拟化和通用CPU资源受限于计算资源,现阶段需要一种技术来卸载CPU负荷、最大化资源共享,以支撑5G网络与边缘云服务的并行运行。

DPU(数据处理单元)作为新型数据处理单元,集成了网络、存储、安全与虚拟化功能,定位于协同处理单元,将数据面与控制面分离。DPU一端连接CPU、GPU、SSD、FPGA等资源,另一端连接交换机与路由器等网络组件,能够显著提升网络传输效率、释放CPU算力,降低总体成本与能耗。

自上世纪以来,CPU一直是核心计算资源,GPU则在并行计算与图形处理方面发挥重要作用。进入5G时代,数据成为王者,DPU被视为实现高效数据处理与网络加速的关键硬件之一。

DPU相当于对智能网卡的升级,增强了网络安全、网络协议处理与分布式存储能力,将软件定义网络、软件定义存储、软件定义加速器整合为一个有机整体,承担数据处理与安全加速任务,逐步替代部分数据中心对CPU的依赖。

本质上,DPU是一种分类计算,将数据处理与预处理从CPU卸载,并将算力分布在更接近数据发生的位置,以降低通信量。这涵盖了基于GPU的异构计算、基于网络的计算与基于内存的计算等方向。DPU定位为协同处理单元,与CPU协作:CPU负责通用控制,DPU专注于数据处理。在局域网场景下,DPU通过PCIe、CXL等技术连接同一边缘的CPU、GPU、存储等资源;在广域网场景下,则通过以太网、InfiniBand等实现边缘与边缘、边缘与云之间的连接。

DPU通常包含专用的报文处理引擎、路由与加密等协处理能力,并具备低延迟的交换能力,能够快速将不同类型的数据包分发给合适的处理单元。

基于DPU的网络处理模块具有高度可编程性,能够适应网络、协议、封装与加密算法的快速变化。相比传统网卡,DPU在同等算力下可以降低服务器数量,降低前期成本与能耗,降低大规模部署的总体拥有成本(TCO)。

未来,DPU将成为新的数据网关,集成安全功能,将网络接口作为隐私边界进行保护。包括加解密算法、哈希与对称加密等处理将逐步落地到DPU中。随着区块链与共识机制的演进,相关运算也有望在DPU上实现。

此外,DPU将成为存储入口,将NVMe over Fabrics等协议扩展到InfiniBand或TCP互联的节点,实现存储的共享与远程访问。这些数据流的协议处理可在DPU中实现,作为互联协议控制器的一部分。

在云服务领域,DPU也将帮助云服务提供商下沉资源管理,将部分控制与资源编排任务转移至DPU,从而释放CPU、GPU资源,提升资源管理的清晰度与效率。

不同厂商的DPU实现各有侧重点:
MaRvell 等推出面向5G基带处理的DPU,采用多核架构与专用处理单元;NFP 系列、Pensando、Fungible 等也提供各自的P4可编程流处理与加速单元设计;英伟达收购 Mellanox,推出 BlueField-2,整合多核ARM与专用加速核,提供 DOCA 开发平台以支持DPU应用开发;英特尔则通过将CPU、FPGA整合、并提供 DPDK 与 SR-IOV 等技术实现高效数据平面处理;其他厂商如 Broadcom、Xilinx(Alveo SN1000 等)也在推进基于ARM、FPGA等的DPU实现与生态。

总结而言,DPU在5G边缘云时代扮演着连接与加速的枢纽角色。通过将数据处理任务下沉到边缘,DPU帮助降低延迟、提升吞吐、优化资源利用,并推动云服务与边缘应用的高效协同与降本增效。