摘要:在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
由刘松,雷玮琛,张琳,高铠炜,苑新婧组成的 FireMoth42 团队凭借其项目“基于 NVIDIA BlueField DPU 的 5G UPF 数据面加速方案”,成功将 5G 用户面功能(UPF)卸载到 DPU,实现了数据面的加速和低时延处理,为边缘网络架构带来新的可能。
聚焦可编程网络 从实验到项目落地
FireMoth42 团队的研究方向长期聚焦于可编程网络、5G 与边缘计算的发展。在实际研究与行业调研中,他们注意到:随着网络流量和用户数量急剧增长,UPF 已成为电信网络核心网的性能瓶颈之一。而 NVIDIA BlueField DPU 的推出,为他们提供了将数据面(UPF)处理任务从通用服务器卸载到 DPU 专用加速硬件的绝佳契机。
“基于 DOCA Flow 库,我们在 NVIDIA BlueField DPU 上实现了 UPF 的数据面处理,并设计了一套针对大流与小流的差异化转发策略,”团队介绍道,“大流通过 eSwitch 直接转发,小流则由 CPU 处理,从而在性能与资源之间取得最优平衡。”
深挖 DOCA 官方文档 破局开发瓶颈
由于 DOCA Flow 库是一个高度抽象的库,团队在开发初期并未能查看到流处理的匹配路径和状态变化,这导致了一些未知错误,比如数据包并未按照设计的匹配条件进行正确转发,并在 pipe 串联处理数量超过 15 个时还出现了数据流处理性能下降的问题。团队想要定位这些错误和问题出现了较大困难,故在程序调试上耗费了较多的时间,当然这也极大的考验了团队的耐心与协作能力。
面对这些挑战,团队采取了多管齐下的策略。首先,他们深入查阅了 DOCA 官方文档和 SDK 示例,积极向 NVIDIA 导师团队请教,在导师的帮助下逐步厘清了开发框架中的多个关键概念,加速了团队对 DOCA Flow 架构的理解。
其次,团队还采取“反复尝试+精细验证”的策略。在调试过程中,重复执行“注释和添加代码——编译——运行——测试”的闭环流程。通过对代码逻辑进行精细拆分与变动,逐步缩小问题范围,尝试各种可能的配置组合,从而找出导致行为异常的根本原因。
此外,为了解决性能瓶颈定位难的问题,团队还编写了一系列 DOCA Flow 测试程序,通过简化逻辑、控制变量,逐步推导出 pipe 串联与表项下发的最佳实践,为后续优化提供了坚实依据。
流量分发逻辑的全面创新
本项目的核心创新在于实现了 5G UPF 从通用 CPU 到 BlueField DPU 的卸载与加速。团队不仅将数据面转发逻辑迁移至 BlueField DPU,还结合了实际网络流量在大、小流上的差异特征,设计了一套基于流量分类的转发策略:将大流直接通过 eSwitch 转发,以降低 CPU 干预和转发延迟;而将小流保留在 CPU 侧处理,实现资源分配的最优化。
在应用落地方面,该方案特别适用于未来的边缘电信场景,尤其是 MEC(边缘计算)架构下的小型数据中心或边缘汇聚点。相比传统方案,基于 DPU 的 UPF 加速模型不仅具备更低的时延、更优的能耗效率,还能有效释放边缘机房中宝贵的 CPU 资源,将其用于更多控制面、业务逻辑和 AI 推理等其他处理任务。
DOCA 开发者快问快答
Q
您是从哪里了解到 NVIDIA DPU 黑客松竞赛的?参赛的目标是什么?
A
我们在搜索 BlueField DPU 资料时通过知乎和搜索引擎了解到此次竞赛。参赛是为了系统的学习和使用 DOCA SDK,并与业界同行交流。
Q
赛前举办的 DPU 线上技术训练营对您的备赛起到哪些帮助?
A
在训练营中,NVIDIA 导师系统讲解了 DPU 架构、DOCA 软件栈以及典型开发案例。这帮我们快速建立了对 DOCA 开发框架和 BlueField 应用场景的整体认知,尤其是 DOCA Flow 的处理机制和代码实例,为我们节省了大量入门时间。
Q
参与 NVIDIA DPU 黑客松竞赛有哪些收获?
A
此次竞赛对我们来说是一次完整的系统级工程开发体验。从搭建环境、明确需求、模块划分到调试联通,每一步都考验团队协作与问题解决能力。我们不仅掌握了 DOCA 开发的核心流程,也深刻体会到 DPU 技术在现代网络基础设施中的应用潜力。
Q
本次竞赛有没有难忘或有趣的经历?
A
太多了,有一次因为少写一个下发语句,导致表项迟迟不生效,排查了 40 多分钟才找到问题。还有一次因字节序问题导致 ARM 侧计算结果完全颠倒。解决这些问题的过程既痛苦又充满成就感。
Q
团队里是否有女性开发者?她们发挥了怎样的作用?
A
我们团队共有两位女性成员,她们不仅参与核心架构设计,还在代码实现、性能测试、调试验证中发挥关键作用。她们思维细腻、耐心包容,经常能在团队陷入困境时提出新思路,也是团队的“粘合剂”,增强了整体凝聚力。
这次竞赛也让我们意识到,技术从不是某类群体的专属舞台,而是每一个热爱探索、勇于挑战的开发者共同创造的空间。
Q
什么契机让您成为 DOCA 开发者?
A
我们实验室的研究方向本身就聚焦于可编程网络,而其中最重要的设备类型就是可编程交换机与智能网卡。BlueField DPU 正是智能网卡领域中的代表性硬件,它不仅在工业界的实际部署中表现优异,在学术研究中也逐渐成为热点。因此,作为研究生,我们也想探索 BlueFiled 的强大功能,故而逐步走上了 DOCA 开发者的道路。
Q
您对 DOCA 和DOCA 中国开发者社区有何评价?
A
DOCA 是我们用过文档最完整、功能也最丰富的网络加速开发工具之一。无论是开发框架、API 文档,还是代码示例,整体结构都非常清晰,对新手来说也非常友好。
DOCA 中国开发者社区也给了我们很多帮助。无论是查资料、问问题,还是参与线上活动、获取导师建议,都非常高效。社区里的技术氛围也很好,很适合成长、交流和结识志同道合的伙伴。
开发者寄语
“技术的赛场不分性别,而是每一个热爱探索的人的共同舞台。欢迎更多同学加入 DPU 与 DOCA 的开发行列,在边缘智能与网络创新的浪潮中,写下属于你们的代码故事!”
来源:NVIDIA英伟达中国