基于联邦强化学习的数据中心网络拥塞控制算法

摘要：拥塞控制算法对于确保数据中心网络实现高效且可靠的数据传输至关重要。然而，传统算法由于采用固定的参数设置，难以在动态变化的网络环境下实现高效的数据传输。现有的基于强化学习的拥塞控制方案虽然有效，但大都采用集中式学习训练的方式，存在数据孤岛问题以及原始数据共享引发

基于联邦强化学习的数据中心网络拥塞控制算法

11，张鹏2,324444

（1.中国地质大学（武汉）机械与电子信息学院，湖北武汉 430074；

2.华中科技大学电信学院，湖北武汉 430074；

3.烽火通信科技股份有限公司，湖北武汉 430074；

4.湖北华中电力科技开发有限责任公司，湖北武汉 430070）

【摘要】拥塞控制算法对于确保数据中心网络实现高效且可靠的数据传输至关重要。然而，传统算法由于采用固定的参数设置，难以在动态变化的网络环境下实现高效的数据传输。现有的基于强化学习的拥塞控制方案虽然有效，但大都采用集中式学习训练的方式，存在数据孤岛问题以及原始数据共享引发的隐私泄露风险。为此，提出了一种基于联邦强化学习的拥塞控制框架。该框架充分利用分布式网络架构的优势，将每个网络设备视作独立的智能体，并通过联邦学习技术实现多智能体间的协同训练。这种方法不仅有效保护了各参与方的数据隐私，而且通过整合各个智能体的成果和策略，提升了模型适应性和泛化能力。在此基础上，以基于联邦强化学习的显示拥塞通知阈值调优为案例进行研究，在多种实验场景下验证了所提架构的性能。

【关键词】数据中心网络；拥塞控制；强化学习；联邦学习

doi:10.3969/j.issn.1006-1010.20241202-0001

中图分类号：TN929.5 文献标志码：A

文章编号：1006-1010(2025)01-0075-06

引用格式：何升涛,李莹玉,张鹏,等. 基于联邦强化学习的数据中心网络拥塞控制算法[J]. 移动通信, 2025,49(1): 75-80.

HE Shengtao, LI Yingyu, ZHANG Peng, et al. A Federated Reinforcement Learning-Based Congestion Control Algorithm for Data Center Networks[J]. Mobile Communications, 2025,49(1): 75-80.

随着物联网和云计算等新兴技术的迅猛发展，全球流量数据已呈指数增长的趋势。据国际数据公司预测，全球2024年将生成159.2十万亿亿字节数据，2028年将增加一倍以上，达到384.6十万亿亿字节。数据的急剧增长不仅加剧了数据传输的需求，同时也对承载数据流量的数据中心网络（DCN, Data Center Network）提出了更高的要求。

DCN作为海量数据传输与处理的关键基础设施[1]，近年来已实现了网络带宽的快速增长[2]和传输协议的升级[3]，以为各种应用提供更快速、可靠的数据传输服务。然而，当网络流量超出DCN的处理极限时，数据会在内部设备的缓冲区中大量积压，形成网络拥塞。网络拥塞不仅会降低网络吞吐量，增加数据传输延迟，严重时还可能导致数据丢包，甚至网络瘫痪。在此背景下，如何有效管理和缓解网络拥塞已成为网络领域的热点问题。拥塞控制算法的出现为解决网络拥塞问题提供了有效的解决方案。这类算法的核心在于利用多种反馈信号，如丢包、往返传递时间和显式拥塞通知（ECN, Explicit Congestion Notification）等，及时向流量发送端传达网络拥塞的信息。通过这些反馈信号，流量发送端能动态调整其发送速率，以防止拥塞进一步加剧。在拥塞控制算法的作用下，DCN能够在高负载的流量场景下实现低时延的数据传输性能[4]，提升了网络服务能力和用户体验。尽管传统拥塞控制算法在一定程度上缓解了网络拥塞问题，但它们大多基于静态规则和网络假设进行设计，具有明显的局限性。为此，研究者们开始探索性将人工智能技术引入拥塞控制算法的设计，以实现更加智能和灵活的拥塞控制[5]。文献[6]首次将人工智能技术应用于拥塞控制领域，作者采用目标函数来衡量调速规则的优劣程度，并通过离线训练直接生成从网络状态到调速规则的映射模型，不仅提高了拥塞控制算法的适应性，还简化了调速规则的生成过程。文献[7]中，作者采用了深度强化学习（DRL, Deep Reinforcement Learning）模型来调节发送端速率。相比于传统的拥塞控制算法，该方法在多种流量场景下实现了更高的网络吞吐量和更低的传输延迟。文献[8]利用DRL自动生成拥塞控制算法的参数，通过优化参数配置，显著提升了拥塞控制算法的性能。文献[9]提出了一种结合离线与在线混合多智能体训练策略，成功实现了拥塞控制算法参数的自动调整。该方法在多种流量场景下显著降低了数据传输时延，进一步证明了DRL技术在提升拥塞控制算法性能方面的潜力。然而，上述基于DRL的方法大多依赖于集中式的学习机制，存在数据孤岛问题以及数据隐私泄露的风险。

联邦强化学习（FRL, Federated Reinforcement Learning）作为联邦学习（FL, Federated Learning）和DRL深度结合的新框架，为解决传统集中式学习机制所面临的问题提供了一种创新解决方案。首先，其设计理念充分考虑了分布式网络的特点，使其能够有效适应各种复杂的网络结构。其次，FRL通过采用FL机制实现多智能体之间的间接数据共享，这一方式不仅有效解决了集中式学习中常见的数据孤岛问题，还促进了跨智能体间的协作学习，同时也有效保护了各参与方的数据隐私安全。此外，由于FRL中的全局模型融合了来自各个智能体的学习成果和策略，因此在面对复杂多变的网络条件时能展现出更强的适应性和鲁棒性。

综上所述，FRL这一分布式学习框架有望为拥塞控制方案提供新的思路。为此，本文提出了基于FRL的拥塞控制架构，旨在通过融合DRL与FL的优势，在分布式网络架构下训练出更全面的DRL模型，以适应多种流量场景下的高性能传输。本文首先对DCN现有拥塞控制算法进行概述，分析各类算法的局限性。然后，详细阐述了所提的基于FRL的拥塞控制架构及其组成部分。最后，为验证所提架构的有效性，设计了用于拥塞控制参数调优的案例，在多种流量场景下测试了所提方案的性能。

1 数据中心网络拥塞控制算法

近年来，随着DCN规模的不断扩大和技术的快速发展，网络拥塞问题日益突出，成为制约网络性能的关键因素。为此，研究者们提出了多种拥塞控制算法，旨在缓解网络拥塞，提高网络传输效率。依据算法的设计思路大致可以归为两大类：传统的拥塞控制算法和基于机器学习的拥塞控制算法。

1.1 传统的拥塞控制算法

传统的拥塞控制算法主要通过监测网络状态指标（如丢包、往返时延等）来判断网络是否出现拥塞，并据此调整数据流的发送速率。根据具体实现方式，此类算法又可细分为以下三类：

（1）基于丢包的拥塞控制

该类算法是最早应用于DCN的拥塞控制算法，其基本原理在于通过监测网络中的数据丢包情况来判断网络是否出现拥塞。具体而言，当流量发送端检测到数据包丢失时，会相应地降低其发送速率，以此来缓解网络拥塞。尽管这类算法能够充分利用带宽资源，但其仅依赖丢包情况来判断网络状态是不准确的（传输错误、硬件故障等也能导致数据丢包），进而不能做出正确的速率调整。同时，该类算法有可能导致数据丢包进一步加剧，难以满足现代网络需求。

（2）基于往返时延的拥塞控制

这类算法通过测量端到端的往返时延变化来判断网络拥塞状况，并相应地调整发送速率进行拥塞控制。当检测到端到端的往返时延显著增加时，通常意味着网络路径上的某些节点已经出现了网络拥塞。此时，流量发送端可以根据往返时延的增量或梯度变化来调整发送速率，以防止拥塞状况恶化。与基于丢包的方法相比，该类算法能够更及时地发现并应对潜在拥塞，尤其适合对丢包敏感的应用场景。

（3）基于显示拥塞通知的拥塞控制

基于ECN的拥塞控制算法是一种更为高效的拥塞控制方案。该算法通过中间网络设备直接生成拥塞信号，从而实现了快速的拥塞控制。根据ECN的工作机制，当交换机出口端口队列长度超过设定的ECN阈值时，超过阈值的数据报文会被交换机标记，并继续被转发。一旦接收端收到带有标记的数据报文后，其将向流量发送端发送协议通告报文。发送端接收到协议通告报文后，会主动降低发送速率，以减少数据在交换机缓冲区内的堆积，从而达到缓解网络拥塞的效果。

文献[10]首次将ECN机制应用于DCN，设计了专用的拥塞控制算法DCTCP（Data Center TCP）。DCTCP通过对TCP协议的改进，显著减少了网络拥塞的发生频率，并大幅降低了数据传输的延迟。随后，文献[11]提出了端到端的拥塞控制算法DCQCN（Data Center Quantized Congestion Notification），该算法不仅继承了DCTCP的优势，还通过引入量化反馈机制，更加精细地调整发送端的速率，从而在提升网络传输效率的同时，保持了良好的公平性。尽管上述算法已在DCN中得到了广泛部署和应用，但现有的方案仍面临诸多挑战。一方面，现有部署的算法大多依赖于预先设置的固定ECN阈值，导致其在面对不断变化的网络环境时表现出了明显的局限性。此外，为了在大规模DCN中确定合适的ECN阈值，网络工程师往往需要投入大量的时间和资源进行调整与测试，这不仅增加了网络运维的成本和复杂度，也限制了网络对突发流量变化的快速响应能力。

1.2 基于机器学习的拥塞控制算法

随着人工智能技术的发展，机器学习，特别是DRL，已被广泛应用于网络拥塞控制算法的设计之中。这些算法利用机器学习的强大的特征提取和学习能力，依据实时监测到的网络状态信息动态调整传输速率或拥塞控制参数，展现出了比传统拥塞控制算法更高的适应性和灵活性。

文献[7]采用DRL技术对流量发送端进行速率控制，其通过单个设备获取的数据进行DRL模型的训练，相比与传统的拥塞控制算法实现了更精确的速率控制。然而，由于单个设备观测到的数据有限，导致训练的模型难以适应复杂的网络环境。相比之下，文献[9]和[14] 提出了多智能体的协作训练的方法，通过全局数据共享机制提升了DRL模型的稳定性和训练效率，使其在复杂网络环境中表现出更强的适应能力。然而，这种全局数据共享机制通过交换从网络设备端口获取的原始数据，存在一定数据隐私泄露的风险。总的来说，尽管基于DRL的拥塞控制方案在性能上已取得显著进展，但未来的研究需要进一步探索多智能体协作训练机制，以在提高模型泛化能力的同时确保数据隐私安全。

2 基于联邦强化学习的拥塞控制架构

本文提出了一种基于FRL的拥塞控制架构，旨在通过分布式学习机制得到全面的DRL模型，该架构由DCN环境、监视和执行模块、智能体以及FL中央服务器四个部分组成，各部分功能如下：

（1）DCN环境：作为整个架构的基础层，DCN环境不仅是数据流的来源，也是整个系统运行的物理载体。其在进行数据传输过程时，网络设备（如终端服务器、交换机）上会产生一些与网络状态相关的数据，这些数据经过监视和执行模块的接口传递给智能体，为其提供决策基础。

（2）监视和执行模块：该模块部署在网络设备上，承担着网络状态信息的采集和智能体的策略实施两项任务。具体来说，监视模块负责通过网络设备上特定接口，实时获取链路利用率、队列长度、丢包率及往返时延在内的多项与网络状态相关的数据，然后将收集到的数据传递给智能体；执行模块则负责将智能体生成的策略转化为实际的操作，通过接口部署网络设备上，如调整传输速度或优化拥塞控制算法的参数配置，以实现网络性能的动态优化。

（3）智能体：作为本架构的核心组件，智能体基于接收到的网络状态信息和预设的目标，运用DRL算法进行学习和优化，最终形成有效的拥塞控制策略。在本架构中，智能体被分散部署在不同的网络设备上，形成了一个分布式多智能体系统。其中，每个智能体都能独立地通过监视和执行模块提供的数据来感知网络状态，并执行相应动作。智能体会更根据具体的决策需求，如离散或连续动作空间，选择最适合的DRL算法来生成最优策略。

（4）FL中央服务器：FL中央服务器在架构中起到协调和优化的作用。由于智能体分布广泛，且各自所处的局部网络环境差异较大，单一智能体的学习成果难以直接推广至整个DCN。因此，FL中央服务器通过汇聚来自多个智能体的局部梯度或模型更新，实现全局模型的优化，以增加模型的泛化能力。

3 案例研究：基于联邦强化学习的ECN阈值调优

由第1节可知，在实际网络环境中，基于静态ECN阈值的拥塞控制方案在复杂多变的流量场景中存在性能不佳的情况。现有的基于DRL的ECN阈值调优方案虽然采用了多智能体的协作的方式进行DRL模型训练，但其通过原始数据共享的方式带来了一定的隐私泄露风险。因此，本节将以基于FRL的ECN阈值调优为案例进行研究，以验证FRL在拥塞控制算法中的可行性。

3.1 案例描述

ECN阈值的主要作用是通过监测队列长度是否超过预设阈值来判断网络是否发生拥塞，并据此向发送端发出信号，使其根据相应的速率控制方案调整发送速率。理想的ECN阈值设定应能在实现高链路利用率的同时，尽量减少队列积压，从而降低数据在网络设备上的排队时延，进而实现更优质的数据传输性能。

为此，本案例的目标是在多个分布式智能体在不交换原始观测数据的前提下，通过FL这一间接数据共享机制进行协同训练，以得到用于ECN阈值调优的DRL模型，如图1所示。其中，软件定义网络控制单元充当FL中央服务器，其能将网络的控制面与数据面分离[15]，在实现对各个智能体的调度的时，不会干扰到DCN中其他业务的正常运行。

在案例中，DCN会进行不同流量场景的数据传输任务，并在传输过程中产生反映网络状态的数据，如端口链路利用率、端口队列长度和当前的ECN阈值设置等。同时，部署在交换机上的监视和执行模块会通过相关的数据接口对上述数据进行收集并进行处理。随后，处理后的状态信息以及通过部分状态计算的奖励值被传递给位于各个交换机节点上的DRL智能体。智能体接收到这些信息后，为更好地理解网络状态的变化趋势，其会将多个时间步的状态作为网络输入，据此来实现ECN阈值的更新。然后，智能体生成的动作将交由执行模块进行配置到交换机节点上。在DCN进行数据传输的整个过程中，智能体会借助不断交互得到的经验数据进行本地模型的训练更新。

若DRL智能体直接采用由连续值组成的ECN阈值作为动作，其将因动作空间过大而难以学习得到稳定的策略。为应对这一挑战，案例中对ECN阈值进行了离散化处理，形成了110种ECN阈值组合，以提高智能体的学习效率。此外，基于离散的动作空间，智能体采用深度双重Q网络进行策略的生成。深度双重Q网络不仅具有深度神经网络的强大特征提取能力，还能避免深度Q网络目标价值过高估计的问题，其能根据环境状态动态调整智能体策略，确保智能体学习过程的稳定性和最终策略的可靠性。

本案例的核心在于开发一种有效的机制，以促进DCN中部署的多个智能体之间的协同训练。为此，重点关注了两个直接影响模型协同训练的挑战：首先是智能体间的收集的数据存在异质性的问题；其次是智能体开始训练的时间不同步的问题。具体而言，尽管所有智能体均部署在同一DCN内，但各智能体从交换机端口获取数据存在显著差异，表现出非独立同分布的特性，加大了协同训练的难度。此外，智能体需要积累足够的有效数据才开始进行DRL模型训练，而数据的有效性筛选导致了各智能体开始训练的时间存在差异，这对模型的聚合机制提出了额外的要求。

面对上述挑战，案例中采用了异步FL机制来进行模型协同。首先，FL机制能够通过多方的模型的聚合来克服非独立同分布数据对模型训练带来的影响。其次，异步聚合机制能够克服了同步机制中的“落后者效应”，能够确保所有智能体在不同的训练阶段都能贡献各自的模型更新，更适合于上述训练时间不一致的情况。具体地，智能体完成一定轮次的本地模型训练后，会将模型参数上传至软件定义网络单元进行异步聚合，以更新全局模型，更新过程如下：

其中，w表示第e轮的全局模型参数，we+1表示第e+1轮的全局模型参数。λ为权重系数，为智能体k在时隙t上传的模型参数。

3.2 仿真实验设置

本文使用NS-3网络模拟器[16]作为实验平台，该平台以其高度可配置性和强大的仿真能力，已成为研究网络协议、算法及机制的理想工具。在该平台上，研究者可根据所需灵活调整网络参数，如网络拓扑、带宽、延迟等，以此来逼近真实的网络环境。此外，NS-3还集成了诸如ns3-ai模块[17]等先进的机器学习库，以实现DRL智能体与NS-3虚拟仿真平台的结合。这些特性使得NS-3成为了实现并验证本文所提架构的理想选择。

（2）网络拓扑及流量

为了更真实地模拟实际DCN的工作环境，在NS-3上构建了一个叶脊网络拓扑结构。该网络拓扑结构由2台脊交换机、4台叶交换机以及24台终端服务器组成。每台叶交换机向上连接所有脊交换机，向下连接6台终端服务器。终端服务器与叶交换机之间的链路带宽为25 Gbps，叶交换机与脊交换机之间的链路带宽为100 Gbps，每一跳的传播延迟均设置为1 μs。

为了全面评估所提方案在处理不同类型网络流量时的表现，使用了WebSearch[9]和FBHadoop[18]具有代表性的网络流量来模拟网络中的真实流量。WebSearch流量模拟的是互联网中的搜索请求服务，其数据包大小集中在10 KB到10 MB之间，整体分布比较均匀，主要用于测试拥塞控制算法在处理大规模数据传输时的稳定性和效率。FBHadoop流量主要以短时流和突发流为主，其中70%的流量都小于10 KB，这类流量主要用于检验拥塞控制算法在应对突发性、高密度数据流时的能力。

在实验中，根据现有的流量生成代码，生成了四组场景下的流量数据，以对不同方案进行测试和对比：对于WebSearch流量，生成在工作负载为50%下的流量，共计2 122条；对于FBHadoop流量，分别生成了30%、50%和70%的三种工作负载下的流量，对应的数量分别为36 704条、913 62条和127 560条。

3.3 仿真实验及结果分析

为了所提方案的有效性，将其与现有的两种静态ECN阈值设定的DCQCN算法进行对比，分别命名为DCQCN1和DCQCN2。为了确保对比的公平性和科学性，根据文献[3]和[9]中的参数设置对ECN的阈值进行了调整。两种对比算法的ECN阈值设置如下：DCQCN1，ECN阈值的设定为Kmin为5 KB，Kmax为200 KB，Pmax为0.01；DCQCN2，当链路带宽为25 Gbps时，Kmin为100 KB，Kmax为400 KB；当链路带宽为100 Gbps时，Kmin为400 KB，Kmax为1600 KB，Pmax为0.2。

（2）性能指标

本文采用流完成时间和流完成时间放缓比作为评估算法性能的指标。其中，流完成时间是指从数据流开始传输到完全接收完毕所经历的时间，流完成时间放缓比为单个数据流的实际完成时间与该流在网络中独立传输时的理想完成时间之比。

（3）实验结果分析

图2展示了在WebSearch工作负载为50%的场景下，三种算法在中位数和第95百分位流完成时间放缓比的结果。对于中短流，即WebSearch工作负载中小于等于72 KB的流，三种算法的中位数和第95百分位的流完成时间放缓比基本一致。对于大于960.9 KB的流，本文算法在第95百分位流完成时间放缓比结果显著优于DCQCN1和DCQCN2，特别是在流大小为1.9 MB时，本文算法在第95百分位流完成时间放缓比从DCQCN1的9.102以及DCQCN2的10.041降为7.136，分别提升了21.6%和28.9%。

图3展示了在FBHadoop工作负载分别为30%、50%和70%下，本文算法与两种对比算法在平均流完成时间上的对比结果。当工作负载为30%时，三种算法的平均流完成时间相近，性能相当。随着工作负载的增加，本文算法展现出了显著的优势。在50%工作负载下，本文算法将平均流完成时间比DCQCN2降低了34.6%。当工作负载为70%时，DCQCN1和DCQCN2的平均流完成时间分别是本文算法的1.52和1.23倍。此外，图3还揭示了静态ECN阈值设置的局限性，DCQCN1虽然在50%工作负载下性能优于DCQCN2，但在30%和70%的工作负载下性能有所下降，进一步证实了固定阈值设置难以适应不同网络环境变化的问题。相比之下，本文算法通过动态调整ECN阈值，能够在不同负载条件下保持更低的平均流完成时间，体现了其灵活性和适应性。

4 结束语

本文针对DCN现有拥塞控制算法面临的挑战，提出了一种基于FRL的拥塞控制架构。该架构充分利用分布式网络架构的特点，通过FL机制，在保护用户数据隐私的同时，实现了多智能体之间的高效协同训练。此外，在基于FRL的ECN阈值调优案例中验证了所提架构的有效性。实验结果表明，在多种流量场景下，本文方法能够显著降低数据传输时延，展现出良好的适应性和稳定性。本文方法不仅为解决DCN中的拥塞控制问题提供了新的思路，也为FL在实际网络环境中的应用开辟了新的方向。

参考文献：（上下滑动浏览）

[1] 杜鑫乐,徐恪,李彤,等. 数据中心网络的流量控制:研究现状与趋势[J]. 计算机学报, 2021,44(7): 23.

[2] Gao Y, Li Q, Tang L, et al. When Cloud Storage Meets RDMA[C]//18th USENIX Symposium on Networked Systems Design and Implementation. NSDI,2021: 519-533.

[3] Li Y, Miao R, Liu H, et al. HPCC: High Precision Congestion Control[C]//Proceedings of the 2019 Conference of the ACM Special Interest Group on Data Communication. SIGCOMM. 2019: 44-58.

[4] 蒋万春,李昊阳,陈晗瑜,等. 网络拥塞控制方法综述[J]. 软件学报, 2024,35(8): 3952-3979.

[5] Abbasloo S, Yen C Y, Chao H J. Classic Meets Modern: A Pragmatic Learning-Based Congestion Control for the Internet[C]//Proceedings of the 2020 Annual Conference of the ACM Special Interest Group on Data Communication on the Applications, Technologies, Architectures, and Protocols for Computer Communication. SIGCOMM. 2020: 632-647.

[6] Winstein K, Balakrishnan H. Tcp Ex Machina: Computer-Generated Congestion Control[C]//In Proceedings of the ACM SIGCOMM 2013 conference on SIGCOMM. SIGCOMM, 2013: 123-134.

[7] Dong M, Meng T, Zarchy D, et al. PCC Vivace: Online-Learning Congestion Control[C]//Proceedings of the 15th USENIX Symposium on Networked Systems Design and Implementation, NSDI, 2018: 343-356.

[8] Ketabi S, Chen H K, Dong H W, et al. A Deep Reinforcement Learning Framework for Optimizing Congestion Control in Data Centers[C]//Proceedings of IEEE/IFIP Network Operations and Management Symposium 2023. NOMS, 2023.

[9] Yan S, Wang X, Zheng X, et al. ACC: Automatic ECN Tuning For High-Speed Datacenter Networks[C]//Proceedings of the ACM SIGCOMM 2021 Conference. SIGCOMM, 2021: 384-397.

[10] Mohammad, Alizadeh, Albert, et al. Data Center TCP (DCTCP)[C]//Proceedings of the SIGCOMM 2010 Conference. SIGCOMM, 2010: 63-74.

[11] Zhu Y, Zhang M, Eran H, et al. Congestion Control for Large-Scale RDMA Deployments[C]//Proceedings of the 2015 ACM Conference on Special Interest Group on Data Communication. SIGCOMM, 2015: 523-536.

[12] Kang K, Zhang J, Jin J, et al. QAECN: Dynamically Tuning ECN Threshold with Micro-burst in Multi-queue Data Centers[C]//Proceedings of the 2019 IEEE 23rd International Conference on Computer Supported Cooperative Work in Design. CSCWD, 2019: 398-403.

[13] Zhang J, Bai W, Chen K. Enabling ECN for Datacenter Networks With RTT Variations[J]. IEEE Transactions on Cloud Computing, 2023,11(3): 2349-2364.

[14] Hu J, Zhou Z, Zhang J. Lightweight Automatic ECN Tuning Based on Deep Reinforcement Learning With Ultra-Low Overhead in Datacenter Networks[J]. IEEE Transactions on Network and Service Management, 2024: 1.

[15] 王瑞雪,熊学涛,翁思俊. 中国移动数据中心SDN网络架构及关键技术[J]. 移动通信, 2019,43(7): 7-12.

[16] Chen Z, Zhang M, Li G, et al. Poster: Chameleon: Automatic and Adaptive Tuning for DCQCN Parameters in RDMA Networks[C]//In Proceedings of the ACM SIGCOMM 2023 Conference. SIGCOMM, 2023: 1091-1093.

[17] Yin H, Liu P, Liu K, et al. ns3-ai: Fostering Artificial Intelligence Algorithms for Networking Research[C]//ACM International Conference Proceeding Series. WNS3, 2020: 57-64.

[18] Roy A, Zeng H, Bagga J, et al. Inside the Social Network's (Datacenter) Network[C]//Proceedings of the 2015 ACM Conference on Special Interest Group on Data Communication. SIGCOMM, 2015: 123-137. ★

扫描二维码，阅读下载本篇论文

★原文刊发于《移动通信》2025年第1期★

作者简介何升涛：中国地质大学（武汉）在读硕士研究生，研究方向为机器学习、强化学习等。李莹玉：副教授，现任职于中国地质大学（武汉）机械与电子信息学院，主要研究方向为下一代无线网络技术、机器学习与人工智能、联邦边缘智能和低碳网络智能等。张鹏：高级工程师，华中科技大学在读博士研究生，现任职于烽火通信科技股份有限公司，主要研究方向为光纤通信网络、网络管控、网络人工智能。高雅玙：华中科技大学电子信息与通信学院副教授，博士毕业于香港城市大学电机工程系，主要研究方向为下一代无线通信网络、频谱共享、网络智能等。刘焱：高级工程师，毕业于武汉大学，现任职于湖北华中电力科技开发有限责任公司，主要研究方向为大数据与智能电网，电力系统及其自动化等。俞亮：高级工程师，毕业于华中科技大学，现任职于湖北华中电力科技开发有限责任公司，主要研究方向为智能运维、数据库、信息通信技术等。许瀚：博士毕业于海军工程大学，现任职于湖北华中电力科技开发有限责任公司，主要研究方向为智能运维、云计算。朱锐：硕士毕业于比利时荷语鲁汶大学，现任职于湖北华中电力科技开发有限责任公司，主要研究方向为智能运维和机器学习。《移动通信》★往期推荐★

【25专题征稿】6G卫星互联网、语义通信、通感算一体化

《移动通信》杂志由中国电子科技集团公司主管，中国电子科技集团公司第七研究所主办，是中国期刊方阵“双效期刊”、工业和信息化部精品电子期刊、中国科技论文统计源刊、中国通信学会《信息通信领域高质量科技期刊分级目录》入选期刊、中国电子学会《电子技术、通信技术领域高质量科技期刊分级目录》入选期刊、中国应用型核心期刊、日本JST收录期刊。国内连续出版物号：CN44-1301/TN，国际连续出版物号：ISSN1006-1010，邮发代号：46-181。

来源：移动通信编辑部

标签：数据中心算法拥塞控制拥塞控制算法网络拥塞控制

本文地址：https://news.43u.com.cn/a/925485.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!