字节与港科最新研究成果入选SIGCOMM 25,聚焦超低延迟交互

360影视 欧美动漫 2025-05-19 18:56 2

摘要:近日,ACM SIGCOMM正式公布今年的入选论文,字节跳动旗下的火山引擎多媒体实验室与香港科技大学合作的论文“ACE: Sending Burstiness Control for High-Quality Real-time Communication”成

前言

近日,ACM SIGCOMM正式公布今年的入选论文,字节跳动旗下的火山引擎多媒体实验室与香港科技大学合作的论文“ACE: Sending Burstiness Control for High-Quality Real-time Communication”成功入选,该论文也是多媒体实验室团队首次在 SIGCOMM 被录用的长文。此次SIGCOMM的投稿数量超过400篇,投稿量相比往年增加了25%,录用难度相比往年进一步增加。

PART 01

会议介绍

ACM SIGCOMM是计算机网络领域资历最老的顶会之一,位列网络通信领域会议之首,对论文的质量和数量要求极高,入选论文要求具有本质性贡献、领导性影响和系统性工作。由SIGCOMM录用的论文大多数都会被长期广泛引用,具有非常大的影响力,从计算机教科书里的TCP协议到云数据中心里的软件定义网络(SDN),SIGCOMM见证了众多计算机网络技术诞生,显著推动了网络领域的发展。

PART 02

论文亮点

本次字节跳动入选论文聚焦于超低延迟传输技术的应用和创新,针对视频编码突发流量引起的长尾排队问题,提出了细粒度的流量突发控制方案ACE,可将用户交互长尾延迟降低43%,对于迈入几十毫秒级交互应用具有较大应用潜力。下面让我们更深入了解一下这项工作的技术亮点。

研究问题

高质量的实时通信(RTC)系统要求在保证高视觉质量的同时实现超低交互延迟。网络基础设施(如边缘服务器、5G)的发展已将网络往返时间缩短至30毫秒以下,却仍然无法满足用户需求,如远程操作、云游戏和虚拟现实等应用仍会经常遇到卡顿问题。

在现代RTC系统中,影响交互延迟一个关键瓶颈是视频编码器与网络之间的速率控制延迟。由于应用画面持续在变化,顺序编码的视频帧通常会产生突发的数据流量,尤其在高画质视频场景突发问题可能会变得非常严重,直接将突发流量发送到网络会增加网络过载的风险。

现有方案通过在数据包发送时增加稳定的报文发送间隔来缓解视频数据突发,即我们通常所说的Pacing,但其额外引入的速率控制延迟通常无法被超低延迟应用接受。

Pacing延迟在高端到端延迟情况下占主导地位

ACE核心创新点

ACE分别从速率控制缓冲区的出队和入队两个角度入手管理速率控制延迟问题。从出队角度来看发送模式应进行自适应调节,以最小化由突发性引起的网络过载、减少不必要的速率控制延迟。从入队角度来看编码器必须尽可能平滑地生成视频帧,避免生成过大的帧。 ACE包含两个核心设计:

(1) 突发自适应速率控制(ACE-N):ACE-N通过细粒度的数据包到达模式估计网络缓冲区占用情况,来观察网络缓冲区的状态,并基于此调整令牌桶速率控制器的桶大小使其适应网络状况。通过仔细管理突发传输,使得在不使网络过载的有限程度内允许突发传输,同时避免不必要的缓冲区排队延迟。

(2)复杂度自适应编码(ACE-C):现有的解决方案通过牺牲视觉质量来缓解超大帧的问题,这对于高质量的RTC应用来说是不可接受的。ACE-C通过权衡视频编解码器中复杂度和帧大小来避免这个问题。通过自适应地调整编码复杂度,ACE-C在不降低画面质量的情况下实现了更平稳的视频帧生成。

ACE 概览:ACE-C和ACE-N实现了对发送模式的双重控制

PART 03

团队介绍

火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际标准化工作,其众多创新算法及软硬件解决方案已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。实验室成立以来,多篇论文入选国际顶会和旗舰期刊,并获得数项国际级技术赛事冠军、行业创新奖及最佳论文奖。

来源:字节跳动技术团队

相关推荐