4万作者挤破头，CVPR 2025官方揭秘三大爆款主题，你卷对方向了吗

摘要：这份统计是基于全球 4 万多名作者 13008 份投稿结果产生的。相比往年，今年的投稿数量增长了 13%，最终有 2878 篇论文被接收，整体接收率为 22.1%。

机器之心报道

机器之心编辑部

当今计算机视觉领域最热门的三个方向。

当今计算机视觉领域最热门的话题有哪些？

基于多视角与传感器的 3D 技术；图像与视频合成；多模态学习，视觉、语言和推理。

这份统计是基于全球 4 万多名作者 13008 份投稿结果产生的。相比往年，今年的投稿数量增长了 13%，最终有 2878 篇论文被接收，整体接收率为 22.1%。

「我们已经处于这种指数级增长态势一段时间了，」CVPR 2025 联合主席 Phillip Isola 解释道。「AI 领域举足轻重，正是因为如此，学生们攻读相关学位的人数在增多。因此，这个研究群体正变得越来越庞大。」

但除了这一总体趋势之外，深入研究该顶会还会发现，社区关注的领域很局限。特定领域的进展已经让位于新的研究重点，吸引了更多关于新主题的论文。

具体来说，有三个领域正在成为 2025 年的热门方向：

多视角与传感器 3D 技术

多视角和传感器 3D 技术为 CVPR 带来了大量的投稿，其原因很简单：基于图像的研究已经从探索单幅图像或 2D 渲染发展到更复杂的 3D 评估领域。2020 年 NeRF 的推出，开辟了新的研究方向。

「自 2020 年 NeRF 论文首次发表以来，利用深度网络进行 3D 重建已成为趋势。如今高斯泼溅（Gaussian splatting）技术进一步推动了这一发展，」CVPR 2025 程序联合主席、美国俄勒冈州立大学副教授 Fuxin Li 分享道，「本质上，计算机视觉与图形学正在融合。神经渲染研究的兴起，显著推动了 3D 相关论文数量的增长。」

图像与视频合成

随着研究的不断发展，学界现在能够通过视频和图像形式更精确地呈现环境信息。对该领域的探索已成为 CVPR 2025 论文的焦点，图像和视频合成成为今年大会上最大的类别之一。

「今年商业聊天机器人的一大趋势是它们已经实现了多模态化；它们现在不仅能分析和生成文本，还能分析和生成图像，有时还能生成视频，」Isola 解释道。「即将出现的能力是生成完整的交互式世界。CVPR 上展示的图像、视频和世界合成方法正在为这类技术铺平道路。」