摘要:这份统计是基于全球 4 万多名作者 13008 份投稿结果产生的。相比往年,今年的投稿数量增长了 13%,最终有 2878 篇论文被接收,整体接收率为 22.1%。
机器之心报道
机器之心编辑部
当今计算机视觉领域最热门的三个方向。
当今计算机视觉领域最热门的话题有哪些?
基于多视角与传感器的 3D 技术;图像与视频合成;多模态学习,视觉、语言和推理。这份统计是基于全球 4 万多名作者 13008 份投稿结果产生的。相比往年,今年的投稿数量增长了 13%,最终有 2878 篇论文被接收,整体接收率为 22.1%。
「我们已经处于这种指数级增长态势一段时间了,」CVPR 2025 联合主席 Phillip Isola 解释道。「AI 领域举足轻重,正是因为如此,学生们攻读相关学位的人数在增多。因此,这个研究群体正变得越来越庞大。」
但除了这一总体趋势之外,深入研究该顶会还会发现,社区关注的领域很局限。特定领域的进展已经让位于新的研究重点,吸引了更多关于新主题的论文。
具体来说,有三个领域正在成为 2025 年的热门方向:
多视角与传感器 3D 技术
多视角和传感器 3D 技术为 CVPR 带来了大量的投稿,其原因很简单:基于图像的研究已经从探索单幅图像或 2D 渲染发展到更复杂的 3D 评估领域。2020 年 NeRF 的推出,开辟了新的研究方向。
「自 2020 年 NeRF 论文首次发表以来,利用深度网络进行 3D 重建已成为趋势。如今高斯泼溅(Gaussian splatting)技术进一步推动了这一发展,」CVPR 2025 程序联合主席、美国俄勒冈州立大学副教授 Fuxin Li 分享道,「本质上,计算机视觉与图形学正在融合。神经渲染研究的兴起,显著推动了 3D 相关论文数量的增长。」
图像与视频合成
随着研究的不断发展,学界现在能够通过视频和图像形式更精确地呈现环境信息。对该领域的探索已成为 CVPR 2025 论文的焦点,图像和视频合成成为今年大会上最大的类别之一。
「今年商业聊天机器人的一大趋势是它们已经实现了多模态化;它们现在不仅能分析和生成文本,还能分析和生成图像,有时还能生成视频,」Isola 解释道。「即将出现的能力是生成完整的交互式世界。CVPR 上展示的图像、视频和世界合成方法正在为这类技术铺平道路。」
AI 生成的威尔史密斯吃意面
多模态学习,视觉、语言和推理
虽然在征文通知中,这两个主题被列为两个独立的研究主题,但合并起来,它们构成了提交论文数量最多的类别之一。这些领域的个人研究数量或许预示着今年会议值得关注的新趋势。
鉴于论文接受率徘徊在极低的 22%,因而每一篇入选 CVPR 的论文都堪称经典。尽管投稿内容反映了学界对特定领域的研究热情,但大会主席强调,CVPR 是该领域伟大的平衡杠杆,它关注值得认可的研究,而非那些声势最大的团队。
「CVPR 在扩大领域声音方面发挥着非常重要的作用,而不仅仅是来自大型机构的声音,」Fuxin Li 总结道。「在 CVPR,每篇论文都有同等的权利。如果是 poster,那就是 poster。如果是 oral,那就是 oral。你是谁并不重要。这一点对计算机视觉领域的生态系统至关重要。」
在 AI 领域飞速发展的今天, 研究热点瞬息万变。大家一股脑的押注最热门方向, 外加投稿数量逐年增多,只能说,想中一篇顶会真是太难了。
CVPR 2025 即将召开,值此盛会,机器之心将在北京举办一场 CVPR 2025 论文分享会,欢迎大家报名参与。
报名链接:https://wj.qq.com/s2/22041284/tjnc/
参考链接:https://cvpr.thecvf.com/Conferences/2025/News/Paper_Trends
来源:机器之心Pro一点号