摘要:就在刚刚,计算机视觉领域代表人物何恺明最新官宣,已加入谷歌DeepMind,担任杰出科学家(Distinguished Scientist)。
就在刚刚,计算机视觉领域代表人物何恺明最新官宣,已加入谷歌DeepMind,担任杰出科学家(Distinguished Scientist)。
他在个人主页上表示,自己在 DeepMind 的工作是兼职,还将继续保留 MIT 终身副教授的身份。
图 | 何恺明更新个人主页(来源:何恺明)
何恺明是残差网络(ResNet)的主要发明人,而这项技术成为了深度学习及后续人工智能进步的基础。我们今天看到的 ChatGPT、AlphaGo、AlphaFold 都离不开它的影响。
根据《自然》杂志的统计,2016 年发表的 ResNet 论文是 21 世纪迄今为止引用量最高的论文——就连《注意力就是你所需要的一切》(Attention is all you need)这样的 Transformer 经典之作都不是它的对手。
图 |《自然》统计的 21 世纪论文引用量排名(来源:《自然》)
据了解,何恺明出生于 1984 年。2003 年,他获得了保送清华大学的资格,但依旧参加了高考并以 900 分满分成为了广东省高考状元。他本科就读于清华大学物理系基础科学班,之后前往香港中文大学攻读博士学位,并于 2011 年取得信息工程博士学位,师从汤晓鸥。
他在学术初期就展现出非凡的研究才能。早在 2009 年,他提出的“暗通道先验”(Dark Channel Prior)用于图像去雾,就已在国际顶级计算机视觉会议 CVPR 上获得最佳论文奖(第一位获得该奖项的华人),被认为是图像增强领域的重要突破。
图 | 何恺明获得的奖项(来源:何恺明)
博士毕业后,何恺明加入微软亚洲研究院(Microsoft Research Asia),在 2011 年至 2016 年期间担任计算机视觉研究员。也就是在微软的这段时间,他带领团队完成了日后被载入人工智能发展史的重要成果——残差网络 ResNet。
2015 年,何恺明及其团队提出了 ResNet 架构。这一架构通过引入“残差连接”概念,解决了神经网络随着层数增加而训练困难的问题,使得训练上百层的深度神经网络成为可能。
(论文链接:https://arxiv.org/pdf/1512.03385)
传统神经网络在变深之后常常会出现梯度消失,导致准确率下降,而ResNet 通过“跳跃式”连接,巧妙规避了这一瓶颈。
ResNet 横空出世后立即在各大视觉竞赛中大放异彩:152 层的 ResNet 模型在 2015 年的 ImageNet 挑战赛中包揽了图像分类、定位、检测三项冠军;同年还赢得了 COCO 图像识别与分割挑战的第一名。
微软 AI 官方博客称,这一架构成功攻克了超深网络训练不稳定的难题,堪称 AI 发展的“分水岭”。
ResNet 的影响远远超出计算机视觉。如今几乎所有深度学习模型都在不同程度上借鉴了 ResNet 的残差结构。
也正因如此,2023 年,何恺明及其团队获得了未来科学大奖(数学与计算机科学奖项),以表彰其在“深度残差学习”方面的开创性贡献。
2016 年,何恺明加入 Facebook AI Research(FAIR,现为 Meta AI),继续在计算机视觉领域深耕细作。2017 年,他又一项标志性成果诞生:Mask R-CNN。
这是在 Faster R-CNN 目标检测架构基础上的一次重要升级。Mask R-CNN 不仅能准确识别图像中的各类物体,还能为每个对象生成像素级别的精确轮廓。
(论文链接:https://arxiv.org/pdf/1703.06870)
这种实例分割(Instance Segmentation)能力对于自动驾驶、图像编辑、AR 等场景至关重要。该模型一经推出就迅速在 COCO 标准测试集上刷新多个指标,成为该领域的“黄金标准”。
除了检测与分割,何恺明在 Meta 还致力于推动“自监督学习”的研究。他与团队相继提出了MoCo(Momentum Contrast)和 MAE(Masked Autoencoder)等框架,显著提升了无监督视觉表征的质量。
这类技术如今已被广泛应用于数据稀缺场景,拓宽了 AI 模型的训练方式。
2024 年初,何恺明受聘为麻省理工学院(MIT)电子工程与计算机科学系终身副教授。
图 | 何恺明近年的讲座和开设课程(来源:何恺明)
入职 MIT 后,他开设了关于生成式模型与视觉学习的前沿课程,同时继续活跃于一线科研。
就在今年 2 月,何恺明带领三位大一新生提出了扩散模型新思路:扩散模型基础架构中的噪声调节,被广泛认为不可或缺的,但他们挑战了这一假设,并证明了去除噪声调节不仅可行,而且还能提升性。
目前他的论文总引用次数已超过 70 万次,在全球 AI 学术圈内影响深远。
显而易见,在加入 DeepMind 之后,我们一定会看到这位“学术+行业”的双料 AI 大牛带来影响更深远的成果。
参考资料:
来源:DeepTech深科技一点号