OpenAI前华人副总裁翁荔自曝公司首个产品?公司估值或达百亿

360影视 日韩动漫 2025-05-27 19:44 3

摘要:前 Open AI 华人副总裁、如今的 Thinking Machines Lab 联合创始人 Lilian Weng (翁荔),在 26 日转发了一个看似仪表盘的装置,迅速引起了广泛关注。

前 Open AI 华人副总裁、如今的 Thinking Machines Lab 联合创始人 Lilian Weng (翁荔),在 26 日转发了一个看似仪表盘的装置,迅速引起了广泛关注。

据推测,这可能是 Thinking Machines Lab 即将推出的首款硬件产品—— 一款专为 AI 训练设计的 “手动调参仪表盘”,旨在让研究人员在训练过程中直接手动调整超参数。

若这一概念得到广泛应用,将对 AI 领域带来深远影响。

Lilian Weng 转发该视频并评论称:“总有一天我们会涉足硬件领域,而现在就是时候了。”

要了解这一硬件对 AI 训练的影响,就要先理解什么是超参数。

简单来说,超参数是 AI 训练的宏观调控者,它们不直接参与模型内部的学习,更像一个总指挥,决定了模型如何学习、学多快、学成什么样。

选对了超参数,模型就能学得又好又快;选错了,模型的学习效果就会大打折扣

因为超参数在训练开始前就需要手动设定,十分依赖研究人员本身的经验和直觉,调整参数的过程,随着模型复杂度的增加,超参数的数量也可能非常多,导致搜索空间呈指数级增长,手动尝试所有组合几乎不可能。

此前一名 Thinking Machines Lab 员工就爆料,自己在Character AI时,调参的工作是由 Character 的创始人 Noam Shazeer 来手动调到正确的值。

Noam Shazeer

这位 Noam Shazeer 是人工智能领域的顶尖专家, Transformer 论文八子之一,2012年离开谷歌后创办 Character AI ,后来谷歌为了挖他重回公司,不惜豪掷 27 亿美金买下了整个初创团队。

由此可见调整超参数对个人的能力十分依赖,哪怕利用算法自动搜索最佳组合,也面临着计算成本高昂、“黑箱”等问题,即使找到了更好的组合效果,研究人员也不理解为什么某些组合效果更好。

若翁荔的“手动调参仪表盘”这一概念成功落地,将打破传统的 AI 训练方式,不仅能大幅提升研发效率和迭代速度,实现实时反馈,快速试错,还能减少资料浪费,增强研究人员的直观理解,对整个 AI 技术的研发和应用都有积极意义。

翁荔这个名字,在 AI 界大有来历,她早年加入 Open AI ,从元老级别员工一路走来掌管安全团队,成为职位最高的华人科学家之一。

翁荔毕业于北京大学信息系统与计算机科学专业,后在印第安纳大学伯明顿分校取得博士学位。

2017 年加入 Open AI 后,她最初在机器人团队工作,并领导了开创性的项目,成功教会机械手解决魔方问题,为复杂机器人任务的算法训练奠定了坚实基础

2021年,随着 Open AI 转向大语言模型,翁荔帮助组建并领导了应用 AI 研究团队,不仅推动模型开发,主导了API微调、嵌入工具、内容审核及应用安全框架等关键系统的开发,还显著提升了OpenAI API的性能、实用性与安全性。

GPT-4 发布后,她带领 80+顶尖科学家和工程师,统一了 Open AI 安全工作,为 AI 安全设定了基准,从平衡的安全政策、改进的模型鲁棒性到开发出 OpenAI 迄今为止最安全的模型(o1-preview),该模型在保持实用性的同时能够抵抗对抗性攻击。

让翁荔在业内打响名头的是《LLM Powered Autonomous Agents》一文,这篇文章系统总结了大语言模型的智能体现状,是现在爆火的 AI Agent 领域的入门必读论文。

著名的Agent公式也由她首次提出:Agent=大模型+记忆+主动规划+工具使用,为 AI 的研究和应用提供了重要的理论支持。

2024年11月,翁荔正式从工作了 7 年的 OpenAI 离职,众人猜测其去向时,一则 OpenAI 的前首席技术官组建的新公司浮出水面。

今年2月19日,OpenAI的前首席技术官Mira Murati宣布已与几位在Chatgpt Maker工作的高管联手开设了一家新的人工智能创业公司,其中就有翁荔的身影。

Mira Murati不仅是OpenAI的前首席技术官。2023年11月,在OpenAI创始人Sam Altman被罢免时,还曾短暂做过OpenAI的首席执行官。并且她还被《时代》杂志称为“ChatGPT的创造者”。

而Mira Murati带头成立的这家创业公司就是——Thinking Machines Lab。

Thinking Machines Lab定位为一家人工智能研究和产品公司,公司致力于构建一个让每个人都能获得知识和工具的未来,让人工智能满足他们独特的需求和目标。

据Mira介绍,他们正在构建三件事:

1、帮助人们调整AI系统以满足他们的特定需求;

2、开发强大的基础模型以构建更强大的AI系统;

3、培养开放的科学文化,帮助整个领域理解和改进这系统。

Mira称他们的目标很简单,通过坚实的基础、开放的科学和实际应用,使人工智能变得广泛实用且易于理解,从而推动人工智能的发展。

根据Thinking Machines Lab博客文章中列出29名团队成员,阵容堪称豪华,21人均曾在OpenAI工作。

其中包括翁荔在内的4位华人,以及前OpenAI研究副总裁Barret Zoph和前OpenAI联合创始人John Schulman。

在4位华人中,除了翁荔之外,还包括刘瀛海(Yinghai Lu)、Stephen Chen和Randall Lin。

刘瀛海本博分别毕业于同济复旦,ML系统工程师,曾领导OpenAI和Meta各种推理工作。

Stephen Chen专注于数据中心和AI基础设施领域,曾Google、Meta工作,独立完成国Facebook代码库兼容Arm的工作。

尽管尚未发布产品,豪华的明星阵容已吸引资本迅速增加投入。

4月11日,路透社援引知情人士透露报道,硅谷风险投资公司 Andreessen Horowitz正在洽谈领投该公司的一轮超大规模早期融资。消息人士称,在本轮融资中的估值可能达到 100亿美元。

若“手动调参仪表盘”概念属实,Thinking Machines Lab 或将吸引更多资本关注,引起一场 AI 界的海啸。

来源:卓乎科技一点号

相关推荐