Scaling Law原来源于百度？！Anthropic创始人的爆料外网都震惊了

摘要：Dario Amodei是AI届的大牛，很多人知道他曾是OpenAI的初期员工，后来离开并创办Anthropic。事实上，Dario Amodei也是百度的“前员工”。

11月27日消息，“大多数人不知道，关于Scaling Law的原始研究来自2017年的百度，而不是2020年的OpenAI。”

近日一则上述内容刷爆AI圈子，引发对百度研究能力的赞叹。

而事情的起因，则是Anthropic创始人Dario Amodei在一档播客节目中爆料：最早在百度工作时发现Scaling Law。

Dario Amodei是AI届的大牛，很多人知道他曾是OpenAI的初期员工，后来离开并创办Anthropic。事实上，Dario Amodei也是百度的“前员工”。

公开资料显示，Dario Amodei于2014 年 11 月至2015 年 10 月期间在百度工作，当时他在百度硅谷人工智能实验室（SVAIL）工作，致力于将深度学习模型扩展到大规模高性能计算系统。

再回到这则爆料中，这里先介绍一下Scaling Law（尺度定律）：当模型的参数量、训练数据量和计算量增加时，模型的性能会按照一定的幂律关系提升‌。

如同芯片领域的从业者会以“摩尔定律”来理解、前瞻、指导芯片发展一样，Scaling Law被大语言模型（LLMs）研究者们认为是理解大模型发展的“金科玉律”，其重要性不言而喻。

这次Dario Amodei的爆料，可谓给Scaling Law的发现来了个“正本清源”，把百度推上了大模型研究先锋的位置上。

Anthropic创始人Dario
爆出Scaling Law“正源”

今年11月12日，在Lex Fridman的播客节目中，Anthropic的联合创始人&CEO Dario Amodei探讨了Claude、AI模型的扩展规律、AGI、AI未来等多个话题，其中，在谈到大模型的扩展规律（Scaling Laws）与模型发展，他提到“他的观察最早来自于此前在百度工作时对语音识别系统的研究。”

Dario Amodei称，2014年与吴恩达在百度研究AI的时候，他就已经发现了模型发展的规律Scaling Law，“随着你给它们提供更多数据，随着你让模型变大，随着你训练它们的时间越来越长，模型的表现开始越来越好。当时我并没有精确地衡量，但我和同事们都非常非正式地感觉到，给这些模型的数据越多、计算越多、训练越多，它们的表现就越好。”

后来在Open AI的GPT-1的语言模型中得到了验证。他认为，随着模型变得越来越大，它们能够捕捉到更复杂的语言和认知模式，这一规律不仅适用于语言模型，还适用于图像、视频等其他领域。

随着Dario Amodei的爆料，更多行业人士扒出了关于Scaling Law起源的线索。

一位Meta研究员再次发布推文爆料：