吴恩达力挺DeepSeek:成本下降将让AI应用迎来爆发

360影视 2025-01-31 15:13 2

摘要:围绕着 DeepSeek 的风暴还在持续。在最初的震动过后,美国科技界开始对 DeepSeek 发起了前所未有的猛烈抨击。特朗普的 AI 事务主管 David Sacks 声称掌握“确凿证据”,指控 DeepSeek 利用 OpenAI 的模型输出数据开发技术

围绕着 DeepSeek 的风暴还在持续。在最初的震动过后,美国科技界开始对 DeepSeek 发起了前所未有的猛烈抨击。特朗普的 AI 事务主管 David Sacks 声称掌握“确凿证据”,指控 DeepSeek 利用 OpenAI 的模型输出数据开发技术。紧随其后,微软研究人员指出 DeepSeek 相关人员曾在去年秋天大规模提取 OpenAI 的 API 数据。Anthropic CEO Dario Amodei 更是发出万字檄文,呼吁美国加强对华芯片出口管制。

在这片口诛笔伐的声浪中,AI 领域泰斗、谷歌大脑联合创始人吴恩达(Andrew Ng)发文力挺这家中国 AI 初创企业,认为其释放的开源模型 DeepSeek-R1 不仅标志着中国在生成式 AI 领域迅速追赶上美国,更预示着 AI 行业格局正在发生深刻变革。

图丨相关推文(来源:X)

“DeepSeek 让许多人认识到几个一直存在但被忽视的重要趋势,”吴恩达在社交媒体上表示。他指出,首先是中国在生成式 AI 领域正在快速追赶美国。自 2022 年 11 月 ChatGPT 发布以来,中国与美国在该领域的差距已经显著缩小。通过 Qwen、Kimi、InternVL 和 DeepSeek 等模型的持续突破,中国企业展现出强大的创新能力,在视频生成等特定领域甚至已经实现了局部领先。

更重要的是,DeepSeek-R1 采用了开放权重模型,并采用 MIT License。吴恩达认为,这一开源策略对比部分美国公司以“人类灭绝”等假设性 AI 风险为由试图限制开源的做法,具有重要意义。“如果美国继续阻碍开源发展,中国将主导 AI 供应链的这一重要环节,许多企业最终将不得不使用更多体现中国价值观的模型,”他警告道。

而开放权重模型正在使基础模型层商品化。相比 OpenAI 的 o1 模型每百万输出 token 收费 60 美元,DeepSeek R1 仅需 2.19 美元,降幅接近 30 倍。这一价格优势正在改变 AI 基础模型的商业化前景。如吴恩达所说:“基础模型训练和 API 接口销售是一个充满挑战的业务,许多公司仍在寻找收回巨额训练成本的途径。相比之下,在基础模型之上构建应用则蕴含着巨大的商业机会。既然其他公司已经投入数十亿美元训练这些模型,开发者现在只需几美元就能构建客服聊天机器人、邮件摘要、AI 医生、法律文档助手等各种应用。”

另一方面,DeepSeek 的成功也挑战了“规模至上”的传统思维。作为早期支持扩大模型规模的倡导者,吴恩达坦言目前行业过度关注规模扩张,忽视了其他创新路径。DeepSeek 团队在美国 AI 芯片禁运的压力下,不得不在较低性能的 H800 GPU 上训练模型,这反而推动了算法优化的突破。据报道,其模型训练的纯计算成本不到 600 万美元。

这一突破已经开始影响全球科技巨头的战略。苹果 CEO 蒂姆·库克在最新财报电话会议上评价说:“总的来说,我认为推动效率提升的创新是好事,这正是你在该模型中看到的。”虽然库克表示苹果采取“谨慎和深思熟虑”的 AI 支出策略,但他认可 DeepSeek 展现的创新价值。

事实上,DeepSeek 的出现可能为苹果带来新的机遇。

尽管 Apple Intelligence 功能的推出尚未带来预期中的 iPhone 销量提升——上季度销量较去年同期略有下降,但库克表示,在已推出 AI 功能的地区,销售表现明显强于未推出地区。与此同时,苹果也在 AI 功能的应用上遇到挑战,本月早些时候不得不暂停新闻文章 AI 摘要功能,原因是该功能产生了误导性标题。

彭博社认为,更低成本的 AI 模型有望推动应用创新和 iPhone 换机潮。Parnassus 投资公司投资组合经理 Andrew Choi 指出:“AI 成本的下降意味着我们可能即将迎来应用创新和 AI 采用的 S 型曲线,如果这种情况发生,看多苹果的理由就不言自明了。”

实际上,一批 AI 应用商和云服务商已经或即将引入 DeepSeek 模型。微软率先在其 Azure AI Foundry 平台和 GitHub 上集成了 DeepSeek-R1 模型,并表示经过了“严格的红队测试和安全评估”。亚马逊 AWS 迅速跟进,通过 Bedrock 和 SageMaker AI 两大平台提供全方位的 DeepSeek 部署方案,支持从简单的 API 调用到深度定制的各类需求。英伟达也已将 DeepSeek-R1 上线至其 NIM 平台。英伟达官方甚至评价称,DeepSeek-R1 是“具有最先进推理能力的开源模型”。

而 AI 应用领域,除了代码助手 Cursor,AI 搜索引擎 Perplexity 也宣布接入了 DeepSeek 模型,将其与 OpenAI 的 GPT-o1 和 Anthropic 的 Claude-3.5 并列作为高性能选项。AI SaaS 公司 Service Now 在最新的财报会议上表示,DeepSeek 这一模型的出现于他们而言说一个“巨大利好”,并透露团队已开始部署。对于这类处于应用层的服务商而言,DeepSeek 带来的成本优势无疑为其提供了新的增长想象空间。

图丨相关推文(来源:X)

这种趋势印证了吴恩达的判断:虽然尚不确定模型的效率提升是否会真正减少对计算资源的总体需求,但从长远来看,人类对智能和计算的需求实际上是没有上限的。“即使智能变得更便宜,我仍然看好人类会使用更多智能,”他表示,“DeepSeek-R1 的影响已超越技术层面,具有深远的地缘政治意义。对 AI 应用开发者来说,这是前所未有的机遇。我的团队已经在构思一些新想法,这些想法之所以成为可能,正是因为我们可以轻松访问开放的高级推理模型。这仍然是构建 AI 应用的最佳时机!”

随着 AI 技术持续演进,DeepSeek 带来的效率革命或将重塑整个行业格局。开源降本是否会像吴恩达预期的那样带来创新浪潮,值得持续关注。

参考资料:

1.https://x.com/AndrewYNg/status/1885033810552905814

2.https://techcrunch.com/2025/01/30/apple-ceo-says-deepseek-shows-innovation-that-drives-efficiency/

3.https://www.bloomberg.com/news/articles/2025-01-30/apple-s-flagging-ai-hopes-get-revival-from-deepseek-s-emergence?srnd=phx-technology

运营/排版:何晨龙

来源:DeepTech深科技

相关推荐