DeepSeek的“Aha一刻”开辟新思路,对AI巨头意味着什么?

360影视 2025-01-30 16:38 2

摘要:中国人工智能初创公司DeepSeek引领的强化学习和小模型发展的技术创新震撼了全球市场,这一新思路可能引来大量初创公司的效仿,让“巨额现金储备能创造无可争议的优势”这一论点变得更为复杂。而这对于人工智能巨头意味着什么?

中国人工智能初创公司DeepSeek引领的强化学习和小模型发展的技术创新震撼了全球市场,这一新思路可能引来大量初创公司的效仿,让“巨额现金储备能创造无可争议的优势”这一论点变得更为复杂。而这对于人工智能巨头意味着什么?

就在硅谷对DeepSeek“Aha一刻”(“顿悟一刻”)的热议声中,当地时间1月29日,Meta和微软两家人工智能巨头公司公布了新一季度财报,两家公司的高管都在财报会上提及DeepSeek。截至目前,Meta并未削减与人工智能投入相关的支出,并计划今年向AI投入600亿至650亿美元。微软表示AI成本下降将是趋势,该公司还预计2026财年资本支出增长率将低于2025财年。

投资基础设施是一种“战略优势”

Meta首席执行官马克·扎克伯格周三表示,现在判断DeepSeek的突破性AI模型将对Meta及更广泛的科技行业产生何种影响还为时过早。

扎克伯格还强调,对于大型企业而言,随着时间的推移,在资本支出和基础设施上进行大量投资将成为一种“战略优势”。“我敢打赌,构建这种基础设施的能力将是一个主要优势。”他说道。

“虽然公司最终可能需要更少的计算资源来训练这些强大的模型,但当软件在实际运行和执行操作时,拥有大量的服务器的能力可能是必要的,这将有助于实现更高水平的智能和更高质量的服务。”扎克伯格在与分析师讨论DeepSeek的最新进展时表示。

他进一步称,为所有人提供服务的成本会很高。以Meta为例,该公司第四季度日活用户数量超过33.5亿。

扎克伯格的表态与此前OpenAI的CEO奥尔特曼以及Meta首席AI科学家Yann LeCun的表态相呼应。奥尔特曼称,计算资源“现在比以往任何时候都更加重要”。LeCun也表示:“为数十亿人提供AI助理服务仍需要大量计算能力。”

DeepSeek已经证明构建尖端AI模型所需的资金和计算资源比之前预计的可以少得多。但Meta的最新财报中仍然计划今年向AI投入600亿至650亿美元,2025财年的总支出预计将超过1140亿美元。Meta股价当天收盘上涨2%。

扎克伯格称,Meta仍在消化DeepSeek的一些“惊人之举”,他的团队希望最终将其中的一些进步应用于Meta自己的AI项目。

“Meta将从DeepSeek等技术中继续学习,并不断优化发布自己的免费开源AI模型Llama,以推动行业发展。”扎克伯格说道。

同日,微软也发布了最新季度财报。微软此前已经承诺将在本财年为人工智能数据中心预留800亿美元的支出。对此,微软首席执行官萨蒂亚·纳德拉表示,这笔支出是为了克服阻碍微软利用人工智能的能力的产能限制。

纳德拉在与分析师的电话会议上表示:“随着人工智能变得更加高效和普及,我们将看到需求呈指数级增长。”不过该公司预计支出将在7月1日开始的2026财年逐渐放缓。

微软首席财务官Amy Hood表示,该公司本季度和下一季度的资本支出将保持在第二季度约226亿美元的水平。“在2026财年,我们预计将继续在强劲需求信号下进行投资。不过,增长率将低于截至6月底的2025财年。”她说道。

无论是Meta还是微软,在人工智能巨额支出面前,缺乏回报是资本市场最大的担忧。微软股价在盘后交易中下跌超过5%。微软财报显示,Azure云业务增长低于预期。

Futurum Group分析师Daniel Newman表示:“由于这些巨额支出,他们需要在创收方面加大力度,但我认为就目前的人工智能而言,资本支出过多,消费不足。”

周三微软公布季度业绩后,纳德拉在投资者电话会议上表示:“DeepSeek确实有一些创新。显然,现在一切都商品化了,它将得到广泛应用。”

他还表示,为了扩大AI的应用,微软与OpenAI合作做了很多工作。纳德拉补充说道:“仅仅发布最好的新模型是不够的。你必须让它具有成本效益。如果服务成本太高,那就不好了。”

“Aha一刻”或引众创新公司效仿

DeepSeek的AI模型之所以能举世瞩目,是因为该公司采用了创新技术开发了一种在有限人工干预下进行训练的人工智能模型,AI的这一“顿悟时刻”可以降低开发人员基于该技术构建“杀手级”应用程序的成本。

DeepSeek表示,当模型重新评估答案并调整处理时间以解决不同问题时,它发现该模型出现了该公司所谓的“顿悟时刻”。DeepSeek的创建者在他们的研究论文中写道:“‘顿悟时刻’有力地提醒了我们,强化学习有可能在人工智能系统中解锁新的智能水平,为未来更加自主和自适应的模型铺平道路。”

让聊天机器人生成更有用的响应的一种方法是“从人类反馈中强化学习”(RLHF),这是OpenAI为改进ChatGPT而首创的一种技术。但这一步通常费力、昂贵且耗时,通常需要一支人工数据标记员队伍。DeepSeek 的重大创新是使用一种称为强化学习(RL)的技术来自动化这最后一步。

人工智能研究公司Hugging Face研究员Lewis Tunstall表示:“要实现这一目标,秘诀似乎就是拥有一个非常强大的预训练模型,然后拥有非常好的基础设施来大规模进行强化学习过程。”

“智能的秘诀非常简单。”Hugging Face联合创始人兼首席科学官Thomas Wolf表示,“DeepSeek的技术已被该领域的其他人所理解,我预计很多团队可以重复它们的工作。”

有AI专家认为,DeepSeek展示了“真正的创新”,而且该公司在技术上采取透明的策略,公开详细的技术报告,概述它是如何构建推理模型的做法值得称赞。

英国剑桥大学首任DeepMind机器学习教授Neil Lawrence表示,DeepSeek发布的模型可能只是“冰山一角”。“历史表明,大公司在扩大规模时很难创新,我们从许多大公司看到的是用计算投资取代智力上的辛勤工作。”他说道。

TechInsights分析师G Dan Hutcheson在一份报告中称:“我不认为DeepSeek最有可能威胁英伟达,而应该更会影响到试图靠卖人工智能产品来赚钱的公司,比如OpenAI。”

此前,英特尔前CEO帕特·基辛格(Pat Gelsinger)在LinkedIn帖子中表示:“市场的反应是错误的,降低AI成本将扩大市场应用。DeepSeek是一项令人难以置信的工程,将引领AI更广泛地被采用。”

来源:第一财经

相关推荐