OpenAI与硅谷独角兽匆匆“分手”，DeepSeek 是始作俑者吗？

摘要：合作不到一年，人形机器人独角兽Figure AI创始人兼首席执行官 Brett Adcock 就于日前在 X 上发文，宣布终止与OpenAl的合作协议，并表示：“Figure在完全自主研发的端到端机器人AI方面取得重大突破，我们很高兴在接下来的30天内向你展示

OpenAI与合作伙伴之间处于既竞争又合作的矛盾关系。

文｜动点科技

作者｜黄尘

排版｜Miziko

本文预计阅读时长8分钟

合作不到一年，人形机器人独角兽Figure AI创始人兼首席执行官 Brett Adcock 就于日前在 X 上发文，宣布终止与OpenAl的合作协议，并表示：“Figure在完全自主研发的端到端机器人AI方面取得重大突破，我们很高兴在接下来的30天内向你展示一些从未在人形机器人上见过的东西。”

2024年2月底，估值达到26亿美元的Figure AI宣布与OpenAI合作开发面向人形机器人的下一代AI模型，OpenAI将结合自身研究与Figure AI在机器人软硬件方面的深入理解，帮助Figure AI的人形机器人提升处理和推理语言的能力。

然而在1月31日，OpenAI向美国专利商标局（USPTO）提交了一份涉及人形机器人的商标申请。而在去年11月，OpenAI还被曝正在重建曾在2020年解散的机器人团队。因此二者合作的破裂并不难理解。

OpenAI的“拧巴”

作为一家AI研究和部署公司，OpenAI对具身智能也保持着高度关注，除了与Figure AI的合作，还投资了具身智能初创企业1X和Physical Intelligence。

据了解，1X是一家总部位于挪威的实体机器人公司，主要应用于家庭场景，1X最新一代NEO产品已在欧洲和美国进行落地验证，相比早期EVE版本的轮足机器人，NEO双足人形机器人产品完成度更高。通过结合OpenAI的多模态大模型，让其在复杂的家庭场景下，具备了一定的泛化操作能力。

而Physical Intelligence则专注于研发能够驱动多功能机器人的人工智能（AI）模型和算法，致力于在实体世界中实现类似于ChatGPT在数字世界中所做到的变革。通过结合先进的AI技术和机器人硬件，Physical Intelligence旨在创造出能够自主学习、适应各种环境并执行复杂任务的智能机器人。

此前，有分析人士对此表示了担忧，一方面，硬件制造与软件开发之间存在明显差异，如何有效整合软硬件资源，实现技术上的无缝对接，是OpenAI需要面对的重要挑战；另一方面，OpenAI即是投资者，又是参与者，未来如何定位自己是一个需要思考的问题。如果进军人形机器人本体研发，那么OpenAI与合作伙伴之间将处于既竞争又合作的矛盾关系。

o1虽好，但使用成本高昂

从上个月开始，中国 AI 创业公司 DeepSeek 推出的 R1 模型抢走了 o1 的风头。R1 是一个高效的开源推理模型，全球任何人都可以免费获取、重新训练和定制，还可以在 DeepSeek 的网站和手机应用上免费使用。

DeepSeek R1 采用宽松的 MIT 许可协议，提供免费的应用和网站服务，并开放代码供人修改，这导致其在消费者和企业市场迅速走红。就连 OpenAI 的投资方微软和 Anthropic 的支持者亚马逊也急于将其变体引入自家云市场。AI 搜索公司 Perplexity 也迅速为用户添加了 R1 的变体版本。

微软1月30日发文宣布DeepSeek R1现已在Azure AI Foundry和GitHub上提供。微软CEO纳德拉在近日的财报电话会议上表示，DeepSeek-R1模型目前已可通过微软的AI平台Azure AI Foundry和GitHub获取，并且很快就能在微软布局的Copilot+PC上运行。

2月1日，OpenAI推出了 o3-mini，这是其新一代”推理器”系列的第二款模型。o3-mini 现已在 ChatGPT (包括免费版) 和 OpenAI 的 API 上线，比此前的高端模型 o1 及其精简版 o1-mini 更便宜、更快、性能更强。

OpenAI 在去年年底推出的 o3模型被认为是其最强大的人工智能产品，但其运行成本极其高昂，单次任务费用超过1000美元。即使是低计算版本的 o3，其在基准测试中得分达到了76%，但每个任务的成本也达到了约20美元，虽然相对而言仍算是个相对便宜的选择，但与其前代产品相比仍然贵了好几倍。

据悉，DeepSeek-R1的API定价低至每百万tokens输入1元，仅为OpenAI的3%。社交平台X的用户Shubham Saboo称：“DeepSeek R1 100%开源，比OpenAI o1便宜96.4%，同时提供类似的性能。OpenAI o1每1M输出Token为60美元，而DeepSeek R1每1M输出Token为2.19 美元。拥有200美元ChatGPT订阅的人，请仔细考虑一下。”DeepSeek R1的性价比引发了人们对OpenAI投资回报率的怀疑。

具身智能究竟需要怎样的大模型

斯坦福大学计算机科学教授李飞飞曾指出，具身智能是 AI 领域的下一个“北极星问题”之一，它能够在虚拟世界中探测和改变自身环境，与周围环境交互，学习复杂的类人任务。

而具身智能的实现，核心就在于大模型。此前，惊艳亮相的Figure 02，其语音交互能力是基于OpenAI为其定制的大模型实现的。合作骤然破裂，必然有迹可循。

据TechCrunch报道，Figure AI创始人兼首席执行官 Brett Adcock表示，合作的关键问题在于整合。OpenAI是一家规模庞大的公司，拥有庞大的业务范围和相应的智能模型。将人工智能嵌入机器人等实体的具身智能并非这家ChatGPT制造商的关注重点。Adcock认为，正确的解决方案是建立一个端到端的人工智能模型，为特定硬件提供动力。“我们发现，要在现实世界中大规模解决具身智能，必须垂直整合机器人AI。”Adcock表示，“我们不能外包人工智能，就像我们不能外包硬件一样。”

据了解，实现具身智能有两种路径，一种是分层决策，另一种是端到端的神经网络系统。Figure AI在与OpenAI合作时采用的是前者，通过不同的神经网络协作，去提高系统的灵活性和实时响应能力。

而端到端架构则通过单一神经网络，将输入任务直接映射为控制信号，形成从输入到输出的无缝连接。但这种模式需要通过海量数据驱动。

2024年6月，智元机器人决定研发机器人具身智能大模型。为了提升机器人的泛化能力，并适应复杂的环境，智元机器人创始人彭志辉曾预计在2024年下半年智元会有百台以上自由部署机器人专门用来做端到端的数据采集，同时，AIDEA平台也计划在同年第四季度对外上线。

乐聚机器人董事长冷晓琨告诉动点科技记者：“分层决策和端到端模型在具身智能的实现中各有优势，未来可能会呈现融合发展的趋势。理想情况下，合理的分层决策模型应该更加节能高效。就跟人一样，大脑不应该将算力浪费在计算低层级的运动控制反馈或肌肉关节层面的运动跟踪上。算力消耗等同于能源，因此避免不必要的计算十分关键。大家担心的是，不恰当的分层解耦可能会在信息传输过程中造成限制，导致模型泛化能力不足。但这只是分层设计缺陷的问题，所以目前我们还不会去做直接的端到端。”