能折纸，还会灌篮！谷歌发布机器人基座大模型，大幅强化机器人通用性

摘要：3月12日，谷歌旗下的DeepMind公司发布了全新的AI模型，名为Gemini Robotics和Gemini Robotics-ER。这套模型号称能让机器人更好地适应复杂环境，完成各种高难度任务。

通用型机器人发展史上的又一个“里程碑”来了。

3月12日，谷歌旗下的DeepMind公司发布了全新的AI模型，名为Gemini Robotics和Gemini Robotics-ER。这套模型号称能让机器人更好地适应复杂环境，完成各种高难度任务。

截至昨日，谷歌母公司Alphabet Class C股价收盘小幅上涨1.82%，收于169.00美元。

机器人也能折纸、整理桌面、灌篮？谷歌DeepMind展示不俗实力！

DeepMind这次发布的AI模型进一步升级，经过新模型训练的机器人，不仅能流畅地折叠纸狐狸。

还能按照语音指令整理桌面。

甚至还能熟练地拉开拉链。

最后还能来个迷你篮球灌篮！

DeepMind还和初创公司Apptronik合作，计划用这项技术打造人形机器人。

X网友表示未来机器人管家真的不是梦了，想喝咖啡让机器人帮忙做一杯。

以往，机器人的动作都需要科学家手动编程，费时费力。现在，得益于新的AI技术，机器人能更好地适应环境，学习新技能的速度也大大加快。Google DeepMind的首席软件工程师Kanishka Rao表示:

Gemini Robotics的通用性是之前最好模型的两倍，真正实现了向通用型机器人的重大飞跃。

Gemini Robotics：让机器人更聪明、更灵活

据悉，Google利用其Gemini 2.0语言模型，专门训练了用于控制机器人的模型。这使得机器人拥有了三大“超能力”：

环境适应能力：能快速适应各种新情况。指令理解能力：能迅速响应口头指令或环境变化。操作灵活性：拥有足够的手部灵巧性来操作物体。

这种能力对于机器人技术的发展至关重要，因为机器人之前在实验室表现出色，但在非受控环境下往往“水土不服”。

X网友评论Gemini让机器人变得更酷更有趣了。

加州大学伯克利分校的机器人学教授Ken Goldberg表示：

这项技术无疑是机器人领域令人兴奋的进展，似乎建立在谷歌在大规模数据和计算方面的优势之上。

他还提到，这些新机器人模型最独特的地方在于它们可以在云端流畅运行，这大概是因为它们能够利用谷歌对需要大量计算能力的超大型语言模型的访问。麻省理工学院教授，同时也是丰田研究院机器人研究副总裁的Russ Tedrake认为：

Gemini 是重要的一步。

但他也表示：

通用型机器人要做好投入使用，还有很多工作要做。

科技巨头争相布局，万亿市场蓄势待发

这次DeepMind的动作，也预示着一场机器人领域的“军备竞赛”正在加速。

美银分析师Ming Hsun Lee团队大胆预测，人形机器人即将告别概念验证阶段，在十年内迎来多行业应用爆发期。预计到2030年，全球人形机器人年销量将达到100万台，到2060年，人形机器人总保有量将达到30亿台，相当于届时人均拥有0.3台机器人。

包括特斯拉、OpenAI在内的科技巨头，以及众多初创公司，都在争先恐后地研发AI“大脑”，希望赋予机器人自主操作的能力。

英伟达的CEO黄老板更是直言，这项技术将带来一个价值数万亿美元的巨大市场，甚至可能“开创有史以来最大的科技产业”。

来源：华尔街见闻

标签：模型谷歌机器人灌篮折纸

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!