摘要:在人工智能领域,阿里巴巴旗下的通义实验室就搞了个大新闻,开源了通义DeepResearch深度研究智能体。
文I夙夜玖歌
编辑I夙夜玖歌
在人工智能领域,阿里巴巴旗下的通义实验室就搞了个大新闻,开源了通义DeepResearch深度研究智能体。
这一举动,直接把AI研究领域的竞争推向了白热化,也让大家对AI的未来发展充满了新的想象。
通义DeepResearch可不是一般的角色,它的目标很明确:成为一个能像专业研究员一样,帮大家进行深度调研、分析问题的超级AI助理。
最让人兴奋的是,通义实验室这次选择了完全开源。
在海外那些旗舰模型要么收费高昂,要么限制重重的情况下,通义DeepResearch把模型、框架、方案一股脑儿全部开放给大家。
有人可能会想,开源的东西是不是性能不太好啊?但通义DeepResearch偏偏打破了这个常规认知。
在GAIA、WebWalkerQA等多项衡量AI深度研究能力的权威测试中,这个只有300亿参数规模的轻量级模型,不仅取得了最优成绩,综合能力更是超过了一些海外闭源的旗舰模型。
这就好比一个小个子,在高手如云的赛场上,一路过关斩将,脱颖而出,实力不容小觑。
那么,通义DeepResearch是怎么做到这么厉害的呢?这背后,有着一套创新的数据策略、训练范式和推理模式。
传统的AI训练,往往依赖大量人工标注的数据,不仅成本高,效率还低。
通义团队另辟蹊径,设计了一套全自动、可循环的合成数据生成方案。简单来说,就是让AI自己学会提出复杂问题,然后围绕这些问题去搜集、整理、生成高质量的训练材料。
这就像是一个正向循环,AI在解决问题的过程中,不断产生新的、更好的数据,再用这些数据来提升自己的能力,实现了“自我进化”。
为了应对不同难度的任务,DeepResearch有两种工作模式。
ReAct模式是它的基础模式,遵循“思考 - 行动 - 观察”的经典循环,大部分研究任务靠它就能高效完成。
而当遇到极其复杂的长期研究课题时,Heavy模式(深度模式)就会启动。
这个模式独创了IterResearch范式,把一个大的研究任务拆分成多个“研究轮次”。
在每一轮中,AI只关注当前最重要的信息,分析整合后,带着精炼的结论进入下一轮。
这样一来,就避免了在海量信息中迷失方向,保证了长期任务的推理质量。
更神奇的是,它还能让多个AI分身同时研究同一个问题,最后综合报告,得出更全面的结论,就像一群聪明的助手一起为你工作。
通义团队还打通了从增量预训练、监督微调冷启动,到强化学习的端到端全流程,形成了一套全新的训练范式。
特别是在强化学习阶段,他们不仅优化了算法,还搭建了模拟训练环境、稳定工具调用沙盒等高效基础设施。
让AI能在一个稳定、可控的环境中不断尝试、改进,持续提升自己的能力。
通义DeepResearch可不是纸上谈兵,它已经在实际业务中发挥作用了。
比如在高德地图中,当你提出一个复杂的出行规划问题,像“找一个离我最近、评分高、适合带孩子玩的亲子餐厅,并规划一条不堵车的路线”。
背后就是DeepResearch在进行多步推理和工具调用,为你提供精准答案。
所以,AI的能力远不止于简单的聊天对话,而是能够深入复杂领域,成为人类真正的研究利器。
随着这项技术的不断发展和应用,或许在不久的将来,我们的工作、学习和生活方式都会因为它而发生巨大改变。
来源:夙夜玖歌一点号