摘要:消息一出,引起无数“打工人”、“科研狗”的狂喜。深度研究能让AI自动上网找资料、写研究报告,本来几小时的工作,现在十几分钟就能完成。相比于深度思考和深度搜索,深度研究是大模型使用的更高阶阶段,工作量更大,带来的效率提升更明显,对应的对模型综合能力的要求也更高。
作者 | 李水青
编辑 | 心缘
智东西5月15日报道,5月13日晚间,阿里Qwen团队上线深度研究(Deep Research)智能助理系统,所有人免费可用。
消息一出,引起无数“打工人”、“科研狗”的狂喜。深度研究能让AI自动上网找资料、写研究报告,本来几小时的工作,现在十几分钟就能完成。相比于深度思考和深度搜索,深度研究是大模型使用的更高阶阶段,工作量更大,带来的效率提升更明显,对应的对模型综合能力的要求也更高。
在国外,谷歌、OpenAI、Grok都推出了同类产品,但OpenAI的Deep Research需要付费200美元/月才能使用。在国内,同类产品还很少,智谱AI于3月底推出了免费可用的AutoGLM沉思,DeepSeek等其他产品还未推出Deep Research功能。
Qwen深度研究调用的模型,目前是阿里4月底最新推出的旗舰模型Qwen3-235B-A22B。据智东西此前报道,该模型在编程、数学、通用能力等基准评估中的表现优于DeepSeek-R1、OpenAI o1、OpenAI o3-mini、Grok-3和Gemini-2.5-Pro等业界知名模型。
那么Qwen深度研究如何使用?实际应用效果如何?智东西第一时间带大家看看体验效果。
体验地址:https://chat.qwen.ai/
进入网站后,用户点击聊天框下的“深入研究”按钮,就可以体验深度研究服务了。注意需要保持“深度思考”和“搜索”两个按钮是关闭的,否则看不到“深入研究”按钮。
Qwen深度研究的主要运行包括“规划-执行-总结”三个步骤。以一个文娱话题为例,近期热播综艺节目《乘风破浪的姐姐6》话题点较多,于是我让Qwen深度研究帮我系统地梳理下《浪姐6》的热点。
输入:
“帮我吃一下近期《浪姐6》的完整的瓜,重点关注陈德容、房琪等争议姐姐,以及吴宣仪、宋妍霏、侯佩岑、叶童等人气高的姐姐。”
Qwen深度研究在规划之前,第一时间问了我三个问题,以确定报告范围。这与我们在深度思考、深度搜索中与机器人对话差别较大,深度研究要研究清楚用户的问题,会首先反问用户几个问题,从而对问题有更清楚的了解。在这个示例中,为了“吃瓜”全面,我要求Qwen深度研究的报告囊括提到的所有信息。
在此之后,Qwen深度研究思考了8分钟47秒,而后给我扔出一篇长达7页的pdf报告,果然高端的瓜都是以pdf的格式呈现。
这份报告的最大亮点,在我看来是在报告的结尾生成了一个可下载的表格,一目了然地呈现了姐姐们的“关键事件与表现”、“观众评价与舆论焦点”、“排名变化或成绩示例”。
这份表格干货覆盖全,并且把值得关注的事件都浓缩在一句话里,可以说是一份全面的“吃瓜地图”。比如吴宣仪“失误如提前庆祝比赛结果”、房琪“因聊天记录与实际情况不符引发信任危机”等,点击后面的角标都可以去查看信源原文。不过表格只列举了问题中提到的6位姐姐,没有适当延伸到其他姐姐,但这个问题也可以通过提示词优化。
从整份pdf报告的内容质量来看,我认为还是非常全面和精彩的。如果让我自己去搜索8分钟,一定达不到这个完成度。
Qwen深度研究是如何写这份报告的?展开折叠的深度研究过程可以看到。
一是研究规划,围绕“《浪姐6》热点事件与争议分析”、“人气姐姐的表现与成长分析”、“节目整体热点与综合分析”三大方面,规划了多达18个搜索、查找或者整理的相关任务。
二是执行规划,围绕“陈德容和房琪《浪姐6》争议事件及舆论分析”、“吴宣仪与宋妍霏《浪姐6》合作舞台表现评价”、“《浪姐6》全网热点事件总结”、“陈德容和房琪在《浪姐6》中的互动及观众反应分析”、“房琪在《浪姐6》被淘汰前后舆论变化趋势”、“《浪姐6》中传统文化舞台表现与观众接受度分析”六个主题,执行了搜索、查找和整理等动作。
三是总结,输出一整份《浪姐6》吃瓜报告,包括文字版和pdf版。
为了有所比较,智东西也用智谱清言AutoGLM沉思对这个问题进行了搜索。
可以看到,AutoGLM沉思的执行过程也包括研究计划和搜索动作。
研究计划包括四个方面:
1、确认《浪姐6》是什么节目,它的播出时间表和当前状态。
2、搜索陈德容、房琪、吴宣仪、宋妍霏、侯佩岑、叶童在浪姐6中的相关情况。
3、重点关注她们的争议点和热点话题。
4、在不同的网站上交叉验证信息,以获取更全面的观点。
AutoGLM沉思执行了14次搜索动作。从输出的结果来看,AutoGLM沉思的优点是在文尾放上了63条引用信源,数量多且可追溯。可能的问题是,智谱清言可能更需要优化下界面设计,其研究过程没有像Qwen一样用小框折叠,而是直接呈现在最终答案之前,一直拉到底拉有点费事。
对比来看,我认为两份报告都在很短时间内满足了我强烈的“吃瓜”欲望,比较全面丰富,胜过我自己去用搜索引擎搜很多遍。同时,两个工具都有没有覆盖的热点,但一起用基本上覆盖了所有的重要信息。此外有一个共同问题是,搜索的信源比较泛,如果拿来研究更加专业的问题,可能需要用户自己对生成的报告多加甄别。
此外值得一提的是,打开通义千问网页版,智东西发现其“分析研究”功能实际上已经具备“深度研究”能力,而且采用了左右分屏、回看任务等界面优化。
阿里Qwen深度研究智能助理的推出,让更多人能用到AI自动检索资料、生成报告功能。实测显示,它能快速自动梳理复杂信息并输出结构化内容,大幅提升效率,尽管细节覆盖仍有优化空间。
从行业看,免费开放的Qwen深度研究降低了深度研究类工具的使用门槛,与智谱AI等国内玩家共同推动AI辅助分析产品的发展进程。未来,这类工具或将成为职场和学术研究的新标配,开启认知新范式。
来源:智东西