阿里Qwen深度研究上线！免费AI助理帮你自动“吃瓜”、写报告，实测效果如何？

摘要：消息一出，引起无数“打工人”、“科研狗”的狂喜。深度研究能让AI自动上网找资料、写研究报告，本来几小时的工作，现在十几分钟就能完成。相比于深度思考和深度搜索，深度研究是大模型使用的更高阶阶段，工作量更大，带来的效率提升更明显，对应的对模型综合能力的要求也更高。

作者 | 李水青

编辑 | 心缘

智东西5月15日报道，5月13日晚间，阿里Qwen团队上线深度研究（Deep Research）智能助理系统，所有人免费可用。

消息一出，引起无数“打工人”、“科研狗”的狂喜。深度研究能让AI自动上网找资料、写研究报告，本来几小时的工作，现在十几分钟就能完成。相比于深度思考和深度搜索，深度研究是大模型使用的更高阶阶段，工作量更大，带来的效率提升更明显，对应的对模型综合能力的要求也更高。

在国外，谷歌、OpenAI、Grok都推出了同类产品，但OpenAI的Deep Research需要付费200美元/月才能使用。在国内，同类产品还很少，智谱AI于3月底推出了免费可用的AutoGLM沉思，DeepSeek等其他产品还未推出Deep Research功能。

Qwen深度研究调用的模型，目前是阿里4月底最新推出的旗舰模型Qwen3-235B-A22B。据智东西此前报道，该模型在编程、数学、通用能力等基准评估中的表现优于DeepSeek-R1、OpenAI o1、OpenAI o3-mini、Grok-3和Gemini-2.5-Pro等业界知名模型。

那么Qwen深度研究如何使用？实际应用效果如何？智东西第一时间带大家看看体验效果。

体验地址：https://chat.qwen.ai/

进入网站后，用户点击聊天框下的“深入研究”按钮，就可以体验深度研究服务了。注意需要保持“深度思考”和“搜索”两个按钮是关闭的，否则看不到“深入研究”按钮。

Qwen深度研究的主要运行包括“规划-执行-总结”三个步骤。以一个文娱话题为例，近期热播综艺节目《乘风破浪的姐姐6》话题点较多，于是我让Qwen深度研究帮我系统地梳理下《浪姐6》的热点。

输入：

“帮我吃一下近期《浪姐6》的完整的瓜，重点关注陈德容、房琪等争议姐姐，以及吴宣仪、宋妍霏、侯佩岑、叶童等人气高的姐姐。”

Qwen深度研究在规划之前，第一时间问了我三个问题，以确定报告范围。这与我们在深度思考、深度搜索中与机器人对话差别较大，深度研究要研究清楚用户的问题，会首先反问用户几个问题，从而对问题有更清楚的了解。在这个示例中，为了“吃瓜”全面，我要求Qwen深度研究的报告囊括提到的所有信息。

在此之后，Qwen深度研究思考了8分钟47秒，而后给我扔出一篇长达7页的pdf报告，果然高端的瓜都是以pdf的格式呈现。

这份报告的最大亮点，在我看来是在报告的结尾生成了一个可下载的表格，一目了然地呈现了姐姐们的“关键事件与表现”、“观众评价与舆论焦点”、“排名变化或成绩示例”。

这份表格干货覆盖全，并且把值得关注的事件都浓缩在一句话里，可以说是一份全面的“吃瓜地图”。比如吴宣仪“失误如提前庆祝比赛结果”、房琪“因聊天记录与实际情况不符引发信任危机”等，点击后面的角标都可以去查看信源原文。不过表格只列举了问题中提到的6位姐姐，没有适当延伸到其他姐姐，但这个问题也可以通过提示词优化。

从整份pdf报告的内容质量来看，我认为还是非常全面和精彩的。如果让我自己去搜索8分钟，一定达不到这个完成度。

Qwen深度研究是如何写这份报告的？展开折叠的深度研究过程可以看到。

一是研究规划，围绕“《浪姐6》热点事件与争议分析”、“人气姐姐的表现与成长分析”、“节目整体热点与综合分析”三大方面，规划了多达18个搜索、查找或者整理的相关任务。

二是执行规划，围绕“陈德容和房琪《浪姐6》争议事件及舆论分析”、“吴宣仪与宋妍霏《浪姐6》合作舞台表现评价”、“《浪姐6》全网热点事件总结”、“陈德容和房琪在《浪姐6》中的互动及观众反应分析”、“房琪在《浪姐6》被淘汰前后舆论变化趋势”、“《浪姐6》中传统文化舞台表现与观众接受度分析”六个主题，执行了搜索、查找和整理等动作。

三是总结，输出一整份《浪姐6》吃瓜报告，包括文字版和pdf版。

为了有所比较，智东西也用智谱清言AutoGLM沉思对这个问题进行了搜索。

可以看到，AutoGLM沉思的执行过程也包括研究计划和搜索动作。