AI搜索和DeepResearch深度研究时代-对几个产品的试用和对比分析

360影视 动漫周边 2025-04-11 08:17 3

摘要:今天聊下DeepResearch深度研究,首先我们还是想区分下DeepResearch和DeepThink,两者都具备深度推理能力。但是深度研究往往还具备了一些通用AI智能体的能力,即它可以快速的搜索互联网内容,通过WebAPI获取外部信息,然后再进行学习后快

大家好,我是人月聊IT。

今天聊下DeepResearch深度研究,首先我们还是想区分下DeepResearch和DeepThink,两者都具备深度推理能力。但是深度研究往往还具备了一些通用AI智能体的能力,即它可以快速的搜索互联网内容,通过WebAPI获取外部信息,然后再进行学习后快速的归纳和整合,形成我们需要的分析报告。

在OpenAI推出DeepResearch功能,DeepSeek推出深度思考模型,到后面的Manus通用智能体后,各个大模型厂家也陆续推出了自己的深度研究模型,包括智谱的AutoGLM沉思,Kimi的探索版,秘塔AI搜索的研究模式,还有百度前高管出来创业后推出的Genspark通用智能体。

其中最具挑战性的几个方面包括:

这些能力的实现需要将先进的大语言模型与专门的信息检索系统、知识图谱等技术相结合,并且需要不断优化算法来提高效率和准确性。那么我们今天就找一个简单场景对几款产品做一下简单的测试和验证。

首先我们的问题很简单,具体的提示语如下:

帮我对中国国内从事AI眼镜行业,包括产品,技术,零部件,营销所有相关行业进行综合分析和行业评估。并结合公开财务数据分析增长潜力最大的前三家公司。

1. 智谱AutoGLM沉思

对于智谱AutoGLM沉思我前面写过一篇文章,总体评价就是底层大模型能力不足,但是前端的类似通用智能体的框架还是有很大的参考意义。这个框架可以搜索和阅读互联网内容,可以类似RPA或网页爬虫一样的操作特定的网站获取信息。

所以我们看沉思对问题的理解和拆解能力还是不错的:

但是最后沉思输出的分析报告质量相当一般。

具体问题就体现在感觉沉思获取这类资讯类信息的数据源网站质量一般,很多有用的互联网公开知识库没有纳入;其次就是沉思在获取到资料后的整个交叉验证和推理过程也一般,类似上面输出材料,很多关键的和AI智能眼镜相关的上市公司都没有列出。

再次,整个搜索的思维链本身是层层下钻的。我们发现的问题点在于沉思往往在顶层信息没有得到充分交叉验证的情况下快速的下沉到底层信息的搜索,导致时间和输出两方面损耗。类似选择了创维信息作为核心企业搜索财务类信息,而创维信息本身在AI智能眼镜领域基本不值一提。

2. Kimi探索版

这个是Kimi在推出深度思考模型后进一步推出的一个新功能。其思路也是深度研究模式,可以大量的搜索互联网信息,然后再对信息进行整合。我原来在测试Kimi联网搜索能力的时候就强调过,其实Kimi后端的联网搜索知识库和数据源质量是相当高的。

那我们看下Kimi的探索结果如下:

可以看到Kimi一共搜素了1300多个相关网页信息,而且也从行业发展,产业链,技术多个维度进行展开进行了分析。

整体来看Kimi最终的输出质量还是很高的,包括对几家核心的AI智能眼镜的企业都做到了详细分析和归纳。但是有待提升的还是深度研究和推理能力,感觉Kimi更多做的事情还是对搜索到网页知识的归纳整合和简单推理。或者说基于问题需求没有进一步做好问题的拆解分析,和思考深度方面的延伸,这个确实是需要加强的地方。

3. 秘塔AI搜索的研究模式

接着我们看下秘塔AI搜索的表现,注意在使用的时候需要将联网搜索,深度思考,研究模式全部都打开。

最终秘塔AI搜索了469个网页,说实话其对我问题的理解的深度,搜素的广度和深度都让我眼前一亮。其次就是对搜索到内容的交叉验证,最终的总结和归纳能力也完全符合我的期望。

大家可以看下最终的结果输出:

从上面结果也可以看到最终的内容和质量都相当高。既有深度研究和思考,又有体系化的归纳和总结输出。关键是秘塔AI还提供一个功能,对于输出的结果可以生成互动式网页,大家感受下是否和Manus最终的报告输出风格很类似。而且还可以导出PDF,这个功能简直是大赞。

4. AI搜索新秀Genspark

最后我们再来看下Genspark这个产品,这个产品实际不仅仅是深度研究功能,还具备类似文生图,图片生动态视频等功能。对于图片生动态视频我也做了简单使用,感觉和即梦AI能力不相上下,而是有点细节处理感觉比即梦AI效果更好。

还是回答刚才的问题。我们看下AI的输出。

从这个输出来看,感觉这份分析评估报告稍微做下修改就可以用。整体的目录结构和框架相当完整。体现了其核心的深度研究和推理能力。而且从最终的结果来看基本也满足基本的质量要求。

Genspark的最终的报告可以导出,比如转到Word文件里面也可以看到完整的目录结构和标题,如下:

所以拿到这份报告可能更加方便你在Word里面进一步修改。

Genspark刚推出不久,其和Manus感觉也很类似,是一种通用的混合智能体模式,除了深度研究外,本身也还可以做类似行程规划,方案编写,网站爬取操作等操作。但是由于需要付费,暂时没有做深入使用。

5. 简单总结

最后简单总结下上面使用的几个AI搜素产品。整体感觉秘塔AI的研究模式能力最强大,而且当前是免费状态,建议大家可以使用。而对于智谱本身的AutoGLM沉思产品,再次论证了相当一般,整个搜索路径深度广度思路逻辑混乱,而且整个交叉验证和推理能力也一般。

当然个人也比较看好Genspark这个混合智能体产品,这个也是后续深度研究和AI搜索的一个重要发展趋势。

当然对于AI搜索和深度研究产品,其核心的能力我个人认为一定包括以下几个关键的地方。其一就是你本身能够链接的数据源质量足够好,知识足够丰富;其二是你的交叉验证能力要足够强,能够得出正确的结果;其三就是考验大模型的跨知识领域的知识关联能力,能够打通多个领域知识形成最佳总结。

好了,今天分享就到这里。

来源:人月聊IT

相关推荐