深度智力探索场景下目前的人机协作体验

摘要：本文是购买了Gemini Ultra会员（250刀的那个）后，使用DeepThink模式的使用体验，但又不只是DeepThink的使用体验。注意DeepThink不是DeepResearch，如果读者不知道这其中的差别，那么读者了解的实际是Deep Resea

本文是购买了Gemini Ultra会员（250刀的那个）后，使用DeepThink模式的使用体验，但又不只是DeepThink的使用体验。注意DeepThink不是DeepResearch，如果读者不知道这其中的差别，那么读者了解的实际是Deep Research功能。DeepThink功能实际上目前很少有人能用上，虽然花钱就可以买，但去买Gemini Ultra会员的人目前并不多。

本文试图向读者展示 依靠目前最强的LLM模型做重度智力型工作（方案设计类）大概是个什么体验 。

目前只有同时购买了Gemini Ultra会员和ChatGPT Pro会员（200刀）的用户，才可能复刻本文的使用过程。

场景、使用方式

本文的体验来自于我在几天之内，跟Gemini DeepThink和ChatGPT GPT5 Pro的讨论。

讨论的问题是一个没有太多可借鉴的全新的方案设计，其实也不太依赖于联网搜索。主要靠模型的智能和我的认知就基本可以闭环。

一开始的使用过程是我只在用Gemini DeepThink，把它当成一个人一样来讨论。只不过由于它较慢，所以把我想到的对之前内容的补充和对于后续讨论的内容都在一次发给它。后1/3的时候，我为了更好地跟GPT5 Pro进行比较，而开始双持对话，同一个，同时在两边进行沟通讨论，有时还会把一方的观点发给另一边来分析。

整体的对话过程就是把Pro mode当作普通模型来对话的感觉，只不过每聊一轮都要等5-10min。

与很多人的猜测可能相反，在这个场景中，即使是这两个目前智能最强的模型，也很难一次就给出一个完整的、多个阶段的、质量符合我预期的内容。实际上我的感受是，每轮对话大概只能挤出一点牙膏，大概只有一个点是会被我采纳的。不少时候我还会就它提出的某些点在进行反复讨论思辨。

即使忍受着这么慢的速度、这“不算太好”的回答，我仍然持续地用下去，直到我这个方案基本设计完。原因在于它已经迈过了有用的门槛，花时间跟它讨论是有用的，而且胜过我能找到的人来进行讨论，也比我自己独立思考要更好和更快。

对于真正的深度讨论，目前最强LLM的能力才刚刚可用。

靠LLM来独立写出深度文章距离实现有不少的距离。

对于未来真的深度智力工作台产品来说，很明显，每次对话都得是目前Pro mode级别的模型才行。

模型之间的比较

在后期我开始双持对话比较两个模型的时候，我发现它们的水平可能是差不多的，但思路和风格有差异。同时使用两个模型是值得的。

但如果我不比较它们的回答，我会觉得Gemini DeepThink时常会给我一些惊喜甚至惊讶，主观上会让我觉得这个模型很好。而GPT5 Pro的回答就会让我感觉似乎中规中矩，也不能说不深度，但就是不会让我感觉惊喜。

在速度上Gemini DeepThink比GPT5 Pro要快一些。

Gemini DeepThink目前最大的限制是每日只能使用10次，而且中间不能切换为其他模型。

今年我推荐不少产品，例如OpenAI Deep Research、Gemini 2.5 Pro、o3+search、Claude Code、Cursor+GPT5，以及现在的Gemini DeepThink。