原来AI也会内耗啊,新加坡国立大学提出Thinkless解决AI过度思考问题

360影视 欧美动漫 2025-06-01 12:55 3

摘要:为了让人们更直观地理解Thinkless的实际表现,研究团队展示了一些具体的案例分析。(1)简单的算术问题:"7、2、x和10的算术平均数是9,x的值是多少?"Thinkless给这个问题分配了极低的详细推理概率(0.003534),几乎立即选择了简洁模式。(

原创 Don 至顶AI实验室“是我想太多,你总这样说”李玖哲的《想太多》表达了对爱情的疑惑和不安。歌词中主角感觉对方心中已有他人,尽管对方试图解释,主角依然心乱如麻。现在AI推理模型有时也会想太多,努力的样子仿佛害怕失去什么。2025年5月19日,新加坡国立大学研究团队发表最新研究Thinkless,就像是给"内耗"的AI朋友配了一个心理咨询师,教会它什么时候该深度思考,什么时候可以快速回答。AI的"思考困扰":能力强但太费劲为了让人们更直观地理解Thinkless的实际表现,研究团队展示了一些具体的案例分析。(1)简单的算术问题:"7、2、x和10的算术平均数是9,x的值是多少?"Thinkless给这个问题分配了极低的详细推理概率(0.003534),几乎立即选择了简洁模式。(2)中等难度的问题:"求向量a在向量b上的投影,其中b=(2,6,3),且a·b=8"系统给出了0.504883的推理概率,正好处于中间地带。这种情况下,AI会根据当时的心情(实际上是模型的随机性)来决定用哪种方式回答。(3)复杂的问题:一个涉及多项式根和复杂集合的高级数学问题系统会给出1.0的推理概率,意思是"必须仔细思考"。这种判断展现了AI对问题复杂度的准确感知能力。在不同数据集上的自适应表现很有说服力。在最困难的AIME数据集上,系统"聪明地"对所有问题都启用详细推理,因为这些问题确实需要深度思考。而在相对简单的数据集上,系统则展现出明显的效率优化倾向。局限性与未来展望:完美之路上的下一步尽管Thinkless取得了令人瞩目的成果,但研究团队也坦诚地指出了当前方法的一些局限性。首先是热身阶段的优化空间。目前的研究主要验证了基本的监督学习方法,但没有进行深入的参数调优来达到最佳性能。研究团队认为,通过更精细的模型合并技术或轻量级微调方法(如LoRA),可能能够进一步提升系统的初始性能。数据集的广度也是一个需要改进的方面。目前的验证主要集中在数学问题上,虽然使用了包含40K问题的DeepScaleR数据集,但要构建真正通用的混合推理系统,还需要扩展到更多样化的领域。至顶AI实验室洞见从24年9月的OpenAI o1模型到25年1月的DeepSeek R1模型,推理模型逐渐被越来越多用户关注和使用。有人甚至从此只用推理模型,认为以前的对话模型应该被淘汰了,却忽略了推理模型的三大问题:计算成本高、响应时间长、存在资源浪费。推理模型的问题恰好是对话模型的优点。混合推理模型因此诞生了。5月初,阿里的千问团队发布的Qwen3模型,也是能在思考模式和非思考模式之间切换的混合模型,这方面千问走在了最前沿。2025年也许还不是混合推理模型的时代,因为很多AI公司还处于未盈利状态,可能对于他们来说目前成本不是最重要的,市场占有率才是。但我们相信混合推理一定是AI可持续发展(Sustainable AI)或者绿色AI的必经之路。论文地址:https://arxiv.org/abs/2505.13379END本文来自至顶AI实验室,一个专注于探索生成式AI前沿技术及其应用的实验室。致力于推动生成式AI在各个领域的创新与突破,挖掘其潜在的应用场景,为企业和个人提供切实可行的解决方案。原标题:《原来AI也会内耗啊,新加坡国立大学提出Thinkless解决AI过度思考问题》

来源:福德宫哼哼

相关推荐