科大讯飞的“慢思考”

360影视 2025-01-16 19:27 1

摘要:在2025年1月15日的活动上,科大讯飞仅仅用时40分钟,一口气发布了星火深度推理模型X1、星火4.0Turbo底座升级、星火语音同传大模型。这样的效率,不免让人惊呼--这还是那个我们熟悉的科大讯飞吗?

人工智能行业真的太卷了,科大讯飞刚刚在2025年1月7日举办了发布会,2025年1月15日又召开了信息量更大的新品发布会。

在2025年1月15日的活动上,科大讯飞仅仅用时40分钟,一口气发布了星火深度推理模型X1、星火4.0Turbo底座升级、星火语音同传大模型。这样的效率,不免让人惊呼--这还是那个我们熟悉的科大讯飞吗?

科大讯飞的这场发布会,很明显借鉴了前段时间Open AI的发布会。摒弃了花团锦簇的大会场,就简单搭一张台子,三个人一组轮番上台,用一种非常简洁、高效、直观的场景发布,把产品的功能抛出来。

巧合的是,我现在居住的地方,隔壁就是京津冀首个国产可控万卡智算中心。因此,对于首个基于全国产算力训练的具备深度思考和推理能力的大模型X1,我的兴趣更大。

今天咱们就来聊聊。

敲重点:唯一全国产算力平台训练而来

当天上午,科大讯飞官宣孙俪为产品代言人以及发布星火深度推理模型X1几乎是前后脚的事情。孙俪的明星效应,自然吸引了更多关注。但是,当天的发布会,我们真正应该关注的重点是国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型!

再次强调,X1是目前唯一一个由全国产算力平台训练而来的大模型,历史意义极大。

要知道,放在两三年前,对于这个行业的玩家来说,使用国产算力可能是个减分项,很多场景下都会因为“国产”这个标签而被质疑或排除。但是这两年,国产算力已经逐渐崭露头角,展现出了强大的实力和潜力。

从基础设施建设层面来看,以三大运营商为代表的国家队,不惜投入巨额资金,在广袤国土的各个角落布局超大规模的数据中心。这些数据中心犹如一座又一座的 “数字堡垒”,配备了顶尖的服务器集群,使得国产算力有了硬件层面的强大依托。

以前文提到的我家隔壁的高村数智创新园为例,推动了中国电信京津冀智算中心、中国联通京津冀数字科技产业园、中金大数据产业园等重要项目的落地和投产,成功建立了京津冀区域首个国产自主可控的万卡级智算资源池,智算规模超过1万P,极大提升了我国的算力竞争力。

以科大讯飞和华为的合作为例,在过去一年多的实践中,星火大模型在华为昇腾算力上的训练推理性能不断优化,普遍达到业界90%以上,部分测试集表现甚至超过国际领先的GPT-4 Turbo。

由此,我们可以说,X1大模型的推出,不仅证明了国产算力的实力和可靠性,更打破了国外算力在高端模型训练领域的垄断地位。它展示了国产科技在人工智能领域的创新能力和实力,为国产科技在国际舞台上争得了更多的话语权和尊重。

因此,科大讯飞这个时候才敢于官宣,X1是第一款使用国产算力训练出来的深度推理模型,敢于“是骡子是马拉出来溜溜”这不仅是对国产算力的肯定,更是对国产科技实力的一次重要展示和鼓励。

从快思考到“慢思考”

在发布会上,科大讯飞的工作人员提到一个论述--慢思考。大意是X1与通用大模型相比,其解题过程更接近人类的“慢思考”方式。最终实现用更少的算力,实现更好的技术落地。

啥是“慢思考”,这里就要提到丹尼尔·卡尼曼在《思考,快与慢》中提出的两种思维模式了。我们的大脑能处理两种类型的思考和行为,一种是占据95%的快思考。一种是只占据5%的慢思考。

所谓快思考,是一种自动的、快速的、本能的和情绪化的思维方式。它基于经验和直觉,能迅速对事物做出判断和反应,比如看到蛇会本能地感到恐惧并迅速躲避。快思考在日常生活中很常见,能帮助我们快速处理简单和熟悉的事务,但也容易受到认知偏差和情绪的影响,导致错误的判断。

而慢思考,相对缓慢、有意识且理性,需要耗费更多精力和时间。它用于处理复杂问题,如分析数据、评估风险、进行逻辑推理等。比如计算数学题、制定重要决策时,就需要调动慢思考。慢思考能提供更准确和深入的分析,但由于其耗费精力较大,人们在一些情况下会倾向于使用快思考。

我们说个题外话。理想汽车的自动驾驶能力为什么能够在2024年实现爆发增长,媲美华为?就是利用了这种快慢思考的理论体系,并且通过技术能力加以落地。这也是为什么理想汽车的端到端+vlm能力,要用两颗英伟达的芯片,一颗负责快思考,一颗负责慢思考。

同样,科大讯飞之前已经有过了相对简单的“快思考”的过程,现在重点做的是“慢思考”的能力提升。星火深度推理模型X1在发布会上的解题视频看到了吧,它的整个解题流程和节奏更像人,而不是像机器。

理解了这一点,就理解了科大讯飞X1今天要干的事情。

当然,现在的X1还远远够不上完美。据《大模型之家》在会后的评测显示,X1在回答思考过程中(也就是慢思考),与前段时间的DeepSeekAI智能助手类似,采用了深度思考计时的形式,但星火的深度推理模型X1并未在页面中显示出思考过程,只有在形成答案的过程中,会闪动小标题来显示正在思考。

另外,在实际的体验中,无论是页面设计还是回答来看,X1更像是一个经过训练形成的数学专用智能体,并没有出现直播演示中的右侧思考栏,与官方介绍中的具备深度思考过程和推理能力的大模型有所出入。

好在科大讯飞本就是一家处在不断进化中的企业,早已经摸索出产品发布→改进→应用→基于市场需求改进→更好地应用这样一套打法。只要方向是对的,X1的发展前景还是非常值得期待的。

科大讯飞的落地优势

当天的发布会结束后,有媒体对我进行了采访,想让我谈谈科大讯飞做人工智能有哪些具体的落地优势。

在我看来,当下人工智能这个领域的竞争态势堪称白热化,之所以如此激烈,很大程度上是因为它紧密贴合了当前社会亟待满足的诸多需求,能够提供极具针对性的服务。其中,教育领域就是个极为典型的例子。另外,医疗行业对于人工智能所具备的深度推理能力更是有着迫切渴望,以此来辅助诊断、优化治疗方案等。

而科大讯飞的突出优势就在于,早在20多年前,当人工智能尚处于起步萌芽阶段,它便极具前瞻性地毅然投身其中,开启了漫长的探索研发之路。并且,十几年前科大讯飞就已经成功将一大批涉及教育、医疗等关键领域的产品与服务推向市场,落地生根。历经多年的深耕细作,它积累了深厚的行业资源,既不缺稳定的客户群体,也拥有丰富多样的应用场景。如今,科大讯飞更是与时俱进,利用全新的前沿技术,一方面对固有客户持续优化服务体验,进一步巩固合作关系;另一方面积极开拓进取,不断挖掘潜在的新客户,拓展业务版图。如此一来,科大讯飞的先发优势愈发显著,在激烈的市场竞争中占据了极为有利的身位。

举个形象的例子,在武侠世界里,同样是修行明教的至高绝学乾坤大挪移,为何张无忌能比前任教主杨顶天以及光明左使杨逍快上许多呢?要知道,他们所依据的“算法”,也就是乾坤大挪移的心法秘籍是一样的,那其中的关键差别究竟在哪?根源就在于张无忌拥有深厚的历史积累。他此前习得了九阳神功,体内的内功雄浑深厚,远超杨顶天与杨逍二人。正是凭借着这雄浑的内功根基,在面对乾坤大挪移这般艰涩高深的武学功法时,张无忌能够驾轻就熟,修炼的效率奇高无比,在短时间内便将其修炼至大成境界。

类比到当下的科技领域,早在如今大火的大模型概念尚未兴起之前,科大讯飞就已经在人工智能这片天地默默耕耘了20多年,持续不断地将各类人工智能服务落地实践,积累了海量宝贵的实战经验。这就如同张无忌的深厚内功一般,为科大讯飞在面对如今人工智能领域的种种挑战与机遇时,提供了强大的内在支撑,使其能以更高的效率推出各类产品和服务,无论是研发新品、优化服务,还是开拓市场,都有着得天独厚的先发优势。

因此,这也解释了为什么科大讯飞在2024年,每几个月就有召开一次产品重磅升级发布会的原因所在。

写在最后:说个小彩蛋,在讯飞预告片中,出现了“你好,新人类”的提法,非常有意思。这是在人工智能深度推理爆发式发展的当下,讯飞给行业带来的时代之问--未来硅基生命和碳基生命的界限还有吗?这两种生命到底该如何相处?

显然,对于科大讯飞和各人工智能企业来说,人工智能真正的主战场才刚刚开始。

来源:丁道师

相关推荐