「AI新世代」推理模型密集发布!科大讯飞与阶跃星辰竞相上线,国内AI厂商加速追赶OpenAI

360影视 2025-01-17 09:35 2

摘要:训练和推理是AI大模型的两个核心能力,如果说2023年厂商们都在训练模型上竞技,那么近几个月,大模型已经进入推理模型的比拼阶段。1月15日和1月16日,科大讯飞与阶跃星辰前后脚推出其推理模型,不久前,月之暗面、DeepSeek和智谱AI也纷纷上线了自家的推理模

本报(chinatimes.net.cn)记者石飞月 北京报道

训练和推理是AI大模型的两个核心能力,如果说2023年厂商们都在训练模型上竞技,那么近几个月,大模型已经进入推理模型的比拼阶段。1月15日和1月16日,科大讯飞与阶跃星辰前后脚推出其推理模型,不久前,月之暗面、DeepSeek和智谱AI也纷纷上线了自家的推理模型。

毫无疑问,大模型赛道的领跑者仍然是OpenAI,无论语言大模型、文生视频模型还是推理模型,该公司都走在最前沿,值得庆幸的是,业内人士指出,虽然美国对华在AI芯片出口上的限制力度越来越大,国产厂商已经慢慢摸索到了更加节省算力的方式,并将大模型进行商业化变现。以科大讯飞为例,该公司一直走全国产化路线,2024年中标金额和中标数量均位列国内第一。

推理模型扎堆上线

科大讯飞这次推出的是讯飞星火深度推理模型X1,这一模型已落地教育、医疗等多个真实场景。科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现,讯飞星火X1不仅给出了这些题目的准确答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

阶跃星辰自研的推理模型Step Reasoner mini,是该公司Step系列模型家族的首个推理模型,擅长主动进行规划、尝试和反思,能通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。它既擅长通过超长推理能力,解决逻辑推理、代码和数学等复杂问题,也能兼顾文学创作等通用领域。

自从ChatGPT在全球火出圈,国内AI厂商便没有停止追赶OpenAI的步伐,一开始是对标GPT大语言模型,之后是视频模型Sora,去年9月OpenAI推出旗下首款具备“推理”能力模型o1,这些AI厂商又有了新目标。

有几家厂商的速度更快。去年11月,月之暗面上线了趋近OpenAI o1系列水平的新一代数学推理模型k0-math,以及引入搜索意图增强、信源分析和链式思考三大推理能力的全新Kimi探索版;同样在去年11月,DeepSeek研发的推理模型 DeepSeek-R1-Lite 预览版正式上线;2024年的最后一天,智谱AI发布了该公司首个基于扩展强化学习技术训练的推理模型,即GLM-Zero的初代版本GLM-Zero-Preview,该模型擅长处理数理逻辑、代码和需要深度推理的复杂问题。

什么是推理模型?“在大模型的发展过程中,推理模型就像大脑的逻辑思维部分,是体现智商水平的。它能让大模型更聪明地解决问题,更好地服务实际应用,还帮助企业提升竞争力,是大模型走向高级智能的重要一步。” 深度科技研究院院长张孝荣对《华夏时报》记者表示。

在文渊智库创始人王超看来,从近期国产厂商的发布情况来看,中国的追赶速度是非常快的,即便美国持续加大对华在AI芯片上的限制力度,英伟达对华供应的改良芯片性能和速率也有所下降。“我们已经找到了一条新的路子,不用太多芯片,不需要堆积特别多的算力,也能达到类似的效果。当然在最尖端的模型上,我们与国际领先水平还有一定的差距,但这不是问题。”

不过国产厂商接下来还要继续努力,去年12月,OpenAI已经发布了新一代推理模型o3。OpenAI表示,o3模型在某些条件下可以接近实现通用人工智能(AGI),即能完成人类所能完成的任何任务的人工智能。

大模型变现能力增强

在这些发布了推理模型的中国AI厂商中,科大讯飞并不是最早的,其特别之处在于,讯飞星火X1是国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。

科大讯飞一直走全国产化路线,与华为深度合作:2023年10月,双方联合发布首个国产万卡算力集群“飞星一号”;一年后,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。在此基础上,讯飞星火4.0Turbo底座能力也再次迎来升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。

此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒。运用AI输入能力,科大讯飞“蹭”了一下这几天小红书“收留TikTok难民”的热度。1月16日,科大讯飞表示,用讯飞输入法可以实现一键发送中英双语文案、中文语音输入一键转英文等功能,方便中外网友无障碍沟通。

自2023年5月星火认知大模型面世以来,科大讯飞一直保持着稳定的更新节奏:2023年6月,星火认知大模型升级到了1.5版本;2023年8月升至2.0版本;2023年10月带来对标ChatGPT的星火认知大模型V3.0;一年前发布讯飞星火V3.5,多项能力直接对标GPT-4;去年6月,讯飞星火大模型V4.0正式发布,七大核心能力可全面对标GPT-4 Turbo;去年10月推出讯飞星火大模型4.0 Turbo,多项能力的比较对象已经是GPT-4o,甚至开始预测追赶o1水平的时间。

在大模型上的投入和迭代,以及具备的国产算力优势,让科大讯飞在B端市场越来越吃香。据科大讯飞去年三季报披露的信息,该公司成为去年上半年大模型中标数最多的市场化玩家,且8月单月中标金额突破1.5亿元,行业排名第一。科大讯飞董秘几天前还透露,该公司2024年已成为当前央国企大模型的第一选择,中标金额和中标数量均位列第一。

这些项目为科大讯飞带来不错的收益。科大讯飞公布的2024年三季度财报显示,营收为55.25亿元,同比增长15.77%;归母净利润为5696万元,同比增长120.87%。至于四季度的业绩情况,科大讯飞回应《华夏时报》记者称:“按照往年的财报规律,公司营收和经营性现金流在第四季度的表现最好。”

责任编辑:黄兴利 主编:寒丰

来源:华夏时报

相关推荐