摘要:中国电信人工智能研究院(TeleAI)正式推出全新升级的星辰语义大模型 TeleChat2.5 版本,并发布复杂推理大模型 T1 正式版,且双双开源;昆仑万维宣布开源 Matrix-Game大模型……今年以来,中国大模型开源的消息接连不断。国产大模型千帆竞发,
(记者 杜峰)中国电信人工智能研究院(TeleAI)正式推出全新升级的星辰语义大模型 TeleChat2.5 版本,并发布复杂推理大模型 T1 正式版,且双双开源;昆仑万维宣布开源 Matrix-Game大模型……今年以来,中国大模型开源的消息接连不断。国产大模型千帆竞发,为推动人工智能产业发展奠定坚实技术底座,促进算力进入良性循环发展阶段。
开源大模型浪潮涌起
大模型的发展,开源是重要的方向。开源能够让更多人参与到人工智能的研究和应用中来,让更多人在人工智能技术中受惠。从2023年下半年开始,国内开源大模型的数量快速增长,数量已超过50个,涵盖了自然语言处理、计算机视觉、多模态等多个领域,不仅科技企业在开源大模型,运营商也加入到开源大模型的队伍中。
中国电信人工智能研究院的TeleChat 2.5版本在自然语言处理方面表现出色,能够处理多种复杂的语言任务,如文本生成、情感分析和机器翻译等。T1复杂推理大模型则专注于逻辑推理和决策支持,使用了强化学习训练方法,通过引入探索、反思等思考方式,大幅提升了模型在逻辑推理、数学推导等方面的准确性。“通用问答+复杂推理”大模型的双双开源,标志着我国自主研发大模型技术迈上新台阶。这些开源模型的推出,为研究人员和开发者提供了宝贵的资源,加速了人工智能技术的创新和应用。
联通数据智能有限公司今年1月发布了元景思维链大模型。作为央企首个开源的通用思维链大模型,元景思维链大模型不仅能够完成复杂的推理任务,而且通过“自适应慢思考”有效提升了思维链模型应用的性价比,具备赋能医疗诊断、工业设备故障检测等应用场景落地的能力。目前,元景思维链模型已在GitHub、魔搭、始智等社区全面开源。
中国移动去年7月在第七届世界人工智能大会期间宣布正式开源九天·语言大模型,该模型采用自研纯解码结构与多专家算法架构,训练数据融合了29个行业的专业数据,占比达10%,覆盖电信、能源、交通、金融等多个领域。
人工智能产业进入加速时刻
为何开源大模型成为中国当前的发展潮流?实际上,大模型开源的热潮并非偶然,而是由多方面因素共同推动的结果。
首先,企业行业AI部署的需求驱动。随着人工智能技术的不断发展,千行百业对AI的需求激增。从制造业的智能工厂到医疗行业的辅助诊断系统,从金融行业的风险预测到交通行业的智能交通管理,AI应用场景不断拓展。企业为了提升竞争力,纷纷加大AI部署的力度,这直接推动了对大模型的需求。开源大模型因其灵活性和适应性,成为企业的首选。
其次,AI产业生态化进入加速时刻。随着技术的成熟,AI产业上下游的协作关系更加清晰,分工协作体系逐渐形成。开源大模型为开发者提供了强大的基础,使得他们能够专注于应用开发和创新,而无需从头开始构建复杂的模型。这种分工协作的模式不仅提高了开发效率,还降低了开发成本,进一步推动了AI产业的发展。DeepSeek开源后吸引了大量开发者参与,其开源模型在发布后迅速获得了3000万月活用户。
再次,AI大模型能力提升显著。大模型的性能和功能不断提升,能够处理更复杂的任务,生成更高质量的结果。这使得用户和应用开发者对大模型的需求爆发性增长,进一步推动了开源大模型的发展。开源还提升了AI系统的透明度和安全性。开源模型的代码和算法透明,开发者可以共同发现漏洞、优化功能,形成“群体智能”,加速技术的进化。
最后,国家战略与政策支持。我国高度重视人工智能的发展,出台了一系列政策支持大模型的开源和创新。例如,《新一代人工智能发展规划》将开源、开放作为基本原则写入规划。多地政府也通过政策补贴、算力支持等措施,推动大模型开源生态建设。北京、上海、广东等地通过“人工智能算力券”等政策,鼓励企业布局通用大模型。
倒逼算力升级
大模型开源催生了推理端需求的激增。随着开源大模型的广泛应用,对算力的需求也在不断增加。
中国电信在算力基础设施方面持续投入,通过技术创新和平台升级,不断提升算力供给能力。例如,中国电信“息壤”一体化智算服务平台,通过跨地域算网协同、自动并行、断点续训等功能,实现了多方、跨域、异构算力的统一调度管理。这一平台不仅提升了算力的利用效率,还降低了使用门槛,推动了AI技术的普及。截至当前,息壤已接入50家算力合作伙伴,自有和接入的智能算力合计达到62EFLOPS。此外,中国电信还通过技术创新,如Triless架构,实现算力资源无关、训推框架无关、AI工具无关,进一步降低了大模型开发应用的门槛。基于Triless架构,中国电信推出息壤科研助手,以算力+平台+AI应用一体化的方式,服务60多所高校和科研机构和数千个科研团队。
同时,国产AI芯片的快速发展也为算力升级提供了有力支持。据中研普华报告,国产GPU市占率从2020年的12%提升至2024年的40%-49%。国产芯片企业通过与开源大模型的深度适配,逐步构建了完整的生态系统。华为昇腾与DeepSeek的适配,实现了高性能、低功耗的推理计算,为大模型的应用提供了强大的算力支撑,展示了其在AI领域的技术实力和市场潜力。这种生态建设不仅有助于减少对国外硬件平台的依赖,还能吸引更多上下游企业合作,完善产业链生态。
随着大模型开源的持续推进,国产芯片企业将继续加大技术创新力度,提升芯片性能和能效比,加速了国产芯片对国际主流芯片的替代进程。
来源:晓说通信一点号