这,才是AI最有远见的未来

360影视 2025-01-09 10:30 3

摘要:据《全球数字经济白皮书(2024年)》:2024年,全球AI大模型数量多达1328个。其中,美国占44%,中国占36%。

智能无所不至,攀登永恒不止。

文 | 华商韬略 熊剑辉

如何让AI,成为这个时代最颠覆的创新机会?

【“AI震撼”,华为攻坚】

回望2024,世界仍在经历“AI震撼”。

一边是“千模大混战”。

据《全球数字经济白皮书(2024年)》:2024年,全球AI大模型数量多达1328个。其中,美国占44%,中国占36%。

一边是算力大比拼。

据中国信息通信研究院测算,截至2023年底,全球算力基础设施总规模达到910EFLOPS。其中,美、中分别占比32%、26%。

不论大模型还是总算力,中国都屈居第二。

算力即国力,在此刻变得具象化。

如果将训练AI大模型比作“炼丹”,那AI芯片就是熊熊的“炉火”。谁的芯片越多,谁的大模型就越聪明、越强大。

但在美国的强力管制下,中国企业购买英伟达AI芯片难以为继。

而且,中国的AI算力仅占总算力的30%,根本无法满足需求。

面对困局,怎么办?

必然是集体突围,迎难而战。而突破之一,来自华为云。

2024年9月,华为云重磅发布AI原生云基础设施CloudMatrix。

不是AI的算力不够吗?CloudMatrix的“池化”技术,能将CPU、NPU、DPU、存储和内存等多种计算资源集中起来,汇聚成一个统一的资源“池”。让不同的算力也能像水流一样,根据需求任意抽取、分配,大幅提高资源的使用效率和灵活性,一举破解了中国算力异构严重的难题。

但仅仅统一算力,显然远远不够。如何帮助用户整合算力、高效训练开发大模型,依然是难题。

于是,华为云又推出昇腾AI云服务,打造出一站式大模型训练(“炼丹”)平台。

其中,既整合了大规模算力集群,又包含了计算引擎CANN、AI开发框架MindSpore、ModelArts AI开发生产线、ModelArts Studio大模型即服务平台等强大工具。

不要说丹炉、丹粉、丹火、丹房,连煽火的童子,都给配齐了。

但“炼丹”免不了要“炸炉”,大模型训练出故障毫不意外。

比如,Meta在Llama 3大模型(4050亿参数)训练过程中,动用了包含16384块英伟达H100 GPU的超大集群,耗时54天,故障419起,平均3小时就要“炸”一次。

对此,Meta无可奈何。

但华为云的昇腾AI云服务,却实现了万亿参数大模型训练无中断时长最高达40天,故障恢复仅需10分钟,可靠性达到甚至超越英伟达水平。

目前,昇腾AI云服务全面适配行业主流的100多个大模型,通过云服务的方式协助大模型的开发、训练、托管、应用,真正成为百模千态的“黑土地”。

2025年,基于CloudMatrix全新架构的昇腾AI云服务,就将正式商用。

澎湃的算力、易用的服务,不过是华为云AI产业化的基石之一。要让AI在千行万业真正落地,还必须要有一个强大的、基石性的大模型打底。

于是,华为云盘古大模型5.0来了。

▲华为常务董事、华为云CEO张平安发布盘古大模型5.0

这不单是十亿级、百亿级、千亿级、万亿级参数规模“量”的升级,更是在全系列、多模态、强思维三个维度的“质”的突破。

实际上,华为的攻坚和突破不止于此。

从MetaERP到GaussDB数据库,从Mate60到纯血鸿蒙,乃至统御异构算力的CloudMatrix、高效开发的昇腾AI云服务、聚焦行业与科学的盘古大模型……

AI,正成为改变时代的超级工具。

这既是中美“AI争霸”的肇始,也是华为埋头苦干、聚力突破,试图让中国科技再也不受限于人的开端。

【解难题,做难事】

在业界人士看来,中美AI大战,中国不能盯着美国拼芯片。

聪明的做法,应该用AI赋能千行万业。毕竟,作为全世界唯一拥有联合国产业分类中全部工业门类的国家,中国的AI应用,拥有最广阔、最丰富的行业场景。

诚如李开复所说:中国AI的优势,在于能够更好、更快、更可靠和更低成本的实现落地。

所以,与国外卷算力、卷芯片不同,中国的AI更倾向于卷应用、卷行业。

2024年,由此被誉为“行业大模型”发展“元年”。

而这对顺丰的快递小哥来说,极其具象化。因为入职第一件事,先要学用“丰语”大模型。

比如,乌龟能不能寄、玉镯怎么保价、易碎品怎样包装、不同价格寄送时效如何……

面对这些琐碎又专业的问题,快递小哥再也不会一脸茫然。打开APP,直接问“丰语”,马上有答案。

今天的极致高效背后,潜藏着以往的难言之隐。

快递物流行业的特点是,人员多、岗位多、流动大。所以,无数的隐性知识、经验,以文字、语音、图片、视频等形式,碎片化躺在规章制度和信息系统里。靠人力,无法发掘出内在价值。

所以,哪怕是“收快递”这件小事,新员工不明白,老员工说不清。但在顺丰体系里,却又不是“新问题”。

面对这样的“老大难”,顺丰决定自研一款物流行业的垂域大模型——“丰语”。

自研大模型需要海量的数据、庞大的算力、高昂的费用来做训练、推理,如何快速高效地训练出既专业、又实用的大模型是关键。

顺丰选择了“开箱即用”的华为云昇腾AI云服务。

在“丰语”的训练过程中,昇腾AI云服务不仅提供了澎湃的算力支持,更在不降低大模型效果的前提下,提供长稳的训练体验,实现了专业、可靠、成本的最佳平衡。

最终测评显示,“丰语”实现了同规模尺度下的大模型表现持平,而物流专业领域表现远远胜出的效果。

▲基于“丰语”大模型自动生成合规品名

如今,“丰语”广泛应用于顺丰的市场营销、客服、收派、国际关务等20多个业务场景,摘要准确率超95%,极大提升了工作效率。

这真正成为每项业务、每个人都能用得起、用得好大模型。

而这不过是华为云AI大规模赋能行业的冰山一角。

据沙利文最新发布的《中国行业大模型市场报告,2024》,华为云在行业大模型中取得政务、工业、金融3项第一,位居医疗、药物、气象、汽车4个领导者象限,领跑中国行业大模型市场。

这样的领导地位,是靠“解难题,做难事”干出来的。

以专注于铜箔制造的海亮股份为例。

铜箔看似平平无奇,但高良品率的铜箔,对提高锂电池的能量密度、安全性、使用寿命具有重要意义。

而业界最高的良品率,只有90%,再难突破。

为此,华为的算法、算力博士深入车间,与海亮的材料学、机械学博士一齐深度共创,打造出“铜箔工艺优化大模型”,并融入12道大工序、90+的工艺及设备参数、30+质量检测指标、26套系统平台的核心数据。

在AI加持下,海亮的铜箔良品率一举升至95%以上,冲破行业天花板。

同样尝到甜头的,还有海螺水泥。

根据国标《通用硅酸盐水泥出厂确认方法》(GB/T 39698-2020),确认出厂水泥的强度,要根据出厂水泥在3天、28天的强度,与出厂水泥或出磨水泥的1天强度(或快速强度的1天强度)关系,进行“预测”。

也就是说,只有快出厂时,你才大概知道这批水泥的强度是否达标。

这成为水泥业的“测不准原理”。其中原因,涉及原材料质量、水泥颗粒细度、煅烧的工艺、设备、温度、时间,乃至外界温度、湿度等多维度信息。而一旦强度不达标,要么降级、要么报废,很容易导致成本升高。

依托华为云的“盘古预测大模型”,海螺构建起一个融合结构化和非结构化数据的产品质量、能耗的预测模型,实现了实时工艺参数推荐功能,大幅提升了智能化水平。

这使得水泥还在熟料阶段,海螺就能实现对3天、28天的强度预测,准确率达到业界先进水平。

显然,这大幅减少了生产的冗余调整,实现了降本提质。

凭借卓越的表现,华为云、顺丰、海螺、天士力等企业的创新实践,成功入选由《环球时报》、中国科协、清华大学等联合发布的2024年“新质生产力产业实践示范案例”,成为产业智能化的标杆。

仅2024年,盘古大模型就在30多个行业、400多个场景中落地,通过“解难题,做难事”,重塑千行万业,加速智能升级。

但在华为云看来,AI的未来,还有更广阔、更远大的版图。

【AI4S:AI如何造就未来?】

2024年,诺贝尔奖的揭晓,震撼世界。

其中,物理学奖、化学奖都与AI相关:一个是基于人工神经网络实现机器学习,一个是借助AI预测蛋白质的复杂结构。

一场AI for Science(AI4S,人工智能驱动的科学研究)的未来风暴席卷而来,正式成为推动科研的“第五范式”。

为什么AI4S如此重要?

因为科学研究正遭遇一场“维度灾难”。也就是说,针对某些问题的求解,由于维度数据的增加,计算呈现指数级增长,人脑根本无法驾驭。

哪怕是对水泥强度的预测,人脑都不寒而栗。

用量子力学的奠基人保罗·狄拉克的话说,就是“我们有了打开科学大门的钥匙,却没有力气去把门推开。”

因此,中国工程院院士高文才直言:AI4S将是AI的下一个主战场。

而菲尔茨奖获得者、天才数学家陶哲轩,已是AI4S重度使用者。

2024年,他牵头发起“等式理论计划”,只用短短57天,就攻克了4694个等式之间、22028942个蕴含关系,大获成功。

与此同时,华为云也在AI4S上持续发力,并在气象、医疗、农业等领域,解决了诸多世界难题。

▲在马达加斯加渔村,海洋学家Toky在向村民讲解云盘古大模型预报的天气信息

2024年,当“阿尔瓦罗”气旋即将狂袭马达加斯加之际,当地公益组织运用“盘古气象大模型”,精准定位了台风登陆点,及时发出预警,帮助75万渔民安全转移,在风暴中守护了无数生命。

如此强悍的预测能力,源于盘古大模型5.0在“全系列、多模态、强思维”三个维度上的大升级。

全系列上,不仅有十亿级、百亿级、千亿级、万亿级等不同参数规格,还包含NLP、CV、多模态,以及预测大模型、科学计算大模型。

多模态上,文本、图片、视频、雷达、红外、遥感等信息都能理解,打破数字与物理世界鸿沟。

强思维上,思维链技术与策略搜索深度结合,让智能体能理解、预测环境变化。

以天士力“数智本草大模型”为例。

基于华为云盘古大模型L0基础模型,大模型“学习”了4000多万篇文献,“钻研”了1000多本古籍,所以,既能赋能方剂的筛选和优化、提升研发效率,又能辅助医生问诊。

同时,天士力还在盘古17亿化合物的“药物分子大模型”基础上,增训了350万天然产物分子数据,未来有望更好地优化方剂、发现新药。

农业上,由中国农科院联手华为云发布的“育种大模型”,通过盘古大模型(NLP)及大数据技术,有望创造高产、抗旱、抗病的新基因、新物种,必将引发一场农业科技革命。

展望未来,随着华为云在AI4S领域的持续深耕,必将为各行业、各领域的产业创新提供更有力的支撑。

这意味着,AI不但将成为“新质生产力”,更将深入到基础科学、研发的底层,成为更具深远意义的“新质科学力”,通过产学研深度融合,引领产业未来发展。

2025年,世界面临更多的不确定性和更激烈的大国博弈,AI正在成为新的核心战场。

当美国在通用大模型上继续蒙眼狂奔,作为工业制造与数字经济“双强”的中国,有望在AI产业上双管齐下,走出自己的差异化道路。

而不论是澎湃的矩阵式AI算力架构CloudMatrix、强大的昇腾AI云服务,还是深度融入行业与科学场景的盘古大模型,已然构建起华为云AI不可逆转的“正向飞轮”。

这不仅仅是AI芯片和算力的单维竞争,也不局限于AI在某个产业的落地、科研在某个局部的突破,它是华为云打造的一块AI“黑土地”,注定要驱动千行万业的AI持续生长、引领未来、飞速向前。

来源:华商韬略

相关推荐