摘要:4月,全球最大的AI开源社区Hugging Face更新开源大模型榜单,阿里巴巴近期开源的端到端全模态大模型Qwen2.5-Omni登顶,深度求索的DeepSeek-V3-0324和群核科技的SpatialLM-Llama-1B紧随其后。杭州同时拥有3个世界顶
潮新闻客户端 记者 何泠瑶 祝瑶
4月,全球最大的AI开源社区Hugging Face更新开源大模型榜单,阿里巴巴近期开源的端到端全模态大模型Qwen2.5-Omni登顶,深度求索的DeepSeek-V3-0324和群核科技的SpatialLM-Llama-1B紧随其后。杭州同时拥有3个世界顶级开源模型,称杭州为“AI之城”已经毫不为过。
这些事在意料之外,又是情理之中,杭州科技企业阿里巴巴再次踩中科技的步点和历史的进程,站到了AI变革的浪潮之巅。从电商到支付到云计算又到AI,为什么总是阿里巴巴?迈入AI时代后,阿里巴巴又将给杭州、给浙江,和这个世界带来什么?
阿里巴巴西溪园区
“大树底下长森林”
阿里巴巴的AI故事始于2014年。那一年,阿里巴巴成立iDST(数据科学与技术研究院),建起了30 人左右的团队,其中有知名学者,有终身教授,他们是最早一批从学界转向企业界的人工智能科学家。当时,在业务线同事们的眼中,这些科学家是“不懂市场、不懂商业的人”,好像只会写论文、搞数据。
科学家们慢慢意识到,从企业的角度看,科技不是计算数字的工具,而是要和场景结合起来。如果不了解应用场景,和业务脱节,那么在阿里,iDST 永远无法产生价值。iDST 团队梳理了几个重点:检索、语音、语义、图像、视频和模型优化。
2015 年,科学家们开启了“上山下乡”,深入一线,鼓捣产品,钻研业务。有一队人马专心做搜索,从事语音方向的人到阿里云,研究图像的人和淘宝打交道。
润物细无声,这些专家主导的技术创新,大家在不知不觉中就用上了,比如城市大脑,再比如淘宝“拍立淘”等。
技术大咖纷至沓来,阿里巴巴内部的科技浓度不断上升,不再只是一家电商公司。它不仅自身的创新活力持续增强,也给整个杭州外溢了醇厚的科技原浆,与后来“杭州七小龙”的故事形成了首尾呼应。2014年,在阿里巴巴高层的支持下,阿里M工作室核心人物祝铭明启动创业,他创办了“杭州七小龙”之一的灵伴科技,拳头产品是前阵子刷屏的Rokid AR眼镜。
当前,出身阿里巴巴的创业者已经成为中国人工智能行业一股不可忽视的力量。据报道,截至2024年底,由前阿里员工创办的人工智能企业已达85家,其中45%注册在浙江。
中国社会科学院城市与竞争力研究中心主任倪鹏飞认为,阿里巴巴对杭州和浙江具有很强的生态外溢效应,形成了“大树底下长森林”的格局,其核心在于智能经济的超大规模效应。阿里的云计算、大数据等技术外溢,为中小企业提供了基础设施。
“规模经济的带动作用体现在两方面:一是在人才、科技、资金等硬件资源方面,使得许多想进入或是已经进入的中小企业能够分享、共享;其次是软件,创新企业成功了以后,创新的思想、理念、信心等会带动模仿、扩散、联想。”倪鹏飞进一步指出,“梦想还是要有的,万一实现了呢?”马云的这句话鼓励了很多人去试一试、闯一闯,给他们带来了继续创业、扩大创业的信心。
“为了解决10年、20年后的困难”
从“电商领头羊”到“AI探路人”,从“让天下没有难做的生意”这一商业表达,到“计算,为了无法计算的价值”这一科技表达,阿里巴巴的转型升级已经悄然进行了16年。事实上,从决定研发阿里云的那一刻起,阿里就开启了自己的科技公司之旅。
2009年,阿里力排众议,自主研发阿里云,旁人觉得“太疯狂”。到了2017 年,阿里又宣布,面向未来研究突破性技术,锁定机器学习、芯片等核心技术,组建崭新的团队。“这些研究的目标是为了解决10年、20年后的困难。”当年马云这样说。
当时,阿里仅自然语言处理(NLP)团队就有近百号人,他们分布在中国、美国、新加坡等实验室,克服1 万公里的地理距离、15 个小时的时差跨时空协作。2018年,OpenAI首次推出语言模型GPT1,恰是在同一年,阿里也启动了大模型研发。2018年是AI发展史上的一个重要节点,阿里有人才储备,有国际视野,还有扎实的“云地基”,决定入局大模型赛道可谓水到渠成。
2019年,阿里发布大规模预训练语言模型structBERT,登顶全球NLP权威榜单GLUE;2021年,阿里发布国内首个超百亿参数的多模态大模型M6;2021年10月,M6模型参数跃升至10万亿,成为当时全球最大的AI预训练模型;2022年9月,阿里发布“通义”大模型系列,通过魔搭社区开源开放。
进入2022年,全球AI技术突然加速,顶尖科技公司纷纷押注大模型。2023年4月,经过近十年的技术沉淀,“通义千问”大模型正式发布。8月,通义千问开源模型发布。为什么要开源?当时争议很多,有人不看好,有人选择观望,而阿里很坚持。
在2023年10月的云栖大会上,阿里巴巴集团主席蔡崇信解释了开源的初衷:“我们坚信,不开放就没有生态,没有生态就没有未来。同时,我们要始终攀登技术高峰,只有站在更先进、更稳定的技术能力之上,才有更大的开放底气。”他寄望通过开放和开源,让开发AI、使用AI变得更加容易和便宜,帮助各行各业、特别是中小企业,把AI转化为巨大的生产力。
这也印证了倪鹏飞“阿里巴巴大树底下长森林”的判断,开放和开源是最彻底的技术外溢,阿里巴巴的AI技术因而成为普惠的基础设施。“开源”的文化,就是谁都能下、谁都能改,是一片共享与信任的土壤,阿里巴巴推进的是全尺寸、全模态开源。
自发布以来,在国际权威榜单上,阿里的通义千问模型,无论在性能还是成本都表现不俗,闯入了全球第一梯队。自2023年8月以来,通义千问累计开源200余个模型,全球下载量突破2亿。通义千问开源模型的衍生模型数量已突破10万,是公认的全球第一开源模型。
从星辰大海到人间烟火
如今的阿里巴巴,已经走过了1/4个世纪,从一个电商小网站发展到全球一流科技公司,从电商到支付到云计算再到AI,驱动阿里巴巴发展的是永不停歇的创新。特别是过去这两年,阿里厚积薄发,抓住AI这个革命性的机遇,全面刷新自我,转变为一家AI驱动的科技公司。4月10日,斯坦福大学人工智能研究所发布《2025年人工智能指数报告》。报告评选出2024年全球范围内的重要大模型,其中谷歌、OpenAI和阿里巴巴位列前三名,分别入选7个、7个和6个,大幅领先于其他AI企业。
全球重要大模型数量
"AI不仅要奔向星辰大海,更要呵护人间烟火",用AI解决社会难题、造福百姓,这是阿里巴巴做AI的初心。目前,阿里巴巴的AI技术正在帮助我国300多家科研院所和高校奔向星辰大海,包括复旦大学、山东大学、东南大学、中科院等。基于阿里巴巴通义千问,科研机构插上了人工智能的翅膀,科研创新大大提速。
依托通义千问大模型:国家天文台打造金乌大模型,用于分析、预测太阳耀斑,在X级耀斑的预测上,达到了95%的准确率和100%的真实阳性率;中科院青藏所打造洛书大模型,实现对径流的溯源和预测,准确率已达98%(SOTA级别),未来将逐步应用于多个能源场景;中科院南海所打造的瑶华大模型,能对珊瑚种类、覆盖率及底质组成智能识别,支持珊瑚礁生态系统的动态监测和健康评估。
普通人不了解大模型的技术参数,更关心AI能不能呵护人间烟火。在丽水和宁波,阿里巴巴的AI多癌早筛项目已经在医院落地。只需一张普通的胸部CT,在阿里AI技术的加持下,医生可以发现肉眼很难分辨的病灶,准确地识别出早期胰腺癌等癌症,早发现早治疗,挽救生命与家庭。
2024年9月,《财富》杂志公布2024年“改变世界的公司”榜单,阿里巴巴因为这项AI早筛癌症技术当选第8名,成为唯一入选前十的中国公司。该榜单发布10年以来,阿里巴巴已经6次上榜,是上榜次数最多的中国公司。
2月24日,阿里巴巴宣布,未来三年投入超过3800亿元用于建设云和AI硬件基础设施。这是有史以来中国民营企业在云和AI硬件基础设施建设领域最大规模的一笔投资。“阿里将AI视为几十年一遇的行业变革机遇,首要目标是追求实现AGI(通用人工智能),不断突破模型智能能力边界。”阿里巴巴CEO吴泳铭说。
中国社会科学院工业经济研究所副所长季为民认为,从“电商之都”到“移动支付之城”,再到之后的“云城”和现在的“AI之城”,杭州的每一次产业升级开拓都与阿里巴巴有着千丝万缕的关系。以阿里为代表的数字创新企业和杭州的关系,是中国城市和龙头企业共生共进的一个典型案例。
“这超出了简单的一个企业落户一个城市的招商逻辑,它已经演化成数字文明共生体的逻辑。”季为民表示,阿里用技术创新重构杭州的城市基因,杭州又用包容、开放的环境来反哺阿里的进化,反映了一种“城企互动改变城市发展”的逻辑,重新定义了中国式现代化中的现代城企关系。
AI正在重塑时代的脉络,并重新定义阿里巴巴创造价值的方式方法。迈入AI时代的阿里巴巴值得期待。
“转载请注明出处”
来源:钱江晚报