摘要:2月6日,全球顶尖人工智能科学家、前Salesforce集团(CRM)副总裁许主洪(Steven Hoi)正式加入阿里巴巴(09988,以下简称“阿里”),出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。
2月6日,全球顶尖人工智能科学家、前Salesforce集团(CRM)副总裁许主洪(Steven Hoi)正式加入阿里巴巴(09988,以下简称“阿里”),出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。
阿里对外披露的信息显示,许主洪在人工智能工业界和学术界拥有超20年经验,其发表的300余篇人工智能顶级学术论文,引用量超过5万余次。其中多篇“多模态预训练”主题论文引用数位列当年全球前五。
2019年,许主洪还当选IEEE Fellow(电气和电子工程师协会会士),并被斯坦福大学评选为“全球前1%的人工智能科学家”。IEEE Fellow代表全球科学与工程技术领域的顶尖成就。
一个月前,阿里旗下阿里云与大模型“六小虎”之一的零一万物成立 “产业大模型联合实验室”,零一万物大部分训练和AI infra团队会加入该实验室,成为阿里员工。这一消息得到了零一万物创始人及CEO李开复的确认。
而包括是次许主洪的加盟,阿里近期已连续两次公开“进补”AI大模型相关高级人才。
这也进一步削减了外界对阿里大模型高级人才团队流失的担忧。2024年11月13日,阿里申请仲裁“通义大模型前员工周畅违反竞业协议”的消息在 AI 圈传播开来;同年12月初,通义千问大模型技术负责人周畅(阿里花名“钟煌”)被字节跳动以 8 位数年包工资挖走的消息得到确认。
种种迹象表明,在Scaling Law (规模化法则)变慢、国内外大模型洗牌进入到“头部”公司后,阿里对“All in AI”的拥抱不仅没有犹疑,还抓紧一切机会,并与之前“大手大脚”的新零售投资策略不同,极其高效、经济地布局阿里的AI生态圈。
用户和AI战略的取舍玄机
2023年9月,接替“逍遥子”张勇担任阿里新一任CEO以来,“东邪”吴泳铭为阿里确定的两大战略重心是:用户为先、AI驱动。
前者解决的是阿里的战略选择问题。
自阿里创始人马云开始,“客户第一、员工第二、股东第三”的核心价值观曾促成了阿里国内电商市场份额的登顶,“打着望远镜也找不到对手”。但拼多多(PDD)以农村包围城市的策略,通过“砍一刀”、“仅退款”等低价方式先占领“五环外”用户心智,在2023年11月底市值首次超过阿里,阿里的危机感被放大至顶点。
与吴泳铭一起搭班子的阿里董事局主席蔡崇信曾公开回应过这一战略选择的重要性。
“从战略上讲,在我们的电子商务业务中,我们决定始终把用户放在第一位。”蔡崇信说,阿里在试图定义谁是客户方面一直很挣扎,是商家还是实际购买产品的用户?“我们已经决定首先关注用户,因为他们实际上是最终花钱来造福我们的商家的。他们实际上转换成购买,这将为我们创造业务量。所以,用户第一,拥有这种极端的专注,并对什么是重要的、什么是不重要的有一个非常清晰的战略方向,这就是我们的股东应该从管理层期望的。”
这也表明了阿里联合创始人之一、公司内口碑极佳的“吴妈”吴泳铭的魄力。在电商攻守易势、阿里发展面临重大抉择的巨大变数下,他敢于廓清困扰,甚至不惜推翻创始人马云曾倡导的阿里公司价值观。
AI驱动则是吴泳铭选择的战术路径和药方。
在掌舵阿里后,吴泳铭一方面大力汰换管理架构、大胆启用大批80后“少壮派”,叫停阿里云、菜鸟等的分拆上市,为阿里电商的全面反攻积蓄组织、资源等势能;另一方面,拥抱AI、以技术驱动扭转拼多多、抖音等新晋电商巨头导致的淘(宝)天(猫)购买体验相对不足的用户认知。同时,AI模型即服务还成为阿里云营收保存量、扩增量的重要基点。
对此,蔡崇信亦曾对外披露过吴泳铭做此选择的综合考量。
“阿里实际上是为数不多的既拥有专有内部AI能力、又有云业务的公司之一。”蔡崇信表示,微软(MSFT)和Open AI是两家独立的公司,他们现在有一个非常好的合作伙伴关系,但也许将来他们会分道扬镳。所以微软实际上并没有自己的AI开发,他们基本上把它外包给了OpenAI。亚马逊(AMZN)有云业务,但他们没有自己开发的专有AI(《财中社》注:亚马逊也在自研,但目前相对落后)。就大语言模型而言,META有开源的大型语言模型LLaMA,但他们没有云业务。唯一一个拥有两者的公司是谷歌(GOOG),但谷歌在云计算和AI方面都是第三,有人说他们不如OpenAI好。
“如果你来到中国,看看阿里,我们是唯一既运营领先的云业务又在AI方面具有竞争力的公司。”蔡崇信说,AI和云的结合很重要,因为任何使用阿里AI的人,都能使用阿里的开源版本,也能使用专有版本,并且使用阿里云提供的云计算能力。同时,阿里还开发了ModelScope开源AI社区,这样,阿里云计算收入就更有保障。像阿里2024财年四季度(2024年一季度),AI收入在云业务中增长了三位数。
“过去22个月,AI发展速度超过任何历史时期,但依然处于AGI(通用人工智能)变革的早期。”2024年9月,吴泳铭在2024云栖大会发表主题演讲时称,生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级App,而是渗透和接管数字世界,改变物理世界。
在吴泳铭看来,虽然已出现了大量AI应用落地,但AGI还未到来。他以大模型为例谈到,以前大模型只能写简单代码,如今可以理解需求,完成复杂任务编程。“这就像是去年AI的数学只是中学生水平,今天已是国际奥赛金牌水平,物理、化学、生物等学科已达博士生水平。”
吴泳铭同时指出,模型推理成本指数下降,速度远超摩尔定律。“比如,阿里云大模型推理成本下降97%,百万token调用花费低至5毛,未来还会继续降成本,并推动开源模型高速发展。”
“AI产生的价值,将是移动互联网连接价值的十倍、几十倍。”吴泳铭预测,以前AI是模拟,如NLP,语音视觉;到了AIGC时代,则从感知升级到思考、推理和创造。“未来,世界拥有最统一的语言‘Token’,任何文字、图片、代码、图像、声音、千百年思考都可以是Token。”
左手投资,右手“并购”
正是基于对AGI的坚定看多,吴泳铭全面主导阿里对AI的下重注,左手投资AI大模型“六小虎”中的五家,右手“并购”整合行业中的高级人才,出手果决,不放过任何机会。
接近阿里与零一万物 “产业大模型联合实验室”的知情人士告诉《财中社》,双方的合作谈判其实始于2024年三季度。彼时,零一万物的大模型刚刚在一场国际公认的技术测试中,以较低成本取得了中国参测大模型的领先排名,并居于全球TOP7之列。
而基于对行业发展趋势的判断,零一万物CEO李开复认为,中国大模型创业公司面临GPU芯片的限制,融资额和估值也远低于类似的美国公司;同时,Scaling Law 在变慢,创业大模型公司无法和大厂比拼“烧钱”,因此,放弃独立AGI大模型研发,转而与头部大厂合作;转而投注精力和资源在细分垂直领域客户,让客户因为大模型的助益获得营业额翻倍,是“小虎们”最好的 PMF(产品市场匹配度)。
“因此,阿里与零一万物的合作,既不是零一万物的被动选择,更不是零一万物的后劲不足。而在阿里核心决策层(大概率是吴泳铭)拍板的消息传出后,多家小虎模型其实非常羡慕零一万物。”上述知情人士表示,做好大模型、卖于大厂家,其实是诸多国内大模型创业厂商的成功变现路径之一。
但与阿里“新零售”时代“大手大脚”的并购不同,吴泳铭主导下的AI投资和“整合”充满了“精打细算”的味道。
《金融时报》2024年5月报道称,阿里正以算力支付形式投资多家中国AI大模型创企,比如其投资月之暗面8亿美元的近一半份额是以“云积分”形式提供。
据透露,与微软对OpenAI的投资类似,阿里对AI大模型创业公司的投资方式强调算力支持。但不同的是,阿里的资金并未直接转给被投企业,而是被存放在一个代管账户中,并可以被计入阿里收入。这样,阿里一方面全方位押注AI大模型赛道,另一方面又通过被投企业向阿里购买云计算服务,获得阿里云AI服务的增量收入,“面子”“里子”双丰收。
此外,阿里接收零一万物大部分训练和AI infra团队、引入许主洪,同样不再是之前采取直接并购公司的方式获取人才,而是以人才引进的方式尽量降低成本、对冲风险。
在官宣加入阿里前,2023年,许主洪创立人工智能初创公司HyperGAI,专注于多模态GenAI技术和解决方案的创新。2024年3月,HyperGAI提出HPT多模态大型语言模型框架。
注重引入人才的“实战”价值,许主洪加盟阿里的路径,与阿里接收零一万物团队的方式极为相似。
接受“岔路口”,对冲赌注
而与阿里现在谨小慎微的投资、“并购”整合不同,2月5日晚,阿里宣布子公司及New Retail与德弘资本达成交易,以最高约131.38亿港元的价格出售所持大润发母公司高鑫零售(06808)的全部股权,合计占高鑫零售已发行股份的78.7%。
公开资料显示,2017年,阿里以224亿港元收购了大润发和欧尚品牌母公司高鑫零售36.16%的股份;并于2020年10月进一步以约280亿港元,通过其子公司淘宝中国收购高鑫零售大股东吉鑫控股有限公司合计70.94%的股权。经过一系列转换,交易完成后,阿里连同其关联方合计持有高鑫零售约78.7%的股权权益。
按此简单测算,不计运营成本,阿里仅并购又出售高鑫零售78.7%股权的账面浮亏,已高逾370亿港元;而此前,阿里出售银泰录得的亏损约为人民币93亿元。
显然,明面上,阿里和吴泳铭投资MiniMax、月之暗面、零一万物、智谱AI以及百川智能5家大模型独角兽,成了中国大模型独角兽的“提款机”;但从投资方式上,吴泳铭时代的阿里投资风格已迥然不同。
蓝媒汇形容吴泳铭称:很多阿里人都知道,和他的花名“东邪”反差明显,吴泳铭不是一个性格犀利的人。他少言寡语,性格低调,很少会主动发言,也没有引人注目的举止。在圈内他最广为人知的称号,并非“东邪”,而是“吴妈”。
而“勒紧裤腰带”过“苦日子”的吴泳铭,一方面杀伐决断地出售阿里旗下非电商核心业务,为阿里All in AI集聚“粮草”;另一方面,阿里大模型产品的性能打磨已经慢慢出圈。
2月6日,美国斯坦福大学和华盛顿大学研究人员李飞飞团队宣布,基于阿里云通义千问Qwen2.5-32B-Instruct开源模型的微调,以低于50美元的云计算成本训练出人工智能推理模型s1-32B。该模型在数学及编码测试中表现与OpenAI的o1、DeepSeek的R1等尖端模型相当。
“我们是五个其他大型语言模型的叔叔或阿姨。当他们的模型训练时,他们必须使用我们的云计算资源,这对我们的云业务有帮助。但这也是对冲我们赌注的一种方式,在过去25年中,我们了解到,如果你负担得起,你可以选择专有的、开源的,或者投资于别人。AI是一个太重要的领域,你不能只走一条路。”蔡崇信说,这让他想起了一句话,当你来到一个岔路口时,就接受它。
最新传闻是,阿里计划以100亿美元的估值,投资10亿美元认购DeepSeek(DS)10%的股权,目前双方正在就具体执行细节进行沟通。按传闻所称,阿里云将作为DeepSeek的第一推理算力选择,这意味着双方将在AI领域展开深度合作,一如阿里之前投资大模型“六小虎”。但阿里辟谣称“假消息”。要成为六个其他大语言的叔叔或阿姨,尚需时日。
来源:新浪财经