AI浪潮里的杭州与阿里巴巴

360影视 欧美动漫 2025-05-19 20:43 1

摘要:自今年春节过后,杭州就成为了热门科技城市,DeepSeek、宇树机器人等“杭州特产”爆火。作为杭州本土互联网大厂的代表,阿里巴巴同样助推了这座城市的科技形象,其通义千问Qwen系列大模型在国外的技术者开发社群好评不断。4月29日,阿里Qwen3系列模型发布,一

自今年春节过后,杭州就成为了热门科技城市,DeepSeek、宇树机器人等“杭州特产”爆火。作为杭州本土互联网大厂的代表,阿里巴巴同样助推了这座城市的科技形象,其通义千问Qwen系列大模型在国外的技术者开发社群好评不断。4月29日,阿里Qwen3系列模型发布,一经发布就立刻登顶了全球开源大模型榜首。

这给了我们一个重新去打量杭州的机会。它曾经以风光秀丽、旅游胜地而著称;改革开放后,民营经济又塑造和滋养着这座城市的文化氛围。1999年,阿里巴巴在湖畔花园的一间民宅成立,成为为数不多扎根在北上广深一线城市之外的互联网公司,在接下来的二十余年里,企业与城市之间有机共生,对彼此都产生了深远的影响。

今年3月,我回到自己的家乡杭州,希望穿越重重迷雾,看看这里到底发生了什么。在这里,我见到了经验丰富的外贸生意人、年轻的AI创业者、大厂员工、政府的公务员。其中一位受访对象告诉我,事物之间常有联系,我们常说杭州今天如何、阿里今天如何,但十几年前早有草蛇灰线。

AI接下2000万美元大单

徐镜钱今年已经58岁了,他在浙江义乌经营一家机械设备有限公司,已经30余年。今年年初,徐镜钱的一位外贸业务员在清晨时打开后台,发现昨晚夜深人静时,一位来自迪拜的大客户发来了消息,询问一款无油螺杆空气压缩机的价格。员工“Eva”及时回复,与客户进行了五轮对话。

Eva的头像是一个戴着圆框眼镜、扎起头发的职业女性,看起来干练又亲和。她询问了买家购买设备的用途、物流接受地等信息,还询问了买家此次采购是为了定期维护、紧急更换还是特定项目,这些都是机械采购方面的特定问题。如果不是拥有多年经验的外贸业务员,很难与客户完成专业度如此高的问答。

这位来自沙特的买家完全不知道,隔着万里的网线,与他对话的Eva并不是一个“真正的人类”。实际上,Eva还有三位同事,分别是商品运营助手Maxwell、风险顾问Grace、与营销助手Noah,他们都是阿里巴巴国际站在2023年年底时推出的AI Agent。根据阿里的估算,这4个Agent已经超越了60%-70%人类外贸业务员的能力。

另一个AI分析软件显示,根据对话内容,客户“购买意向高”。徐镜钱抓住机会,邀请对方团队来中国考察工厂。客户先开出了一笔196万美金的订单,没过多久,又开出了一笔2000万美金(折合人民币一亿多)的大单。双方在春节期间完成了签单,从AI接到客户需求到成交,前后不到一个月。

在一年多前,Eva还远远没有这么聪明。另一位在福建创业的外贸人刘世奇今年28岁,是第一批使用阿里国际站AI Agent的内测商家,也比别人更早在外贸工作里尝试AI的应用。但他记得,最开始,AI和客户对话时,常会说“我们拿过这个证书、那个证书”、“我们公司有多少人”、“我们合作过多少个客户”——全都是关于这家企业空洞的介绍和包装。

但这不是客户需要的。刘世奇说:一个专业的外贸业务员,在表达上应该“直击客户的需求”,“不说废话”。你需要多少样品、我给你报价,你需要的样品背后更大的需求是什么,我帮你发掘和解决。

每周,位于杭州的阿里国际总部会给刘世奇这样遍布全国的内测商家出题,要求他们“在AI的三套回复模版中选择出最合适的”。刘世奇将自己的意见和需求提报给杭州,帮助AI Agent变得更适合实战操作。“他们(阿里)虽然能够(把模型)训练出来,但实战端、操作端还是在我们商家身上嘛。”刘世奇解释这些如何与AI磨合的工作流程时,正在前往杭州去阿里的路上,接下来要连续数日参加几场与外贸或AI有关的活动。

在刘世奇等内测商家的帮助下,随着模型能力的迭代,AI Agent变得越来越“聪明”,越来越接近真正的人类外贸员了。他们的业务能力出色,了解各项法规政策,掌握全球多种语种。与此同时,他们不需要考虑时差问题,在中国的商家工作人员晚上休息的时候,他们可以24小时在线服务海外客户。未来,阿里预计AI Agent将超越90%外贸业务员的能力。

“AI协助接下2000万美金大单”,说起来惊人,其实AI只做到的是一件很简单的事:就是及时在线回复了客户。大部分海外客户在第一轮询盘时的策略都是“广撒网”;作为供应商,各外贸公司的业务员则需要“比速度”。虽然简单,但在过去,外贸业务员们为了第一时间与海外客户沟通,需要长年熬夜,付出健康的代价。有了AI Agent,外贸业务员们再也不用做“时差青年”了。

与我们所熟悉的在淘宝上网购相比,外贸是一个非常复杂的场景。“AI在越是复杂的场景里,越能发挥最大的作用。”一位受访对象告诉我们。全球共200多个外贸市场,整条链路有近40个环节,几乎每个环节都有AI的用武之地。

比如,2024年11月,阿里巴巴国际站上线了一个叫作Accio的搜索网页。不同于过去的“关键词搜索”,准备做生意的商家能在Accio上搜索一个“非常长的需求”,比如:“我想在沙漠建一个滑雪场”、“我想在纽约建一个咖啡馆”,或者,“我想采购每平方米克重在260-280之间的含棉布料”。Accio会根据你的需求,直接生成一个商业计划,并将你可能会需要的商品链接植入在商业计划中。上线以来,Accio已经突破了100万买家。

语言问题也是外贸的“大问题”之一。中国做外贸的工厂大概有60多万家,绝大多数都是“中小微”,他们都是对着老一辈传下来的经验,再加上谷歌翻译来回复客户的。从前的机器翻译基于“统计学”,它的工作原理就是将中文词语与英文词语基于已知的翻译规则快速匹配,这种翻译方式无法准确地理解整个语境,容易有错漏和不准确。

而“大语言模型(large language model,LLM,现在更多直接简称为“大模型”)的出现,对于翻译是革命性的”。现在的大模型可以像一个真正的母语使用者一样,推测言外之意,“理解”上下文,其错误率比传统方法低50%以上。可以说,大模型极大地解放了对外贸业务员英语能力的要求。一家位于大连做婴儿玩具的外贸企业的老板是自己公司的英语天花板,而他招进来的员工普遍“英语刚过四级”。他说,除英语能力外其他能力更强的员工,现在反而能做下更大的单子。另一家在福建做鞋靴的外贸企业老板则说,“过不过四级都无所谓”。

2025年4月,美国特朗普政府对中国等贸易逆差国实施“对等关税”,最高达165%;中国迅速反制,将对美商品关税提高至125%。5月12日,中美日内瓦经贸会谈联合声明发布,双边关税水平恢复至4月初之前的水平。即便如此,前所未有的不确定性还是笼罩着中国外贸行业,每个人都需要寻找新的出路,而AI对外贸行业效率的提升,给了外贸人一些希望。

一位阿里国际站的工作人员提到,这几年,人人都在说电商零售行业的内卷。但到底怎样才能反内卷?“肯定不是靠道德去约束”,其实就是要去开拓新的蓝海。“虽然现在都在说逆全球化,但世界贸易的交流还是不充分的。”

杭州良渚成了AI的物理集聚地

浙江作为民营经济大省,省会杭州在二十多年前就培育出了阿里巴巴,新生代又有DeepSeek、宇树等“杭州六小龙”。它们在受到全国瞩目之前只是默默无闻、野蛮生长,但背后总有一群带着创业梦想的人,活跃在这片商业友好的土壤里。

现在,很多搞AI创业的年轻人又聚集在了杭州良渚。这个占地一万多亩、毗邻良渚考古遗址的社区是一个由年轻人、自由职业者、技术开发者们构成的小型熟人社会。这里风景优美,社群氛围浓郁,人们津津乐道于杭州政府的“非必要不打扰”政策。大家还有自己的“村民食堂”、“村民公约”等。“村民公约”的内容包括:邻居见面要主动问好,不能对小孩子大声说话。

今年三月中旬的一个午后,我打车来到良渚玉鸟集——传说中的“理想社区典范”,早春春光里,漫咖啡的露台上、台阶上,坐满了三三两两的人,他们沐浴在下午两三点的阳光里,轻声漫语地聊工作。置身其间,宁静感油然而生。

启师傅是良渚当地的活动组织者之一,他以前在北京的大厂做产品经理,现在,他带着一个两三人的小团队创业,也在用AI开发一个关于“待办清单”的App。业余时间,他会在良渚发起“Demo Day”(“演示日”)。“Demo Day”是从硅谷引入的概念,指专为展示新兴科技、创新项目或初创企业成果而设计的公开活动。从去年11月到现在,启师傅已经发起了四期。其中,今年3、4月份这两期,都是AI相关的。

AI Demo Day在良渚的露天小区举办。椅子不够,附近的居民就从家里搬小马扎过来。人们分享的主题充满了当下性,有AI算命、AI桌游、AI编程、AI播客、AI 3D打印等。

4月初的Demo Day上,David分享了他使用AI编程的经验。David是启师傅在良渚的邻居,也是一个文科生,完全没有任何编程基础。依靠AI编程,他已经完成了5个App的开发。

刚开始创业的时候,David选择“雇人完成写代码的工作”,但“第一步就卡在怎么分股份上”。作为老板,他需要考虑怎么平衡大家的“权责利”,其中涉及到不少与人的琐碎磨合。即使能遇到一个“很合适”的合伙人,一般而言,能合作的时间也不会超过五年。

David考虑的另一条路径是技术外包。技术外包的问题在于,一个App,第一个版本就能成功的概率很低,它还需要不断迭代、维护、升级。如果从一开始找的就是外包,维护时还需要不断往里贴钱,投入产出比很难维持在合理的水平。如果专门去雇一个技术人员,资金压力还会更大。

为了合理地节省成本,同时将产品把控在自己手中,David走上了AI编程的道路。最开始,他将自己对代码的需求输入AI,发现AI能完成“一个模块的程序”,David有了信心,“只要你能搬起几块砖砌一面墙,你离盖一栋小房子就不远了”。

AI的能力发展得非常快。现在,David只要与AI“纯对话”,就能完成编程。同时,AI还会“写页面”,即自动完成代码所需要的全部格式。David说,以前需要几个人干一两天的活,现在“只需要几个小时”。启师傅的团队工作时,以前20%-30%的代码是用AI写的,现在95%以上的代码是用AI写的。

杭州良渚已经出现了很多像David这样的“超级个体”、“一人公司”。在以前,“超级个体”的门槛很高,因为很少有人能同时兼具多方面的能力。但现在,AI将这些原本门槛很高的事都解决了。

David的故事也出现在“启师傅的AI客厅”这档播客中。这是启师傅在空闲时间运营的播客,他说,这档播客本身的制作也有AI的参与。他会将他邀请的嘉宾的过往报道、播客链接全部喂给AI,让AI生成一份标记了重点的文档。在这个基础上,他又会让AI继续生成一份采访提纲。整个过程中,需要用到多种AI模型“协同作战”。

“不同的AI模型擅长的事不一样。”启师傅说。Anthropic开发的Claude适合编程和做矢量图,ChatGPT-4o适合作图,DeepSeek-V3也适合编程,文案能力也很好。阿里巴巴的Qwen系列则主打多模态,适合做微调和本地部署。一个擅长使用AI的人,可以用各种不同的AI模型打配合,共同帮助自己来完成一件完整的事。

开源开放,才是长期主义

2025年4月29日,阿里巴巴发布Qwen3系列模型,这是Qwen系列大语言模型的最新成员。

与DeepSeek一样,Qwen是另一个有名的开源大模型系列,由阿里巴巴于2023年推出。在GitHub、HuggingFace等国外技术开发者社区里,Qwen的好评度居高不下。我们熟悉的DeepSeek用户端只是大模型AI实际应用的一种场景,即聊天。大模型还有很多使用方式,譬如搜索、写代码。甚至,你可以用一个模型,去设计和生成另一个模型。

AI科学家李飞飞领衔的斯坦福大学人工智能研究所发布的《2025年人工智能指数报告》评选出了2024年重要大模型(Notable Models),前两名是谷歌、OpenAI(各贡献七个开源模型),第三名就是阿里巴巴通义千问。Qwen-2、Qwen-2.5与DeepSeek-V3共同入选了2024年最具代表性的模型、数据集和功能发布。报告还指出,中美顶级AI大模型性能差距大幅缩至0.3%,可以说几乎抹平了。

前两年,由于电商零售行业的低价内卷,人们只关注阿里巴巴与其他电商公司在市场份额上的此起彼伏,却未能重视阿里在AI方面的能力和积累。随着DeepSeek的爆火出圈,阿里的资产被重估,2025年年初两个月股价涨了七成。最近,阿里已经与苹果达成了AI战略合作,将为中国版iPhone开发人工智能功能。在一位阿里内部的工作人员看来,多年来阿里在技术领域的深耕,借由此次机会,终于“被看到了”。

自阿里巴巴1999年成立以来,它在每个阶段都需要回答“阿里是什么”。其实,阿里一直不是一家典型的电商公司,甚至不是一家典型的互联网公司。它擅长的是,看到有需求就去服务,看到有问题就去解决,而科技进步往往就是最好的解决方案。

2009年,由于电商业务爆炸性的增长,阿里的服务器快撑不住了,为了解决“底层能力扩容”的问题,阿里决定开发自己的云服务,为其各项基础业务提供“算力”。

阿里云初创时,“云计算”这个业务概念还未在互联网圈子里形成共识,需要一个负责人,马云选择了心理学博士、曾担任微软亚洲研究院副院长的王坚。阿里云创业初期筚路蓝缕,员工离职率居高不下,王坚则一度被视作“骗子”,受到过许多内外部的质疑。

一个视频在后来广为流传。2011年深圳五洲大酒店的IT领袖峰会,BAT三家的掌门人马云、李彦宏、马化腾三人在台上讨论云计算,其中一位看好,两位不看好。不看好的是技术出身的李彦宏与马化腾,看好的则是学英语出身的马云。

李彦宏当时在台上说:“有一个非常关键的问题,到底云计算杀手级应用是什么?如果整天拿以前就存在的服务来讲说这是云计算,这是忽悠人!”

马云回应说:“通过共享来降低成本,这可能就是所谓的云计算真正的核心应用……我记得从阿里巴巴来讲,12年前我们做B2B不知道怎么挣钱,但有人用;淘宝起来我们也不知道怎么挣钱,但有人用……我们公司的策略非常简单,我们不知道数据怎么挣钱,但我们知道数据对老百姓、每个人的应用越来越大……对社会有贡献我们就做下去,这是我们最简单的理解。”

很多年后,阿里云不仅为淘宝、天猫、菜鸟等业务提供了巨大的算力,推动了阿里自身的数字化转型,增强了技术的自主可控性,还吸引了大量开发者和客户。现在,阿里云孵化出了通义千问大模型,它开始带着其他业务部门发展,甚至能为杭州这座快速发展中的城市解决一些问题。杭州知名的城市服务项目“浙里办”和“城市大脑”,背后都是阿里云所提供的算力在做支撑。

2023年7月,阿里巴巴通义千问面对一个新的抉择时刻:开源还是闭源?开源意味着,开发者将自己投入资金、人力、时间开发出的技术直接免费公开给技术社区,让每一个人、每一家公司都能参与研究,不收一分钱。但有时,这会给开源技术的开发者带来远超金钱的回报。

并没有犹豫太久,很快,阿里巴巴通义千问宣布自己将坚定地选择一条“开源”的道路,而这一选择像此前多次一样在行业里备受争议。直到今年年初,由于DeepSeek等开源模型的成功,闭源技术路线的拥趸越来越少,许多原来坚持闭源的大模型公司也被迫选择不同程度上开源了它们的模型。

如果把视野放宽广一点,不仅作为杭州公司的阿里巴巴和Deepseek更多选择了开源的技术发展路线,杭州的一些风土人情也呈现出类似于“开源”的特点。

2002年,杭州市政府推动西湖免门票,使西湖成为了国内唯一一家不收门票的5A级景区。西湖当年直接减少门票收入2530万元。但巨大的游人量直接撬动了杭州的餐饮、住宿等现代服务业,提升了杭州的第三产业。杭州政府曾经总结出一种“241算法”,意思是只要每个游客在杭州多逗留24小时,杭州的年旅游综合收入便会增加100亿元。有人指出,这背后有一种“互联网”的精神。

从2010年以来,杭州市常住人口数量从870万增长到了2024年的1262万,其中大部分都是外来迁入人口。近年来杭州被许多人戏称为“美食荒漠”,是因为外来人口短时间内增长太快,而杭州的餐饮丰富程度没能及时跟上外地来杭定居人才的口味需求。另外,相比起上海话、南京话在各自地盘的强势,杭州话也不是一种在本土足够强势的方言,恰恰相反,即使在杭州主城区,杭州话跟周边的萧绍地区、苏州上海经历了许多融合。

在外地人才涌入的同时,杭州市政服务也显现出一种与众不同的开放气质。几年前,浙里办的“最多跑一次”很出名,网上有很多“自来水”。浙里办是浙江政务服务网推出的一款App,它整合了59个政府部门368亿条数据,实现“一证通办”296项事务,市民办事时间平均缩短2小时。对外来人才而言,不管是迁户口、申请补贴、办各种证,都非常好用。

投入AI的每一分钱,都会有回响

曾经在天猫、阿里云等业务工作多年的袁霖第一次听说“大模型”这个概念,是在2020年。基于阿里巴巴自己的“M6大模型”技术(可以视为Qwen的前身),阿里开发了“犀牛智造”项目,第一次将大模型AI技术应用在了服装工厂生产上。当时的项目同事告诉他:“我们现在有一个特别牛逼的技术!”袁霖记得,“我也是在阿里云干过的,你说神经网络什么的我起码还知道一点”,但说到M6大模型,“我当时一个字都听不懂”。

传统服装工厂长期以来最大的痛点是“以产定销”。工厂只有产线全开,大量稳定生产,才能使成本最低,利润最高,边际效用最大化。这种方式的问题是,工厂永远无法准确预判其大量稳定生产的产品究竟能否被市场接受、是否被消费者喜爱,因此总是出现大量囤货无法卖掉的情况。一件大衣卖几千块钱,其中就包含了卖不掉的那部分大衣的成本。

针对这一困境,各大电商零售平台都在想办法。阿里想到的一个办法是柔性制造,以销定产,小单快返,50件起订,7天出货。这个过程就需要使用到大数据与AI,精准指导生产,使得资源配置更具效率。2020年,犀牛工厂一度被世界经济论坛评为“灯塔工厂”(也就是世界上最先进的工厂)。当年,世界“灯塔工厂”总共54家,分布在全球各地,来自中国地区的有16家。它也是服装行业唯一一座“灯塔工厂”。

袁霖说,犀牛智造的理念其实很超前。可惜在当时,各方面的条件都还不够成熟:一方面,模型能力不够强,迭代能力跟不上市场波动。另一方面,市场认知与接受度低,对B端工厂的教育成本高,工厂老板普遍更愿意使用裁员等更直接的“降本”方式,而非进行长期的技术投入。因此,这种柔性制造的方式一直没有被大规模采用。

但是,这些尝试并不是什么都没有留下。“比如说人才。”袁霖说。

2014年,阿里巴巴成立了“IDST”(Institute of Data Science & Technologies,数据科学与技术研究院),“一个神秘的机构”,它是达摩院的前身,做数据研究工作。王坚对它的角色定位是,“IDST要做阿里其他部门不愿做、也做不了的事情”。

2017年云栖大会上,阿里巴巴宣布成立达摩院。达摩院在IDST的基础上,沿用了“标准的AI团队分法”,分成计算机视觉(CV)、自然语言处理(NLP)、语音识别等几个方向,并新增了机器智能、区块链、量子计算、自动驾驶等领域,在大数据、智能网联、金融科技以及AI硬件等多个产业方向上进行深度布局。

无论是研究院里的学术人才,还是接触过大模型在工业层面的具体应用的项目人才,在基于Transformer架构的AI大模型时代正式到来时,他们都会表现得更有经验。其中一些人后来从阿里离开了,却仍然选择留在杭州这片热土继续自己新的事业,令这座城市受益。IDST和达摩院的尝试影响深远,现在回过头去看,无论在阿里巴巴内部、爆红的“杭州六小龙”还是良渚AI创业者社区,都能感受到这些看起来虽然不够贴近实际业务和商业,但却足够有价值的痕迹。

“条件真的成熟了。”袁霖感叹,现在,Qwen系列的模型能力已经远超当时的M6大模型。而用户对AI的接受度,也已经在这几年高强度不间断的AI新闻洗礼下,被培养到了一个新的阶段。

新的气息在涌动,这不是一种错觉。我的父母在浙江的体制内工作,关于科技发展的进程,他们了解得比我更多。最近,浙江政府掀起“近30万干部学AI”的风气,阿里云创始人、之江实验室主任王坚就给他们上过课。我妈妈对我说,“算力是现在最重要的资源”,我为她鼓掌说,这你都知道!她翻白眼说,这你都不知道,你是不是活在远古时代?

AI的发展的确正在卷入更多人进来。在杭州良渚组织AI社群的启师傅告诉我,“你这个月写这篇文章,和下个月写,就会不一样”。

来源:正面精选

相关推荐