摘要:同时,另一位WizardLM开发者郑凯(KAI Zheng)也公开宣布加入了混元团队。虽然后续徐灿与郑凯两人都对该博文进行了删除,但X简介显示均为腾讯混元团队一员。
近日,人工智能领域发生了一件备受瞩目的事件,微软旗下知名AI华人研究团队WizardLM加入了腾讯混元。
5月14日下午消息,WizardLM项目创建者徐灿(Can Xu)在X平台上发文宣布,他和WizardLM团队已离开微软,加入腾讯混元。
同时,另一位WizardLM开发者郑凯(KAI Zheng)也公开宣布加入了混元团队。虽然后续徐灿与郑凯两人都对该博文进行了删除,但X简介显示均为腾讯混元团队一员。
另外,X平台显示,WizardLM联合创始人孙庆丰(Qingfeng Sun)也已经加入腾讯混元。
目前尚不清楚该团队是否全员加入腾讯,以及何时离开的微软。但《科创板日报》援引知情人士言论称,WizardLM团队共6名主力成员,目前大部分已离开微软。
公开资料显示,徐灿本科毕业于四川大学计算机专业,硕士毕业于北京大学计算机技术专业,导师为俞劲松。徐灿曾任微软人工智能高级研究科学家,为微软小冰、必应、WizardLM 和 Phi-3 等项目贡献了核心技术。
徐灿领导了WizardLM系列模型的研发,包括WizardLM 1&2、WizardCoder、WizardMath,在 NeurIPS、ACL、ICLR、EMNLP、AAAI 等顶级国际会议上发表论文40多篇,在Google Scholar上被引用超过3300次。
在加入微软之前,徐灿曾在百度深度学习研究院,做研究实习生。2017年4月加入微软亚洲研究院,在自然语言计算组任副研究员。2024年6月开始,任微软AI高级研究科学家。根据其最新X简介显示其为腾讯混元团队TXhunyuan首席研究员。
另外,联合创始人孙庆丰曾任微软人工智能研究科学家,本科毕业于合肥工业大学,2020年硕士毕业于北京大学。他与徐灿等人共同创立了WizardLM项目。据其领英显示,其已于2024年12月加入腾讯。
WizardLM团队在成立之初也取得了不小的成就。2023年,微软和北京大学的研究团队提出了一种名为 Evol-Instruct 的新方法,通过让LLM 自动生成复杂指令,显著提升了模型在处理复杂任务时的表现。他们基于LLaMA微调的模型 WizardLM,在处理高复杂度指令时甚至超越了OpenAI的ChatGPT。
值得一提的是,当时参与该项目的还有国内AI六小龙之一——上海阶跃星辰创始人、CEO姜大昕。他是纽约州立大学计算机科学博士,2007年加入微软亚洲研究院任首席研究员,曾任微软全球副总裁、微软亚洲互联网工程研究院(STCA)副院长和首席科学家。
到2023年8月,在斯坦福评估系统LLM排行榜中,WizardLM 甚至进入全球大语言模型榜单的全球前四,而前三位分别是GPT-4、Claude和ChatGPT,WizardLM也是华人团队开源模型第一名。
但该团队的模型也闹过“乌龙”。2024年4月,微软隆重发布号称“接近GPT-4”的开源大模型WizardLM-2,但在不久后就紧急全网撤回,官方称该模型尚未经过“毒性测试”。“毒性测试”是确保 AI 输出不会产生有害或偏见内容的标准程序。
尽管团队承诺补测并重新发布,但开源社区已迅速传播模型副本。以至于Hugging Face首席执行官Clément Delangue还发布一篇文章公开批评:微软此举还消灭了其他 WizardLM 模型,破坏了许多开源项目,损害了Hugging Face社区的利益。
众所周知,微软虽然有自研AI团队,但作为OpenAI的最大金主,也是其AI技术优先使用者,在AI技术领域已深度绑定。最新消息,OpenAI和微软正在讨论修改其价值数十亿美元的合作伙伴关系条款,其中包括微软提出愿意放弃部分股权,以换取其能够在2030年后使用OpenAI开发的新技术的权利。
相比之下,腾讯最近对其混元大模型研发体系进行了全面重组,成立了两个新部门,并增加了AI 基础设施的支出。
据悉,此次腾讯调整混元模型团队,将重心放在了研发体系的重构。这也意味着腾讯的AI战略将从业务驱动转向技术驱动,对于AI底座的研究将被强化。
就在5月14日,腾讯发布2025年第一季度财报,实现营收1800.2亿元,同比增长13%,毛利1004.9亿元,同比增长20%,净利润478.2亿元,同比增长14%。
AI也成为了腾讯本季度财报的关键词。腾讯在财报中表示,2025年第一季度,AI能力已经对腾讯效果广告与长青游戏等业务产生了实质性的贡献。同时,该公司加大了对元宝应用与微信内的AI等新AI机遇的投入。报告期内,腾讯研发支出达189.1亿元,同比增长21%。
2025年以来,腾讯混元大模型相继推出自研的腾讯混元深度思考模型T1和快思考基座模型Turbo S,均在公开基准测试中达到业界领先水平。据中文大模型测评基准SuperCLUE报告显示,腾讯混元大模型位列基础模型国内第二,综合实力稳居国内大模型第一梯队。
对于WizardLM团队成员来说,加入腾讯AI团队,或许也能有更多发挥空间。
来源:卓乎科技一点号