摘要:从ChatGPT问世起,ai交互大模型就深刻改变了人类的生活,也确定了第四次科技革命的方向,世界各国在模型效率和行业运用上不断竞争,力争在这次的科技浪潮中占据领先位置,国内在最初的探索和混乱之后,也明晰了方向,各种中文大模型如雨后春笋般诞生,在经过两年的大浪淘
从ChatGPT问世起,ai交互大模型就深刻改变了人类的生活,也确定了第四次科技革命的方向,世界各国在模型效率和行业运用上不断竞争,力争在这次的科技浪潮中占据领先位置,国内在最初的探索和混乱之后,也明晰了方向,各种中文大模型如雨后春笋般诞生,在经过两年的大浪淘沙,最终国内形成了基础模型四强的竞争格局,
一、豆包大模型 - 字节跳动
豆包大模型,从网上可查的资料来看,从2016年开始,字节跳动就已经成立了AI Lab,聚焦自然语言处理能力、机器学习、数据挖掘等研究,但是直到23年,chatGPT掀起了人工智能大模型浪潮之后,豆包才陡然加快研发进度,23年8月才开始小范围测试,2024年5月开始商业化运营。
虽然豆包模型入场较晚,但是其低价的token价格(0.0008元/千Tokens)、较好的交互体验还是让豆包在网络中迅速传播并快速扩张,2024年5月豆包的日均tokens使用量已经超过4万亿,7个月内增长了33倍,这个势头说一骑绝尘并不为过。
豆包模型在24年的发展迅速,更新频繁。8月上线音乐生成功能,9月发布视频生成模型(PixelDance、Seaweed),10月推出AI智能体耳机Ola Friend,探索AI硬件场景。11月正式推出视频生成内测。12月线图片理解功能,增强多模态能力。一月一更新,体现出研发团队紧跟发展,成果不断的势头。
2025年,豆包大模型还在不断扩展应用空间,字节跳动已经和80%的主流汽车品牌合作,覆盖了3亿终端客户,目前豆包App累计用户超过1.6亿,全球排名第二(国内第一)。
总结:豆包大模型凭借低价策略、多模态能力与字节生态支持快速崛起,技术迭代聚焦效率与场景落地。与国内其他模型相比,豆包大模型的优势在于性价比高,语音交互体验较佳,主要短板在于逻辑推理比较弱,而且核心模型未完全开源,企业定制仍然依赖火山引擎API,海外版Cici AI停服也体现其全球化进展缓慢。
二、通义千问(Qwen)- 阿里巴巴
作为国内乃至全球顶尖的科技公司,阿里不可能也不会在AI浪潮中掉队,阿里的达摩院早在10年代早就闻名遐迩,说明阿里巴巴早已开始布局ai,在NLP、机器学习领域积累技术。
通义千问在2023年4月启动邀请测试,23年9月开放给公众使用并推出App。
2023年12月开源720亿参数模型Qwen-72B,成为首批通过中国官方“大模型标准符合性评测”的模型。
2024年启用新域名tongyi.ai,强化品牌整合;
25年开源混合推理模型,支持本地化部署,推出的qwen3系列,首次实现“推理+非推理”混合模式。
相较于国内其他大模型,通义千问的强项在于它的多模态表现出众,其视觉模型Qwen-VL-Max超越GPT-4V,代码模型CodeQwen1.5-7B登顶HuggingFace榜单,都体现出通义千问在推理和识别方面的技术力极强。
同时,通义千问的开源生态也是它的优势之一,累计开源200+模型,衍生模型超10万个,下载量3亿次(全球第一)。
通义千问的短板,在于它的数据时效性较低,它的训练数据截至2021年,也就是说如果不开启联网搜索,它所推理依赖的信息都是2021年前的。同时通义千问也面临着全球化竞争疲软,海外市场拓展缓慢的困境。
三、deepseek - 深度求索
作为全球ai竞赛的“中国黑马”,deepseek的崛起在很多人看来极为突然,仿佛一夜之间它就进入了第一梯队,成为国产大模型中的佼佼者。但其实deepseek的算力积累和技术积累早在2016年就已经开始,2016年创始人梁文峰在浙江大学期间参与创立High-Flyer(幻方量化),专注于AI量化交易算法,2019年时储备了大量英伟达GPU(如A100),为后续AI研发奠定算力基础。
2023年7月17日杭州深度求索公司(DeepSeek)正式注册,由幻方量化全资支持,定位开源AI技术公司。
2024年一整年深度求索都在不断突破技术和构建开源生态,推出了4个版本的大模型同时实现开源。
2025年春节期间,是deepseek爆发式增长的关键节点,1月20日推理大模型DeepSeek-R1发布,API成本比OpenAI o1降低95%,但性能比肩OpenAI o1的性能,并且开源免费,直接引爆市场,让deepseek登顶中美应用商店下载榜。其后更是被央视誉为“打破AI闭源垄断”。
Deepseek的技术亮点在于它的新型架构显著降低了模型训练的算力需求,提高了40%的训练效率,同时支持千亿参数低成本部署。而从普通的消费者角度,它的优势并不是很明显,只是在数字、代码能力方面较为出众。而deepseek的缺点也很明显,它非常依赖高端芯片的算力,而目前高端芯片对于中国公司是禁售的,如何在有限的算力资源下继续实现模型的发展和更新,显然是研发团队需要面对的重要问题。
四、文心一言 - 百度
文心一言的前身是百度2019年发布的知识增强大模型ERNIE 1.0,它基于百度自家的飞桨深度学习平台,通过融合数据与知识提升学习效率。
从19年到21年,百度的智能大模型发展并不快,从ERNIE 1.0迭代到ERNIE 3.0,都没有表现出能自由交互的智能性。
直到2023年2月7日,百度官宣“文心一言”(ERNIE Bot)项目,定位生成式AI产品。2023年3月启动邀测,展示文学创作、商业文案、数理推算等五大能力。8月向全社会开放,首日回复超3342万个问题,APP登顶应用商店榜首。2023年12月,文心一言的用户规模突破1亿,飞桨开发者达1070万。
后续文心一言不断进行技术迭代和生态扩张,直至今年三月,百度发布文心大模型4.5和X1,全面免费开放,截至25年4月,文心一言用户规模达4.3亿,日均调用量16.5亿次(一年增长33倍)。
文心一言免费
文心一言的优势在于其中文理解能力,它的中文理解能力在行业内处于领先地位,综合性能也接近GPT-4,但多语言支持较弱,全球化进展缓慢。
总结和展望
从上述四个大模型的发展历程,首先我们可以看出,国内大模型的崛起和发展大多都在23年后,那么,为什么是23年呢?因为chat-GPT在2022年11月30日发布的,在这之后,国内的各类大模型才开始发布并进入市场,而在这之前,尽管阿里、百度、字节等公司已经有多年的技术积累,但是依然没有明确发展的方向,而只是在困顿中求索,说明国内大模型领域还没有形成自主的发展方向,依然还是处在跟随的位置,这是国内公司需要突破的。
其二,上述四个大模型,除了deepseek,其他三个大模型,都是在借用自家已有的技术生态发展。阿里、百度、字节在大模型问世之前,在国内就已经有了巨大的技术体量,通过各种app、各种独立门户构建起了所谓的“阿里系”“字节系”“百度系”应用生态,大模型问世后可以迅速接入生态,进入自家主导的各个领域,迅速抢占市场。但在主导领域之外,各家大模型的竞争力都非常弱,没有足够的竞争力去抢别的大模型的市场,这从各个大模型海外市场开拓缓慢甚至失败也可以看出来。
从上述两点结合来说,笔者认为,国内的公司、下一步的攻关方向,就是要构建自家产品的独特竞争力,虽然现在主要的大模型都有自己擅长的方向,但是并没有对其他大模型形成碾压之势,人家有一你有二,你要抢人家的市场是困难的,如果人家有一你有十,那自然能摧枯拉朽地抢占人家的市场。同时构建独特竞争力,也是在把握生成式大模型第二阶段发展的话语权,目前各家的大模型已经进入瓶颈期,已经被算力和训练数据量所限制,如果国内大模型能够在专业化领域深耕,构建独特竞争力,是能够把握AI发展下一阶段的话语权,由跟随者变为引领者的。
来源:杂事小谈