压不住了!中国AI的底层算法席卷全球,美国说我们逼出了最强对手

360影视 日韩动漫 2025-03-10 20:27 2

摘要:2025年2月,全球生成式AI应用排行榜中,DeepSeek排名第2,仅次于ChatGPT,这家中国企业从默默无闻到一鸣惊人仅用了不到2个月的时间。国内其他大模型纷纷展露头角,排名如下:豆包排名第10、月之暗面排名11、海螺视频排名12、快手可灵排名20,均超

2025年2月,全球生成式AI应用排行榜中,DeepSeek排名第2,仅次于ChatGPT,这家中国企业从默默无闻到一鸣惊人仅用了不到2个月的时间。国内其他大模型纷纷展露头角,排名如下:豆包排名第10、月之暗面排名11、海螺视频排名12、快手可灵排名20,均超过了Sora、Midjourney等产品。

仅仅一个月后,全球最大的AI开源社区Hugging Face又更新了大模型榜单,因为中国另外一家生成式AI模型异军突起,阿里的通义千问推理模型QwQ-32B展现出强劲实力,成功登顶,将DeepSeek和ChatGPT一众AI模型斩落马下。

经过测试和跑分,通义千问QwQ-32B除了卓越的性能,在数学、代码及通用能力上展现出质的飞跃,最具杀伤力的一点是突破性地通过压缩参数量和存储资源、分区域调用算力的模式,让高性能推理模型在消费级显卡上就实现了本地部署,大幅降低了模型应用成本,再一次证明算力与芯片性能之间无绝对直接关联,画上了不等号。

通义千问的突然出世,不仅成为DeepSeek的主要竞争者,也让ChatGPT的母公司OpenAI如临大敌,辛辛苦苦花费数亿美金,用真金白银搭建起来的算力“马奇诺防线”居然被对手轻易绕开,从身后打穿,毫无用武之地。

更炸裂的是,在美国AI公司忙着继续使用砸钱的方式,堆垛GPU的时候,中国又推出一款名为Manus的AI 产品在科技圈迅速蹿红,引发大量关注。因为Manus模型不是复制或仿制任何一款AI模型,而是又走出了一条全新的AI之路,它是全球首款通用Agent(自主智能体)产品,标志着中国在AI自主智能领域再次取得重要突破。

Manus的AI 产品技术架构的创新性体现在以下三个方面:

云端异步处理:任务可在虚拟环境中持续运行,用户无需保持在线。现在的AI模型进行大任务处理时,用户不得不保持在线“傻等”模式;

深度记忆功能:通过痕迹管理,对用户习惯进行留存,这种方式不会挤压存储,又能对同一个用户做到客户定制,优化后续执行路径和任务执行;

工具链集成:现在使用DeepSeek生成PPT,需要用户下载两个App并进行关联,Manus做到了内置浏览器、代码编辑器等工具,支持跨平台操作,对用户提供“一键式的傻瓜操作”;

第三条是Manus的杀手锏,让它成为第一款能够解决各类复杂多变任务的自主智能体。Manus在GAIA 基准测试中取得了SOTA (State-of-the-Art) 的成绩,这个英文词语的意思是最先进,意味着其性能超越了OpenAI的同层次大模型。

所以Manus的出世引发了轰动效应,用户蜂拥而至差点挤爆服务器,逼得Manus赶紧限流,在短暂公开上线后,又立刻下线,要求只能通过邀请码使用,目前一码难求,邀请码被炒至上万元人民币,气得没法尝鲜的用户指责Manus的邀请码机制是“饥饿营销”。

中国的AI模型DeepSeek、通义千问QwQ-32B和Manus一波接一波的推出,让美国科技巨头开始“怀疑起了人生”,他们最担心的不是中国AI模型的持续升级,而是中国展现出来的这种在算力突围上的颠覆性创新,且是不断的自己颠覆自己,而这种是最难追赶的。

在DeepSeek出现后,美国高科技AI公司通过持续跟进研究和破解,发现DeepSeek用普通AI芯片跑出相当于英伟达最新芯片算力的底层逻辑是中文;而QwQ-32B和Manus出现后,这些外国公司经过研究后,再次目瞪口呆,发现这两个模型的底层逻辑居然是中国的文言文。

这是怎么回事?

要讲清楚这个问题,需要先从算力讲起,AI算力是指执行人工智能算法所需的计算资源和处理能力,硬件方面涉及CPU、GPU等处理器的运算速度、内存容量等,软件方面涉及软件框架、算法优化等。

但无论哪一种AI模型,人机互动的工具都是语言,存储的信息展现出来也是语言。一直以来,全球AI模型默认使用的语言是英文,没有人想过变通语言,因为都习惯了,所谓的汉化也只是表面。比如Windows的汉化版,底层逻辑还是英文,只是显示时才转换成中文罢了。

中国高科技公司受到美国制裁后,无法获得高端芯片,只能在现有芯片上挖掘潜力,方法只有一个,执行同样的任务时用最小的存储量和运算力。就这样,在现实所迫的情况下,中国AI公司被逼出一身才华,在算法上找到了属于中国AI模型的“黄金代码”——中文算法。

中国AI公司在研究中,首先发现模型的存储芯片上占用空间最大的是信息存储,也就是英文单词,因为英文的单词量太大了,常用词汇量就突破了20万,加上专业英文,词汇量达到100万以上,不仅内存占用多,而且也非常耗费算力。

中国生成式AI团队立刻着手开始研究语言对AI模型算力的影响,发现拉丁语简直就是AI模型的噩梦,英文相比而言都算好的了,法语的动词变位多达50种形式,还有名词阴阳性要求,德语的四格变化比英语麻烦多了,为此还专门开设成德语的必修课。

唯有汉语常用字不过3500个,掌握这些基本文字后就能拼装出复杂概念。这里说个冷知识:国际通信卫星组织认证,汉语是世界上最符合逻辑的人造语言方案。现状是这套从甲骨文进化而来的符号系统,正以独有的智慧应对信息爆炸时代,影响世界。

欧洲的字母语言,最大的弊端是太独立。民间百姓在长期使用的过程中其实形成过简单且有一定关联性的俚语,但没有被保存下来,原因是欧洲就那么大,诸侯并立,每个国家都有自己的语言,但人口和区域让这些语言犹如中国各地的方言,彼此都看不上对方的方言,觉得那是土话,造成古代整个欧洲贵族都推崇拉丁语,很多专有名词来自拉丁语,俚语反而出现断层,于是有了今天英语单词各不相干的情况。

比如英语单词中的周一到周日,Monday、Tuesday、Wednesday、Thursday、Friday、Saturday、Sunday,完完全全各不相干,单词之间没有关联,和数字也没有发生关联,还有月份也是一样的情况。AI模型对这些词语存储时只能一个词语占用一个内存格子,没法简化,而用中文表示就非常简单和有逻辑性,用“星期+数字”,方便记忆还能共用“星期”二字,同样的信息占用的存储量却非常小。

更要命的一点,这是一个信息爆炸的时代,新的名词和词语不断出现,各种新材料、新物质、新的医学名词、疾病名词、网络用语层出不穷,英语记录的方式就是新造一个词语,例如尘肺病,英文名为Pneumonoultramicroscopicsilicovolcanoconiosis,表示长期过量吸入含结晶型游离二氧化硅的岩尘所引起的病,医学生光是记下这个单词简直就是要人命啊,用中文仅三个字尘肺病,不用新造任何一个字,而且意思一目了然,言简意赅。

对现代科技词汇的翻译,中文的“键盘”、“激光”、“互联网”都是直击本质,形神兼备,即便是偷师中文的日文在这方面也不行,日语中键盘叫“キーボード”,对于新概念永远需要借词,做不到组合。

又比如躺平,高富帅,矮穷挫,狗带,凡尔赛等新网络词汇,每一个都为英文字典提供了新的单词,但对中文而言没有新创造一个字,只是进行了新的组合。结果是英文AI每个月都要补充大量新的词汇和意思备注,中文不需要做这些,拆解重组现有字库即可,像乐高积木一样组合就好了,万变不离其宗,具备生生不息的造词能力。

随着文化的交流越来越频繁,外国人也看出中文组合的方便,对自己的语言忍无可忍,主动开启了英文的汉化。以前最常见的是long time no see you,如今他们把周一到周日改为Week1、Week2、Week3、Week4……月份也是如此Month1、Month2、Month3……

接着是对各种食物下手,牛肉原本是beef,现在的表示方式是Cowmeat(Cow是牛,meat肉),猪肉是pigmeat,羊肉是sheepmeat,木耳是Woodear……结果效果奇好,无论华人还是老外都瞬间秒懂。

这种汉化还渗透到了文学领域,比如《辟邪简谱》如今的英文翻译是“No JJ Book”,《葵花宝典》叫“No JJ Book Plus”,甚至车祸的汉化英语都飘洋过海了,“one car come,one car go,two car pengpeng,two car die”。

回过头讲AI模型,DeepSeek之所以异军突起,靠的是中文的AI模式,背后藏着的是汉字系统的核心优势——模块化组合,以及汉字二维结构更贴合神经网络识别模式,让AI模型的存储和算力做到了简化的极致。

联合国文件里面中文版永远是最薄的,这不是偶然。汉字信息密度冠绝全球,麻省理工研究显示汉语信息传输速率比英语快15%。中文电报只需用四个数字代表一个汉字,现在二维码技术最先在中国普及,都得益于这套高效符号系统。

DeepSeek在这方面尝到甜头后,如今中国AI模型,包括但不限于通义千问QwQ-32B和Manus等都在研究文言文,因为中文是最简单的文法,而文言文是最简洁的表述。比如房子着火了,白话文是大家争相逃命,赶紧往外跑,而文言文只需四个字“夺门而出”,又如问题迎刃而解,如果用英文表示这个意思,需要多少个单词,大家可以自己试着翻译。

中国的AI模型通过中文底层逻辑构造,获得对英文AI模型运算的降维打击,这是先天优势,能利用最小的存储空间,最小的逻辑调用,最省的运算模式完成模型演算。这个发现让中国科技圈兴奋不已,因为这是可能直接掀桌子重写游戏规则的发现。

西方AI目前没办法抵御中文AI的进攻,利用中文构建底层逻辑的DeepSeek能用成本仅1/10的算法碾压OpenAI的技术指标。这种情况下,即便我们的AI芯片因美国制裁受限,华为最新推出的昇腾910C AI芯片性能为英伟达H100的60%,但通过成本优势与算法优化后,反而是中国AI模型形成不对等优势。如同当年的朝鲜战争,我们的空军和海军不行,那就陆战为王,照样打得美军不得不在板门店签下停火协议。

中国芯片产业如今是越打越提速,越打越醒,在外部压力下,实力不详,遇强则强,国产的各项短板都在不断地完善中。美国如今是骑虎难下,美方不得不承认,本来美国想把中国芯片产业“赶尽杀绝”却不料给自己制造了最大的对手。

来源:干史人聃者徐也

相关推荐