中国AI大模型2月平台排行榜

360影视 欧美动漫 2025-03-12 14:14 2

摘要:DeepSeek在2月24日至28日密集开源FlashMLA、DeepEP、DeepGEMM等核心模块,覆盖模型训练、推理优化与硬件适配全链条。其开源的Fire-Flyer文件系统(3FS)利用SSD和RDMA网络带宽,为国产芯片生态提供适配思路。华东师范大学

#埃安UT大一圈高级很多#AI大模型2月平台排行榜

作者|参商 西梅汁

国内大模型步入“开源盛世”?

DeepSeek在2月24日至28日密集开源FlashMLA、DeepEP、DeepGEMM等核心模块,覆盖模型训练、推理优化与硬件适配全链条。其开源的Fire-Flyer文件系统(3FS)利用SSD和RDMA网络带宽,为国产芯片生态提供适配思路。华东师范大学王伟教授指出,DeepSeek通过开源吸引全球开发者构建生态,可能颠覆英伟达CUDA垄断地位

再加上阿里近期也开源的QwQ-32B推理模型,其在数学、代码能力上比肩DeepSeek-R1,且支持消费级显卡部署,大幅降低本地化部署门槛910。此外,阿里视觉生成模型万相2.1(Wan)在Hugging Face下载量超百万,成为首个登顶全球榜单的国产视频生成模型910。这些动态也在呈现阿里通过全模态、全尺寸的开源策略,构建了全球最大的开源模型族群

同时百度宣布文心大模型4.5将于3月16日发布,并宣布6月30日开源。该模型具备原生多模态能力,可无缝整合文本、图像、音频与视频处理,例如通过摄像头场景识别提供实时解题指导。李彦宏强调,开源源于技术自信,通过降低企业接入门槛(如千帆平台提供模型定制工具链),加速医疗、金融等垂直领域应用。自2024年起,百度推理成本已降至一年前的1%,为开源策略提供商业支撑。

无论是 DeepSeek 还是百度、阿里,它们的开源动作更像是在竞争中寻找平衡,而不是为了实现“开源盛世”这个终极目标。总的来说,这种开放的趋势是积极的,它为行业的未来发展提供了更多可能性。

Deepseek冲击下,国内六小龙变阵

在DeepSeek的强势冲击下,国内AI“六小龙”(如智谱AI、零一万物、百川智能等)正经历技术路径分化与战略调整,行业格局加速重构。

技术上看,DeepSeek以557.6万美元训练出媲美OpenAI亿元投入的模型,其高性价比开源路线打破了闭源巨头的技术垄断。相较于Meta开源模型效果不足的困境,DeepSeek的R1模型凭借"头部阵列中唯一开源"的定位,形成降维打击效应,迫使百度等传统闭源企业转向混合策略,甚至引发OpenAI创始人反思闭源战略失误。这种技术民主化进程正重构行业创新逻辑,低成本、可定制的开源模型成为新竞争焦点。

市场竞争层面呈现明显分化态势。原"六小龙"阵营中,零一万物拆分、月之暗面仲裁纠纷、MiniMax高管离职等事件频发,暴露出传统独角兽在技术路线震荡期的组织脆弱性。而DeepSeek通过开源生态快速聚拢开发者,单月用户增长破亿,形成"技术开源-应用反哺-生态扩张"的正向循环。这种模式打破了大模型研发的资源依赖路径,使得技术迭代速度从"资本密集型"转向"智力密集型"。

此外,杭州"六小龙"的集体出圈,印证了开源模型在智能制造、消费电子等领域的快速渗透能力。未来,随着DeepSeek等开源势力持续冲击,大模型行业将呈现"开源基座+垂直应用"的哑铃型结构。传统"六小龙"需在开源生态中寻找新定位,通过差异化技术突破或场景深耕保持竞争力。而开源带来的技术普惠,将加速AI从"精英技术"向"基础设施"的转化,最终推动整个产业进入应用爆发期。

人形机器人赛道升温,应用场景加速落地

目前国内人形机器人赛道呈现显著升温态势,大厂动态密集、应用场景加速落地,产业链上下游协同效应增强。从产业进展来看,特斯拉、优必选、宇树科技等企业加速推进量产计划,特斯拉计划在2025年生产1万台Optimus机器人人,并计划通过规模效应将单价降至2万美元以下;优必选Walker S1已在比亚迪、吉利等汽车工厂完成实训,效率提升30%-100%,并计划于第二季度规模化交付;宇树科技推出的G1人形机器人以9.9万元低价开启预售,首批订单迅速售罄,显示消费级市场潜力初现。

此外,AI模型通过整合语音、图像等多种信息处理能力,让人形机器人能更灵活地适应复杂环境,比如在工厂中完成零件装配或质量检测。针对特定场景(如情感交互)的优化模型,也让机器人逐渐具备更人性化的服务能力。另一方面,AI工具的普及降低了技术门槛,推动企业加快研发进度。例如,宇树科技等公司通过技术迭代,已将机器人应用于汽车制造、电力巡检等高危或重复性工作场景。

同时,政策支持进一步加速了这一进程,多地通过搭建模型服务平台,促进机器人在工业、医疗等领域的规模化应用。不过,硬件层面的运动控制精度、续航能力等问题仍需突破,未来需在技术优化与成本控制之间找到平衡点,才能推动家庭服务等民生场景的普及。

国内主要大模型最新进展

腾讯近期在AI领域频频发力。

2月中旬,腾讯宣布微信内测接入 DeepSeek-R1 大模型,随后在元宝APP内接入,并在几天后推出自研深度思考模型“混元T1” ,能理解问题的多重维度和潜在逻辑关系,适合完成复杂任务。

元宝APP内也集成混元T1+DeepSeek两大模型,并上线多模态理解能力,通过跨模态协同的架构设计,实现深度思考模型对图片的理解与推理。

在产品技术侧,腾讯月底又实现两项重磅更新:发布新一代快思考模型Turbo S、元宝上线PC端。

第三方数据平台AppGrowing平台公布,从2月13日到2月27日,腾讯元宝在27天里投放共花了2.81亿元。这一数字已经超过了去年整个AI行业的月投放量,近期,腾讯元宝APP在中国区苹果应用商店免费App下载排行榜上升至第一,超越DeepSeek。

本月,腾讯为了适应大模型产品技术的“狂飙”节奏,内部组织结构也进行调整。将QQ浏览器、搜狗输入法、ima等产品和应用从PCG(平台与内容事业群)调整至CSIG。这是继1月份腾讯元宝从TEG(技术工程事业群)转入CSIG(腾讯云与产业事业群)之后之后的又一次调整。

DeepSeek近期在技术研发与市场策略上动作频频,展现出快速迭代和行业影响力。

3月1日,DeepSeek通过知乎官方账号首次公开《DeepSeek-V3/R1推理系统概览》技术文章,详细披露模型推理系统的优化细节,并罕见公布其理论成本利润率高达545%,引发行业关注。

此前一周内,该公司已多次成为焦点:2月26日宣布每日凌晨00:30至08:30大幅下调API调用价格,其中R1和V3模型价格分别降低75%和50%,这一价格策略直接冲击国内外AI服务市场,业内人士分析其意图通过错峰降价抢占开发者生态。

2月28日,DeepSeek连续五天每天开源一项核心技术,覆盖AI模型训练、文件系统优化等多个领域,包括FlashMLA,专为英伟达Hopper GPU优化的高效MLA解码内核;DeepEP首个用于 MoE(混合专家模型)训练和推理的开源EP通信库;DeepGEMM矩阵乘法加速库,为V3/R1的训练和推理提供支持;开源优化并行策略DualPipe和EPLB;开源了面向全数据访问的推进器3FS。

2月25日,据市场消息透露,原计划于5月发布的R2人工智能模型正被全力推进以提前面世,该模型不仅将显著提升代码生成质量,还将突破单一语言限制,支持英语之外的多语言推理能力。针对这一传闻,DeepSeek母公司幻方量化表示“以官方发布信息为准”,既未否认也未确认,但透露出技术升级的潜在可能。

值得注意的是,这家成立于2023年7月的年轻公司,在不足两年时间内已密集推出覆盖编程、数学逻辑、大语言模型、多模态交互及智能对话等多元场景的系列AI产品。从R1到R2的快速演进,既是其“每季度重大更新”技术节奏的延续,也凸显了通过高频创新重塑行业竞争格局的野心——通过降低开发门槛、拓展多语言应用边界,DeepSeek正试图打破AI工具的地域与场景壁垒,推动技术普惠化进程。

据最新消息披露,DeepSeek-R2或将于3月17日发布。

近日,字节跳动在AI领域动作频繁,推出了多个产品和功能更新。

其中,重磅发布AI编程工具Trae国内版,配置了Doubao-1.5-pro,并支持切换至DeepSeek R1、V3模型。Trae定位为“智能协作AI IDE”,具备代码补全、理解、Bug修复及基于自然语言生成代码等功能。此外,Trae国内版引入了Builder模式,允许开发者通过自然语言描述来生成应用。该版本还针对中国开发场景进行了优化,未来将支持模型自定义。

与此同时,字节跳动的AI视频生成产品即梦任命了新的移动端负责人曹大鹏,旨在增强与剪映的协同整合。即梦计划接入DeepSeek的大模型技术,以提升视频生成质量和效率,加速多模态创作及商业化场景的发展。此前,飞书已使用DeepSeek技术。

另外,字节旗下的AI智能体开发平台扣子(Coze)与抖音打通,抖音创作者可以创建AI分身并发布,甚至可以在直播中与用户互动。目前,这一功能正处于定向内测阶段。

2月13日,在字节跳动的新一期全员会上,CEO梁汝波强调了2025年的重点目标,包括追求“智能”上限、探索新的交互方式以及加强规模效应。为此,公司进行了组织调整,将负责AI的Flow部门提升到了与抖音、飞书等同的重要业务部门级别,并集中了原先分散于各业务中的高管资源。

2月7日,即梦AI发布了新功能预告片,展示了OmniHuman多模态视频生成模型,用户只需提供一张图片和一段音频即可生成AI视频,显著提高短片制作效率。虽然该模型为字节跳动自研闭源,不会对外公开下载,但相关功能将在即梦平台上逐步开放测试,且输出的视频会标注水印以作提醒。

2月25日,阿里开源QwQ-Max-Preview深度思考模型,支持联网搜索和思维链可视化,计划以Apache 2.0协议完全开源。同时,阿里云还宣布开源通义万相2.1视频生成模型,提供1.3B和14B两种参数版本,采用Apache2.0协议开放全部推理代码与权重。该模型在VBench评测中以86.22%的性能领先,支持文本生成高清视频,被视为对闭源模型(如Sora)的重要挑战。此外,开源1.3B和14B两种参数版本,直接降低企业与开发者使用门槛,加速视频生成技术在影视、营销等场景的落地。

2月24日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年的总和。这也创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。阿里这笔投入发生在两个重要时点之后。一是国内AI产业爆发;二是民营企业座谈会召开。吴泳铭表示:“AI爆发远超预期,国内科技产业方兴未艾,潜力巨大。阿里巴巴将不遗余力加速云和AI硬件基础设施建设,助推全行业生态发展。”

2月19日,阿里AI To C业务近期开启大规模人员招聘,开放招聘岗位达到数百个,其中AI技术、产品研发岗位占比达到90%,所招聘人员将重点投入到文本、多模态大模型、AI Agent等前沿技术与应用的相关工作中。

据了解,阿里AI To C是该公司围绕面向消费者的人工智能业务所构建的一个业务体系,涵盖多个产品和团队,包括代表性应用夸克、从阿里云分拆而来的通义,以及天猫精灵团队。此次阿里进一步扩大AI人员招聘,或将加速推动人工智能行业的人才流动与技术创新。

2月6日,全球顶尖人工智能科学家许主洪(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案

百度

百度近期在人工智能领域动作频频,展现出从技术研发到应用落地的全面布局

2月28日,百度宣布文心大模型4.5将于3月16日正式上线,这一版本不仅强化了深度思考能力,还能原生处理文本、图像、视频、音频等多模态数据,实现跨格式内容生成与转换。该模型计划于6月30日开源,标志着百度从技术封闭走向开放生态的重要转折。此前,百度在2月27日透露下一代AI模型Ernie 4.5将于3月中旬推出,进一步升级推理能力,并支持更复杂的多模态任务,未来还将逐步向开发者开放。

2月24日,百度APP整合文心大模型与DeepSeek技术,推出“AI搜索”“全网信息提炼”“捏一下AI总结”等新功能,用户可通过自然语言提问直接获取精准答案,还能一键生成个性化内容总结。仅4天后,百度搜索全量上线DeepSeek满血版,用户点击搜索框下方入口即可体验联网增强版AI搜索,结合检索增强技术(RAG)大幅降低信息错误率。这一系列升级让搜索从“找信息”转向“解问题”,甚至能通过数字人智能体实现交互式服务。

这次升级的完成,意味着用户在百度使用AI搜索会更加容易,接入大模型更加简捷清晰。由此也导致用户的搜索行为快速发生了变化。这之后最显著的变化,是主观陪伴类的搜索需求开始大幅提升。

2月20日,百度搜索目前已全量上线DeepSeek满血版并提供联网服务,其中PC端开放仅1小时就有超千万人使用。对比其它接入DeepSeek的产品,百度搜索在首页搜索框下方点击“AI搜索DeepSeek满血版”即可体验

值得注意的是,百度搜索此次接入的是DeepSeek满血版,并融合了百度联网搜索功能,具备检索增强RAG等技术能力,便于用户获取更新、更低幻觉的信息。

2月7日,百度点亮了国内首个自研昆仑芯三代万卡集群,不仅解决了大模型训练的算力瓶颈,还为未来模型开源和成本降低奠定基础。与此同时,百度还在13日宣布文心一言自4月1日起全面免费,并向开发者开放深度搜索功能调用权限,进一步推动AI技术普惠化。从模型开源到算力突破,再到搜索场景的深度改造,百度正通过技术、产品、生态的三重发力,加速中国AI从“追赶”向“引领”跨越。

科大讯飞

3月3日,科大讯飞宣布完成星火深度推理大模型X1的全面升级,并基于星火X1首发星火医疗大模型X1。据悉,星火X1在完全采用国产算力训练的前提下,以70B参数量,实现了在数学能力上全面对标DeepSeek R1(参数量671B)和OpenAI o1,中文数学任务全面领先的效果。

2月10日,讯飞开放平台宣布DeepSeek-V3、DeepSeek-R1模型均已上线,支持公有云 API 调用、一键部署专属模型。同时还首发 DeepSeek 大模型精调服务,让开发者根据业务场景数据,深度定制“更聪明、更匹配”的专属DeepSeek 大模型。

官方表示,DeepSeek R1 蒸馏模型精调服务实现首发,基于优质开源小模型蒸馏优化,实现推理速度提升 3 倍以上,部署成本直降 80%,在保持强逻辑推理能力的同时,模型体积更加轻量化

3月4日,据报道,大模型独角兽智谱发布2025开源年的第一个模型:首个支持生成汉字的开源文生图模型“CogView4”。据悉,该模型在 DPG-Bench基准测试中的综合评分排名第一,在开源文生图模型中达到 SOTA(最先进的)。该模型也是首个遵循 Apache 2.0协议的图像生成模型。

3月3日,国产AI大模型“六小虎”之一的智谱,近期完成一笔金额超10亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等。据悉,本轮融资旨在推动智谱国产基座GLM大模型的技术创新和生态发展。

2月11日,智谱和三星基于Agentic GLM展开合作,将Agent体验带到三星最新手机Galaxy S25系列上。智谱押注下一个技术爆发点Agent,并率先提出了Phone Use概念,推出了能模拟用户进行计算机、手机等跨应用自主操作的AutoGLM和GLM-PC,并基于Agentic GLM与三星手机展开合作,将 Agent 体验带到三星最新手机上,支持基于 AI 的实时语音和视频通话,以及实现视觉理解和系统功能调用、AI 搜索、文案写作等功能。

2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1 及配套算法SkyReels-A1

前者支持影视级人物微表情与400+种自然动作组合生成,后者作为国内首个SOTA级别表情动作可控算法,可精准控制视频中人物表演细节,对标国际头部工具如Runway的Act-One。此次开源填补了中国在AI短剧生成领域的技术空白,通过开放模型能力吸引开发者生态,加速AIGC在短视频、影视创作等场景的落地。

2月14日,昆仑万维正式推出 Matrix-Zero世界模型,该模型包含两款子模型:昆仑万维自研3D场景生成大模型,和昆仑万维自研可交互视频生成大模型。其中昆仑万维Matrix-Zero的3D场景生成功能,支持将用户输入的图片转化为可自由探索的真实合理的3D场景,具备全局一致性、可自由探索、支持不同风格图片输入、支持风格迁移、支持动态场景生成。昆仑万维可交互视频大模型建立在生成式视频模型之上,结合自主研发的用户交互模块,最终实现以用户输入为核心驱动的空间智能视频生成方案。

2月8日,昆仑万维集团官方微信公众号发布消息,昆仑万维旗下“天工AI”正式推出PC版更新,上线“DeepSeek R1+联网搜索”功能。在「天工AI」PC端,用户只需在界面上勾选“深度思考 R1”按钮即可,输出的答案均为联网搜索后的答案。此次升级解决了此前用户反馈的DeepSeek模型联网功能不稳定问题,通过整合深度求索(DeepSeek)的R1模型能力,用户可在PC端实现联网搜索与实时信息获取,显著提升AI生成内容的时效性与准确性。

2月21日,今日举办的阶跃星辰生态开放日上,阶跃星辰创始人、CEO姜大昕表示,随着大模型技术的飞速进步,今天越来越多的人开始相信AGI在未来几年就会成为现实。据姜大昕透露,过去一年,阶跃星辰累计发布了11个模型,覆盖多个技术节点,预计今年3月,阶跃星辰还将开源公司自研的图生视频模型。

2月25日,据接近阶跃星辰的人士透露,近日该公司开源的 30B 超大参数视频生成模型 Step-Video-T2V,上线一周即引发海量生成作品,海内外创作者生成超 13.6 万次。此外,包括在全球拥有超 2000 万 创作者的头部 AI 内容创作平台 LiblibAI,也已接入了 Step-Video-T2V。

2月27日,快手公布的数据显示,快手可灵AI全球月访问用户总数环比增长113%。作为国产多模态模型的代表,可灵AI在性能与性价比等关键维度均成功赶超海外模型,一直备受市场关注。

据行业观察机构瑞银分析,在线娱乐与教育是当前AI技术落地应用的核心场景。在这一背景下,快手凭借其自研的可灵AI,成功在应用层树立了标杆。可灵AI以其卓越的视频生成能力,在全球视频生成模型领域占据了领先地位。

2月19日,快手旗下视频剪辑工具快影宣布接入DeepSeek-R1满血版大模型,成为行业首批深度集成该AI能力的剪辑平台。此次合作将DeepSeek-R1的智能推理与快影“可灵AI视频生成”技术结合,上线“文案成片”“小说漫”“AI故事短片”等八大AI功能,支持从文字生成视频到智能剪辑的全链路创作。

快影同步宣布,80%的AI功能向用户免费开放,包括一键生成高清视频、智能字幕剪辑等,大幅降低创作门槛。通过AI辅助批量生产与质量优化,普通用户可快速产出接近专业级的内容,并借助智能变现工具提升商业化效率,推动短视频行业进入“零门槛智能创作”时代。

3月3日,MiniMax旗下产品海螺视频上线了「镜头控制」系列模型图生视频模型I2V-01-Director。与此前「镜头控制」的文生图视频T2V-01-Director共同组成01-Director系列。这也是整个Video-01系列的收官之作。

目前该模型已在全球上线,标志着MiniMax在AI视频生成领域从技术探索转向规模化应用,通过海螺视频App的低门槛工具链,或将加速AI生成内容(AIGC)在短视频、影视创作等场景的商业化落地。

2月20日,MiniMax(稀宇科技)合伙人兼副总裁魏伟近期离职,其曾主导公司B端业务并曾任腾讯云副总裁。MiniMax官方回应称国内B端业务进入“新发展阶段”,将由其他负责人接棒。此次人事变动发生在大模型行业高管频繁流动的背景下,如去年MiniMax产品负责人张前川转任顾问、百川智能商业化高管离职等,折射出AI大模型企业在商业化落地与市场竞争压力下的战略调整。魏伟的离职或与个人职业规划及公司业务重心变化相关,但其负责的B端业务能否延续增长仍需观察新团队的整合成效。

2月18日,有消息称,在DeepSeek影响下,月之暗面Kimi决定暂缓“烧钱”投放。对此,钛媒体AGI从知情人士从了解到,该动作核心原因在于DeepSeek热潮,带动近期 Kimi 智能助手“自然新增用户量猛涨”。这意味着,月之暗面对推广动作进行了相应调整。需要注意的是,月之暗面Kimi近期并没有新品,不投放广告属于正常现象。

2月18日,月之暗面宣布推出一款新模型Kimi Latest,它将对标Kimi智能助手当前使用的模型,随智能助手产品更新而同步升级(模型名称不变)。据介绍,Kimi Latest总是使用Kimi智能助手产品使用最新的Kimi大模型,可能包含尚未稳定的特性;上下文长度为128k,会自动根据上下文长度选择8k/32k/128k模型作为计费模型;支持自动上下文缓存。目前Kimi Latest仅支持调用Kimi普通版模型,Kimi k1.5长思考模型暂不支持API调用。

2月15日,月之暗面内部已将“持续拿到SOTA结果”确定为最重要的工作目标。2025年,他们计划在模型能力方向上加强多模态和长文本推理能力

来源:一梦栖

相关推荐