中国AI大模型2月平台排行榜

摘要：DeepSeek在2月24日至28日密集开源FlashMLA、DeepEP、DeepGEMM等核心模块，覆盖模型训练、推理优化与硬件适配全链条。其开源的Fire-Flyer文件系统（3FS）利用SSD和RDMA网络带宽，为国产芯片生态提供适配思路。华东师范大学

#埃安UT大一圈高级很多#AI大模型2月平台排行榜

作者｜参商西梅汁

国内大模型步入“开源盛世”？

DeepSeek在2月24日至28日密集开源FlashMLA、DeepEP、DeepGEMM等核心模块，覆盖模型训练、推理优化与硬件适配全链条。其开源的Fire-Flyer文件系统（3FS）利用SSD和RDMA网络带宽，为国产芯片生态提供适配思路。华东师范大学王伟教授指出，DeepSeek通过开源吸引全球开发者构建生态，可能颠覆英伟达CUDA垄断地位

再加上阿里近期也开源的QwQ-32B推理模型，其在数学、代码能力上比肩DeepSeek-R1，且支持消费级显卡部署，大幅降低本地化部署门槛910。此外，阿里视觉生成模型万相2.1（Wan）在Hugging Face下载量超百万，成为首个登顶全球榜单的国产视频生成模型910。这些动态也在呈现阿里通过全模态、全尺寸的开源策略，构建了全球最大的开源模型族群

同时百度宣布文心大模型4.5将于3月16日发布，并宣布6月30日开源。该模型具备原生多模态能力，可无缝整合文本、图像、音频与视频处理，例如通过摄像头场景识别提供实时解题指导。李彦宏强调，开源源于技术自信，通过降低企业接入门槛（如千帆平台提供模型定制工具链），加速医疗、金融等垂直领域应用。自2024年起，百度推理成本已降至一年前的1%，为开源策略提供商业支撑。

无论是 DeepSeek 还是百度、阿里，它们的开源动作更像是在竞争中寻找平衡，而不是为了实现“开源盛世”这个终极目标。总的来说，这种开放的趋势是积极的，它为行业的未来发展提供了更多可能性。

Deepseek冲击下，国内六小龙变阵

在DeepSeek的强势冲击下，国内AI“六小龙”（如智谱AI、零一万物、百川智能等）正经历技术路径分化与战略调整，行业格局加速重构。

技术上看，DeepSeek以557.6万美元训练出媲美OpenAI亿元投入的模型，其高性价比开源路线打破了闭源巨头的技术垄断。相较于Meta开源模型效果不足的困境，DeepSeek的R1模型凭借"头部阵列中唯一开源"的定位，形成降维打击效应，迫使百度等传统闭源企业转向混合策略，甚至引发OpenAI创始人反思闭源战略失误。这种技术民主化进程正重构行业创新逻辑，低成本、可定制的开源模型成为新竞争焦点。

市场竞争层面呈现明显分化态势。原"六小龙"阵营中，零一万物拆分、月之暗面仲裁纠纷、MiniMax高管离职等事件频发，暴露出传统独角兽在技术路线震荡期的组织脆弱性。而DeepSeek通过开源生态快速聚拢开发者，单月用户增长破亿，形成"技术开源-应用反哺-生态扩张"的正向循环。这种模式打破了大模型研发的资源依赖路径，使得技术迭代速度从"资本密集型"转向"智力密集型"。

此外，杭州"六小龙"的集体出圈，印证了开源模型在智能制造、消费电子等领域的快速渗透能力。未来，随着DeepSeek等开源势力持续冲击，大模型行业将呈现"开源基座+垂直应用"的哑铃型结构。传统"六小龙"需在开源生态中寻找新定位，通过差异化技术突破或场景深耕保持竞争力。而开源带来的技术普惠，将加速AI从"精英技术"向"基础设施"的转化，最终推动整个产业进入应用爆发期。

人形机器人赛道升温，应用场景加速落地

目前国内人形机器人赛道呈现显著升温态势，大厂动态密集、应用场景加速落地，产业链上下游协同效应增强。从产业进展来看，特斯拉、优必选、宇树科技等企业加速推进量产计划，特斯拉计划在2025年生产1万台Optimus机器人人，并计划通过规模效应将单价降至2万美元以下；优必选Walker S1已在比亚迪、吉利等汽车工厂完成实训，效率提升30%-100%，并计划于第二季度规模化交付；宇树科技推出的G1人形机器人以9.9万元低价开启预售，首批订单迅速售罄，显示消费级市场潜力初现。

此外，AI模型通过整合语音、图像等多种信息处理能力，让人形机器人能更灵活地适应复杂环境，比如在工厂中完成零件装配或质量检测。针对特定场景（如情感交互）的优化模型，也让机器人逐渐具备更人性化的服务能力。另一方面，AI工具的普及降低了技术门槛，推动企业加快研发进度。例如，宇树科技等公司通过技术迭代，已将机器人应用于汽车制造、电力巡检等高危或重复性工作场景。

同时，政策支持进一步加速了这一进程，多地通过搭建模型服务平台，促进机器人在工业、医疗等领域的规模化应用。不过，硬件层面的运动控制精度、续航能力等问题仍需突破，未来需在技术优化与成本控制之间找到平衡点，才能推动家庭服务等民生场景的普及。

国内主要大模型最新进展

腾讯近期在AI领域频频发力。

2月中旬，腾讯宣布微信内测接入 DeepSeek-R1 大模型，随后在元宝APP内接入，并在几天后推出自研深度思考模型“混元T1” ，能理解问题的多重维度和潜在逻辑关系，适合完成复杂任务。

元宝APP内也集成混元T1+DeepSeek两大模型，并上线多模态理解能力，通过跨模态协同的架构设计，实现深度思考模型对图片的理解与推理。

在产品技术侧，腾讯月底又实现两项重磅更新：发布新一代快思考模型Turbo S、元宝上线PC端。

第三方数据平台AppGrowing平台公布，从2月13日到2月27日，腾讯元宝在27天里投放共花了2.81亿元。这一数字已经超过了去年整个AI行业的月投放量，近期，腾讯元宝APP在中国区苹果应用商店免费App下载排行榜上升至第一，超越DeepSeek。

本月，腾讯为了适应大模型产品技术的“狂飙”节奏，内部组织结构也进行调整。将QQ浏览器、搜狗输入法、ima等产品和应用从PCG（平台与内容事业群）调整至CSIG。这是继1月份腾讯元宝从TEG（技术工程事业群）转入CSIG（腾讯云与产业事业群）之后之后的又一次调整。

DeepSeek近期在技术研发与市场策略上动作频频，展现出快速迭代和行业影响力。

3月1日，DeepSeek通过知乎官方账号首次公开《DeepSeek-V3/R1推理系统概览》技术文章，详细披露模型推理系统的优化细节，并罕见公布其理论成本利润率高达545%，引发行业关注。

此前一周内，该公司已多次成为焦点：2月26日宣布每日凌晨00:30至08:30大幅下调API调用价格，其中R1和V3模型价格分别降低75%和50%，这一价格策略直接冲击国内外AI服务市场，业内人士分析其意图通过错峰降价抢占开发者生态。

2月28日，DeepSeek连续五天每天开源一项核心技术，覆盖AI模型训练、文件系统优化等多个领域，包括FlashMLA，专为英伟达Hopper GPU优化的高效MLA解码内核；DeepEP首个用于 MoE（混合专家模型）训练和推理的开源EP通信库；DeepGEMM矩阵乘法加速库，为V3/R1的训练和推理提供支持；开源优化并行策略DualPipe和EPLB；开源了面向全数据访问的推进器3FS。

2月25日，据市场消息透露，原计划于5月发布的R2人工智能模型正被全力推进以提前面世，该模型不仅将显著提升代码生成质量，还将突破单一语言限制，支持英语之外的多语言推理能力。针对这一传闻，DeepSeek母公司幻方量化表示“以官方发布信息为准”，既未否认也未确认，但透露出技术升级的潜在可能。

值得注意的是，这家成立于2023年7月的年轻公司，在不足两年时间内已密集推出覆盖编程、数学逻辑、大语言模型、多模态交互及智能对话等多元场景的系列AI产品。从R1到R2的快速演进，既是其“每季度重大更新”技术节奏的延续，也凸显了通过高频创新重塑行业竞争格局的野心——通过降低开发门槛、拓展多语言应用边界，DeepSeek正试图打破AI工具的地域与场景壁垒，推动技术普惠化进程。

据最新消息披露，DeepSeek-R2或将于3月17日发布。

近日，字节跳动在AI领域动作频繁，推出了多个产品和功能更新。

其中，重磅发布AI编程工具Trae国内版，配置了Doubao-1.5-pro，并支持切换至DeepSeek R1、V3模型。Trae定位为“智能协作AI IDE”，具备代码补全、理解、Bug修复及基于自然语言生成代码等功能。此外，Trae国内版引入了Builder模式，允许开发者通过自然语言描述来生成应用。该版本还针对中国开发场景进行了优化，未来将支持模型自定义。

与此同时，字节跳动的AI视频生成产品即梦任命了新的移动端负责人曹大鹏，旨在增强与剪映的协同整合。即梦计划接入DeepSeek的大模型技术，以提升视频生成质量和效率，加速多模态创作及商业化场景的发展。此前，飞书已使用DeepSeek技术。

另外，字节旗下的AI智能体开发平台扣子（Coze）与抖音打通，抖音创作者可以创建AI分身并发布，甚至可以在直播中与用户互动。目前，这一功能正处于定向内测阶段。

2月13日，在字节跳动的新一期全员会上，CEO梁汝波强调了2025年的重点目标，包括追求“智能”上限、探索新的交互方式以及加强规模效应。为此，公司进行了组织调整，将负责AI的Flow部门提升到了与抖音、飞书等同的重要业务部门级别，并集中了原先分散于各业务中的高管资源。

2月7日，即梦AI发布了新功能预告片，展示了OmniHuman多模态视频生成模型，用户只需提供一张图片和一段音频即可生成AI视频，显著提高短片制作效率。虽然该模型为字节跳动自研闭源，不会对外公开下载，但相关功能将在即梦平台上逐步开放测试，且输出的视频会标注水印以作提醒。

2月25日，阿里开源QwQ-Max-Preview深度思考模型，支持联网搜索和思维链可视化，计划以Apache 2.0协议完全开源。同时，阿里云还宣布开源通义万相2.1视频生成模型，提供1.3B和14B两种参数版本，采用Apache2.0协议开放全部推理代码与权重。该模型在VBench评测中以86.22%的性能领先，支持文本生成高清视频，被视为对闭源模型（如Sora）的重要挑战。此外，开源1.3B和14B两种参数版本，直接降低企业与开发者使用门槛，加速视频生成技术在影视、营销等场景的落地。

2月24日，阿里巴巴集团CEO吴泳铭宣布，未来三年，阿里将投入超过3800亿元，用于建设云和AI硬件基础设施，总额超过去十年的总和。这也创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。阿里这笔投入发生在两个重要时点之后。一是国内AI产业爆发；二是民营企业座谈会召开。吴泳铭表示：“AI爆发远超预期，国内科技产业方兴未艾，潜力巨大。阿里巴巴将不遗余力加速云和AI硬件基础设施建设，助推全行业生态发展。”

2月19日，阿里AI To C业务近期开启大规模人员招聘，开放招聘岗位达到数百个，其中AI技术、产品研发岗位占比达到90%，所招聘人员将重点投入到文本、多模态大模型、AI Agent等前沿技术与应用的相关工作中。

据了解，阿里AI To C是该公司围绕面向消费者的人工智能业务所构建的一个业务体系，涵盖多个产品和团队，包括代表性应用夸克、从阿里云分拆而来的通义，以及天猫精灵团队。此次阿里进一步扩大AI人员招聘，或将加速推动人工智能行业的人才流动与技术创新。

2月6日，全球顶尖人工智能科学家许主洪（Steven Hoi）正式加入阿里巴巴，出任阿里集团副总裁，负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案

百度

百度近期在人工智能领域动作频频，展现出从技术研发到应用落地的全面布局

2月28日，百度宣布文心大模型4.5将于3月16日正式上线，这一版本不仅强化了深度思考能力，还能原生处理文本、图像、视频、音频等多模态数据，实现跨格式内容生成与转换。该模型计划于6月30日开源，标志着百度从技术封闭走向开放生态的重要转折。此前，百度在2月27日透露下一代AI模型Ernie 4.5将于3月中旬推出，进一步升级推理能力，并支持更复杂的多模态任务，未来还将逐步向开发者开放。

2月24日，百度APP整合文心大模型与DeepSeek技术，推出“AI搜索”“全网信息提炼”“捏一下AI总结”等新功能，用户可通过自然语言提问直接获取精准答案，还能一键生成个性化内容总结。仅4天后，百度搜索全量上线DeepSeek满血版，用户点击搜索框下方入口即可体验联网增强版AI搜索，结合检索增强技术（RAG）大幅降低信息错误率。这一系列升级让搜索从“找信息”转向“解问题”，甚至能通过数字人智能体实现交互式服务。

这次升级的完成，意味着用户在百度使用AI搜索会更加容易，接入大模型更加简捷清晰。由此也导致用户的搜索行为快速发生了变化。这之后最显著的变化，是主观陪伴类的搜索需求开始大幅提升。

2月20日，百度搜索目前已全量上线DeepSeek满血版并提供联网服务，其中PC端开放仅1小时就有超千万人使用。对比其它接入DeepSeek的产品，百度搜索在首页搜索框下方点击“AI搜索DeepSeek满血版”即可体验

值得注意的是，百度搜索此次接入的是DeepSeek满血版，并融合了百度联网搜索功能，具备检索增强RAG等技术能力，便于用户获取更新、更低幻觉的信息。

2月7日，百度点亮了国内首个自研昆仑芯三代万卡集群，不仅解决了大模型训练的算力瓶颈，还为未来模型开源和成本降低奠定基础。与此同时，百度还在13日宣布文心一言自4月1日起全面免费，并向开发者开放深度搜索功能调用权限，进一步推动AI技术普惠化。从模型开源到算力突破，再到搜索场景的深度改造，百度正通过技术、产品、生态的三重发力，加速中国AI从“追赶”向“引领”跨越。

科大讯飞

3月3日，科大讯飞宣布完成星火深度推理大模型X1的全面升级，并基于星火X1首发星火医疗大模型X1。据悉，星火X1在完全采用国产算力训练的前提下，以70B参数量，实现了在数学能力上全面对标DeepSeek R1（参数量671B）和OpenAI o1，中文数学任务全面领先的效果。

2月10日，讯飞开放平台宣布DeepSeek-V3、DeepSeek-R1模型均已上线，支持公有云 API 调用、一键部署专属模型。同时还首发 DeepSeek 大模型精调服务，让开发者根据业务场景数据，深度定制“更聪明、更匹配”的专属DeepSeek 大模型。

官方表示，DeepSeek R1 蒸馏模型精调服务实现首发，基于优质开源小模型蒸馏优化，实现推理速度提升 3 倍以上，部署成本直降 80%，在保持强逻辑推理能力的同时，模型体积更加轻量化

3月4日，据报道，大模型独角兽智谱发布2025开源年的第一个模型：首个支持生成汉字的开源文生图模型“CogView4”。据悉，该模型在 DPG-Bench基准测试中的综合评分排名第一，在开源文生图模型中达到 SOTA（最先进的）。该模型也是首个遵循 Apache 2.0协议的图像生成模型。

3月3日，国产AI大模型“六小虎”之一的智谱，近期完成一笔金额超10亿元人民币的战略融资，参与投资方包括杭州城投产业基金、上城资本等。据悉，本轮融资旨在推动智谱国产基座GLM大模型的技术创新和生态发展。

2月11日，智谱和三星基于Agentic GLM展开合作，将Agent体验带到三星最新手机Galaxy S25系列上。智谱押注下一个技术爆发点Agent，并率先提出了Phone Use概念，推出了能模拟用户进行计算机、手机等跨应用自主操作的AutoGLM和GLM-PC，并基于Agentic GLM与三星手机展开合作，将 Agent 体验带到三星最新手机上，支持基于 AI 的实时语音和视频通话，以及实现视觉理解和系统功能调用、AI 搜索、文案写作等功能。

2月18日，昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1 及配套算法SkyReels-A1

前者支持影视级人物微表情与400+种自然动作组合生成，后者作为国内首个SOTA级别表情动作可控算法，可精准控制视频中人物表演细节，对标国际头部工具如Runway的Act-One。此次开源填补了中国在AI短剧生成领域的技术空白，通过开放模型能力吸引开发者生态，加速AIGC在短视频、影视创作等场景的落地。

2月14日，昆仑万维正式推出 Matrix-Zero世界模型，该模型包含两款子模型：昆仑万维自研3D场景生成大模型，和昆仑万维自研可交互视频生成大模型。其中昆仑万维Matrix-Zero的3D场景生成功能，支持将用户输入的图片转化为可自由探索的真实合理的3D场景，具备全局一致性、可自由探索、支持不同风格图片输入、支持风格迁移、支持动态场景生成。昆仑万维可交互视频大模型建立在生成式视频模型之上，结合自主研发的用户交互模块，最终实现以用户输入为核心驱动的空间智能视频生成方案。

2月8日，昆仑万维集团官方微信公众号发布消息，昆仑万维旗下“天工AI”正式推出PC版更新，上线“DeepSeek R1+联网搜索”功能。在「天工AI」PC端，用户只需在界面上勾选“深度思考 R1”按钮即可，输出的答案均为联网搜索后的答案。此次升级解决了此前用户反馈的DeepSeek模型联网功能不稳定问题，通过整合深度求索（DeepSeek）的R1模型能力，用户可在PC端实现联网搜索与实时信息获取，显著提升AI生成内容的时效性与准确性。

2月21日，今日举办的阶跃星辰生态开放日上，阶跃星辰创始人、CEO姜大昕表示，随着大模型技术的飞速进步，今天越来越多的人开始相信AGI在未来几年就会成为现实。据姜大昕透露，过去一年，阶跃星辰累计发布了11个模型，覆盖多个技术节点，预计今年3月，阶跃星辰还将开源公司自研的图生视频模型。

2月25日，据接近阶跃星辰的人士透露，近日该公司开源的 30B 超大参数视频生成模型 Step-Video-T2V，上线一周即引发海量生成作品，海内外创作者生成超 13.6 万次。此外，包括在全球拥有超 2000 万创作者的头部 AI 内容创作平台 LiblibAI，也已接入了 Step-Video-T2V。

2月27日，快手公布的数据显示，快手可灵AI全球月访问用户总数环比增长113%。作为国产多模态模型的代表，可灵AI在性能与性价比等关键维度均成功赶超海外模型，一直备受市场关注。

据行业观察机构瑞银分析，在线娱乐与教育是当前AI技术落地应用的核心场景。在这一背景下，快手凭借其自研的可灵AI，成功在应用层树立了标杆。可灵AI以其卓越的视频生成能力，在全球视频生成模型领域占据了领先地位。

2月19日，快手旗下视频剪辑工具快影宣布接入DeepSeek-R1满血版大模型，成为行业首批深度集成该AI能力的剪辑平台。此次合作将DeepSeek-R1的智能推理与快影“可灵AI视频生成”技术结合，上线“文案成片”“小说漫”“AI故事短片”等八大AI功能，支持从文字生成视频到智能剪辑的全链路创作。

快影同步宣布，80%的AI功能向用户免费开放，包括一键生成高清视频、智能字幕剪辑等，大幅降低创作门槛。通过AI辅助批量生产与质量优化，普通用户可快速产出接近专业级的内容，并借助智能变现工具提升商业化效率，推动短视频行业进入“零门槛智能创作”时代。

3月3日，MiniMax旗下产品海螺视频上线了「镜头控制」系列模型图生视频模型I2V-01-Director。与此前「镜头控制」的文生图视频T2V-01-Director共同组成01-Director系列。这也是整个Video-01系列的收官之作。

目前该模型已在全球上线，标志着MiniMax在AI视频生成领域从技术探索转向规模化应用，通过海螺视频App的低门槛工具链，或将加速AI生成内容（AIGC）在短视频、影视创作等场景的商业化落地。

2月20日，MiniMax（稀宇科技）合伙人兼副总裁魏伟近期离职，其曾主导公司B端业务并曾任腾讯云副总裁。MiniMax官方回应称国内B端业务进入“新发展阶段”，将由其他负责人接棒。此次人事变动发生在大模型行业高管频繁流动的背景下，如去年MiniMax产品负责人张前川转任顾问、百川智能商业化高管离职等，折射出AI大模型企业在商业化落地与市场竞争压力下的战略调整。魏伟的离职或与个人职业规划及公司业务重心变化相关，但其负责的B端业务能否延续增长仍需观察新团队的整合成效。

2月18日，有消息称，在DeepSeek影响下，月之暗面Kimi决定暂缓“烧钱”投放。对此，钛媒体AGI从知情人士从了解到，该动作核心原因在于DeepSeek热潮，带动近期 Kimi 智能助手“自然新增用户量猛涨”。这意味着，月之暗面对推广动作进行了相应调整。需要注意的是，月之暗面Kimi近期并没有新品，不投放广告属于正常现象。

2月18日，月之暗面宣布推出一款新模型Kimi Latest，它将对标Kimi智能助手当前使用的模型，随智能助手产品更新而同步升级（模型名称不变）。据介绍，Kimi Latest总是使用Kimi智能助手产品使用最新的Kimi大模型，可能包含尚未稳定的特性；上下文长度为128k，会自动根据上下文长度选择8k/32k/128k模型作为计费模型；支持自动上下文缓存。目前Kimi Latest仅支持调用Kimi普通版模型，Kimi k1.5长思考模型暂不支持API调用。

2月15日，月之暗面内部已将“持续拿到SOTA结果”确定为最重要的工作目标。2025年，他们计划在模型能力方向上加强多模态和长文本推理能力

来源：一梦栖

标签：模型排行榜昆仑万维月之暗面 kimi

本文地址：https://news.43u.com.cn/a/700536.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!