全球首个支持混合推理！阿里通义千问 Qwen3 开源大模型震撼发布

摘要：2025 年 4 月 29 日，阿里正式推出通义千问系列最新力作 ——Qwen3 开源大语言模型，以全球首创的 "混合推理" 技术掀起 AI 领域新变革。该系列包含 8 款不同规模模型，涵盖稠密模型与混合专家模型（MoE），采用 Apache2.0 协议全面开

2025 年 4 月 29 日，阿里正式推出通义千问系列最新力作 ——Qwen3 开源大语言模型，以全球首创的 "混合推理" 技术掀起 AI 领域新变革。该系列包含 8 款不同规模模型，涵盖稠密模型与混合专家模型（MoE），采用 Apache2.0 协议全面开源并支持商用，致力于为全场景需求提供高性能、低成本的 AI 解决方案。

作为全球首个支持 "混合推理" 的大模型，Qwen3 突破性实现 "思考模式" 与 "非思考模式" 智能切换：面对复杂数学运算、代码编写等任务时自动启用深度推理，而处理简单问答时则采用轻量化响应，大幅降低算力消耗。这种智能调度机制，让模型既具备处理复杂任务的 "智慧大脑"，又保持即时响应的 "敏捷身手"。

在多语言能力方面，Qwen3 支持 119 种语言及方言，覆盖汉藏、印欧、南岛等主要语系，无论是跨语言翻译还是多语种指令执行均表现出色。其原生集成的 MCP 协议，赋予模型强大的智能体能力，可无缝对接代码解析器、知识库等外部工具，在复杂任务处理上达到开源模型领先水平。

多模态融合更是 Qwen3 的一大亮点。通过集成视觉（Qwen3-VL）与音频（Qwen3-Audio）模块，模型不仅能进行图像描述、语音转录，还支持跨模态内容生成，为创意创作、智能交互等场景带来全新可能。

在架构层面，Qwen3 采用混合专家（MoE）架构，以 235B 总参数模型为例，仅激活 22B 参数即可实现高效运算，运算效率提升达 10 倍。优化后的注意力机制不仅支持 32K 长上下文处理，更可扩展至惊人的 256K，为长文本处理提供坚实支撑。

训练体系上，Qwen3 累计使用 36 万亿 token 数据（为 Qwen2.5 的两倍），分三个阶段进行针对性训练：从基础语言能力构建，到 STEM 与代码数据强化，再到长上下文扩展，每个阶段都为模型注入强大能力。后训练环节通过四阶段强化学习，实现对人类偏好的精准对齐。

在权威基准测试中，Qwen3 展现出碾压级性能：数学推理能力在 AIME25 测试中得分 81.5，超越 OpenAI o1、Grok3；代码生成能力在 LiveCodeBench 评测突破 70 分，优于 Gemini2.5Pro；人类偏好对齐在 ArenaHard 测评中取得 95.6 分，大幅领先 DeepSeek-R1。

在效率与成本控制方面，旗舰模型 Qwen3-235B 仅需 4 张 H20 GPU 即可完成部署，显存占用仅为同类模型的 1/3。轻量化的 Qwen3-4B 模型性能媲美前代 72B 模型，在手机等移动设备上也能流畅运行。

从边缘设备到企业级应用，Qwen3 构建起完整的生态矩阵：0.6B/4B 等小模型可直接部署在手机、树莓派等终端，实现实时翻译、轻量级 RAG 应用；32B/235B 等大模型则适用于医疗诊断、法律文档分析等专业领域，支持 256K 超长文本处理。在教育科研领域，Qwen3-Math 可攻克高阶数学难题，Qwen3-Coder 助力代码开发；结合多模态能力，其在短视频创作、虚拟主播等创意场景中也展现出巨大潜力。

随着 Qwen3 的发布，阿里不仅为开发者提供了性能卓越的开源模型，更通过创新架构与技术突破，重新定义了大模型的性能标准。未来，阿里计划持续扩展模型规模与多模态能力，推动 AI 技术向更普惠、更实用的方向发展，为全球 AI 生态注入新动能。