天数智芯完成 Qwen3 适配，现已上线模力方舟

摘要：4 月 29 日，阿里巴巴发布并开源了最新一代大语言模型Qwen3系列。本次开源了Qwen3-235B-A22B和Qwen3-30B-A3B两款 MoE 模型以及Qwen3-32B、14B、8B、4B、1.7B、0.6B多款密集模型。

本土芯片厂商天数智芯完成了Qwen3适配，现已上线模力方舟供开发者使用体验：https://ai.gitee.com/serverless-api/packages/1496

4 月 29 日，阿里巴巴发布并开源了最新一代大语言模型Qwen3系列。本次开源了Qwen3-235B-A22B和Qwen3-30B-A3B两款 MoE 模型以及Qwen3-32B、14B、8B、4B、1.7B、0.6B多款密集模型。

本土芯片厂商天数智芯现已完成了 MoE 模型Qwen3-30B-A3B以及Qwen3-32B、8B和4B的适配工作，并已上线模力方舟的天数智芯模型资源包。

Qwen3 系列最大的创新在于引入「思考模式」与「非思考模式」的混合设计。在思考模式下，模型会进行深入的逐步推理；而非思考模式则提供快速响应。这种设计允许用户根据实际需求灵活调整「思考预算」，在复杂任务上投入更多计算资源，简单任务则快速完成。

其中本次天数智芯完成适配的Qwen3-30B-A3B模型提供了更强的性能，也被认为可能是本地部署代码助手的理想选择。甚至4B参数的小模型也能匹敌此前Qwen2.5-72B-Instruct的表现水平。

值得一提的是，部署在天数智芯算力资源上的Qwen3-32B及Qwen3-4B支持 Function Calling 能力，从在线体验中可以看出，部署在天数智芯算力资源上的Qwen3-30B-A3B的响应速度和输出速度十分迅速，且输出质量令人满意！

天数智芯是国内领先的通用 GPU 高端芯片及超级算力系统提供商。天数智芯通用 GPU 产品具有高性能、通用性、灵活性等特点，支持国内外主流 AI 生态和各种深度学习框架，已支撑各行业客户在人工智能领域进行超过数百个不同种类的模型，获得客户高度认可。

来源：码云Gitee

标签： moe 适配 moe模型 qwen3 qwen3适配

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!