摘要:4 月 29 日,阿里巴巴发布并开源了最新一代大语言模型Qwen3系列。本次开源了Qwen3-235B-A22B和Qwen3-30B-A3B两款 MoE 模型以及Qwen3-32B、14B、8B、4B、1.7B、0.6B多款密集模型。
本土芯片厂商天数智芯完成了Qwen3适配,现已上线模力方舟供开发者使用体验:https://ai.gitee.com/serverless-api/packages/1496
4 月 29 日,阿里巴巴发布并开源了最新一代大语言模型Qwen3系列。本次开源了Qwen3-235B-A22B和Qwen3-30B-A3B两款 MoE 模型以及Qwen3-32B、14B、8B、4B、1.7B、0.6B多款密集模型。
本土芯片厂商天数智芯现已完成了 MoE 模型Qwen3-30B-A3B以及Qwen3-32B、8B和4B的适配工作,并已上线模力方舟的天数智芯模型资源包。
Qwen3 系列最大的创新在于引入「思考模式」与「非思考模式」的混合设计。在思考模式下,模型会进行深入的逐步推理;而非思考模式则提供快速响应。这种设计允许用户根据实际需求灵活调整「思考预算」,在复杂任务上投入更多计算资源,简单任务则快速完成。
其中本次天数智芯完成适配的Qwen3-30B-A3B模型提供了更强的性能,也被认为可能是本地部署代码助手的理想选择。甚至4B参数的小模型也能匹敌此前Qwen2.5-72B-Instruct的表现水平。
值得一提的是,部署在天数智芯算力资源上的Qwen3-32B及Qwen3-4B支持 Function Calling 能力,从在线体验中可以看出,部署在天数智芯算力资源上的Qwen3-30B-A3B的响应速度和输出速度十分迅速,且输出质量令人满意!
天数智芯是国内领先的通用 GPU 高端芯片及超级算力系统提供商。天数智芯通用 GPU 产品具有高性能、通用性、灵活性等特点,支持国内外主流 AI 生态和各种深度学习框架,已支撑各行业客户在人工智能领域进行超过数百个不同种类的模型,获得客户高度认可。
来源:码云Gitee