Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型，全免费体验！

摘要：Gitee AI 刚刚上线了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四

Gitee AI 刚刚上线了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的 DeepSeek 模型。值得关注的是，本次上线的四个模型均部署在国产沐曦曦云 GPU 上。

与全尺寸 DeepSeek 模型相比，较小尺寸的 DeepSeek 蒸馏版本模型更适合企业内部实施部署，可以极大地降低落地成本。

同时，这次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平台，更是实现了从芯片到平台，从算力到模型，全国产研发、中国制造。

DeepSeek R1 是一款大型混合专家（MoE）模型，拥有 6710 亿个参数，支持 128000 个 Token 的大输入上下文长度。在数学、代码和自然语言推理等任务上表现出色。

本次部署在沐曦曦云 GPU 上的是四个 DeepSeek R1 蒸馏模型，以更小参数量的资源占用，实现了性能与大参数模型旗鼓相当。

曦云系列通用 GPU 产品（包括 C550、C500、C500X、C290、C280、N260 等型号）采用完全自主研发的 GPU IP，拥有完整的知识产权，并具备强大的多精度混合计算能力及高带宽显存支持。同时，沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈，可广泛应用于智能、通用计算和数据处理等场景。