DeepSeek R1已在Gitee AI免费开冲——全尺寸碾压，小尺寸更有性价比！

摘要：DeepSeek R1 现已上线 Serverless API，访问 Gitee AI 即可免费在线使用：https://ai.gitee.com/serverless-api?model=DeepSeek-R1-Distill-Qwen-32B

DeepSeek R1 现已上线 Serverless API，访问 Gitee AI 即可免费在线使用：https://ai.gitee.com/serverless-api?model=DeepSeek-R1-Distill-Qwen-32B

这个春节，你玩上 DeepSeek 了吗？

霸屏整个春节假期的 DeepSeek 不但成为了开发者们的新宠，连马建仓家隔壁大爷都学会了用 DeepSeek 给老友写春节吉祥话。这个来自杭州深度求索的推理模型无疑是国内大模型厂商重要的里程碑。

在关注 660B 开源大模型的同时，马建仓更在意的其实是同时开源的多个小尺寸蒸馏模型，其中DeepSeek-R1-Distill-Qwen-32B在多项能力上已经默默对标上了OpenAI-o1-mini。没错，就是那个几个月前“引领新纪元”的o1-minio3-mini也开始免费用了，期待它的表现吧只能说）。

蒸馏模型（Distinctive Distillation Model），通常称为知识蒸馏（Knowledge Distillation），是一种将复杂模型（教师模型）的知识迁移到更简单的小模型（学生模型）中的技术。其核心思想是通过模仿教师模型的输出或中间特征，让学生模型在保持较小规模的同时，尽可能接近教师模型的性能，广泛应用于工业部署和资源受限场景。

以更小的参数量的资源占用，实现了性能与大参数模型旗鼓相当，这对于普通开发者来说无疑是巨大利好。更低的资源消耗以及更快的响应速度能够让开发者们以更低的成本实现更高效的 AI 应用开发。

小模型更该“轻装上阵”

作为一款轻量级模型，设计初衷就是高性价比的敏捷开发——但如果执着于本地部署，反而可能陷入“小模型大包袱”的困境：

本地部署模型看似零成本，实则需额外付出：

运维成本：需自建推理服务、监控日志、处理负载均衡

硬件成本：即使小模型也需持续占用 GPU/CPU 资源

机会成本：调试部署的时间，本可用于核心业务开发

为了让开发者们更快在实际开发中用上蛇年的“技术顶流”，现已在 Serverless API 中上线了模型，并提供免费使用！