DeepSeek R1 现已上线 Serverless API,访问 Gitee AI 即可免费在线使用:https://ai.gitee.com/serverless-api?model=DeepSeek-R1-Distill-Qwen-32B摘要:DeepSeek R1 现已上线 Serverless API,访问 Gitee AI 即可免费在线使用:https://ai.gitee.com/serverless-api?model=DeepSeek-R1-Distill-Qwen-32B
这个春节,你玩上 DeepSeek 了吗?
霸屏整个春节假期的 DeepSeek 不但成为了开发者们的新宠,连马建仓家隔壁大爷都学会了用 DeepSeek 给老友写春节吉祥话。这个来自杭州深度求索的推理模型无疑是国内大模型厂商重要的里程碑。
在关注 660B 开源大模型的同时,马建仓更在意的其实是同时开源的多个小尺寸蒸馏模型,其中DeepSeek-R1-Distill-Qwen-32B在多项能力上已经默默对标上了OpenAI-o1-mini。没错,就是那个几个月前“引领新纪元”的o1-minio3-mini也开始免费用了,期待它的表现吧只能说)。蒸馏模型(Distinctive Distillation Model),通常称为知识蒸馏(Knowledge Distillation),是一种将复杂模型(教师模型)的知识迁移到更简单的小模型(学生模型)中的技术。其核心思想是通过模仿教师模型的输出或中间特征,让学生模型在保持较小规模的同时,尽可能接近教师模型的性能,广泛应用于工业部署和资源受限场景。
以更小的参数量的资源占用,实现了性能与大参数模型旗鼓相当,这对于普通开发者来说无疑是巨大利好。更低的资源消耗以及更快的响应速度能够让开发者们以更低的成本实现更高效的 AI 应用开发。
小模型更该“轻装上阵”
作为一款轻量级模型,设计初衷就是高性价比的敏捷开发——但如果执着于本地部署,反而可能陷入“小模型大包袱”的困境:本地部署模型看似零成本,实则需额外付出:
运维成本:需自建推理服务、监控日志、处理负载均衡
硬件成本:即使小模型也需持续占用 GPU/CPU 资源
机会成本:调试部署的时间,本可用于核心业务开发
为了让开发者们更快在实际开发中用上蛇年的“技术顶流”,现已在 Serverless API 中上线了模型,并提供免费使用!通过调用模型 API,告别“小模型大包袱”,真正实现高性价比的 AI 应用开发,当其他开发者还在盯着本地模型的 GPU 占用率时,聪明的你早已调通 API 写完应用核心层。
欢迎点击文末阅读原文访问 Gitee AI 官网,通过 Serverless API 体验,帮你垒实下一个“杀手级” AI 应用的第一块砖!Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 49 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。
在线阅读:https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf
来源:小倩科技园地