计算所工程师

Deepseek R1 的技术揭秘与低成本复现,中科院计算所工程师『致 Great』的分享实录已整理!

活动邀请了中科院计算所工程师暨和鲸社区资深创作者『致 Great』和大家进行分享。活动中,他向我们介绍了市面上众多 Deepseek R1 复现开源方案的优缺点,并且展示了如何使用Unsloth 来训练自己的 R1 推理模型(GRPO)并且达到顿悟时刻(附代码

deepseek 计算所 deepseekr1 计算所工程师 2025-03-11 15:11  3