「古董」GPU也能跑DeepSeek同款GRPO! 开源微调神器Unsloth带着黑科技又来了:短短两周后,再次优化DeepSeek-R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1/10! gpu deepseek 古董 grpo deepseek同 2025-03-10 20:13 3