o1pk

国产大模型黑马的首个推理模型和o1PK后，我发现了AI深度思考的大问题

昨天，DeepSeek 新推出 R1-Lite 推理模型的预览版本，使用强化学习训练，号称不仅媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。