国产大模型黑马的首个推理模型和o1PK后,我发现了AI深度思考的大问题 昨天,DeepSeek 新推出 R1-Lite 推理模型的预览版本,使用强化学习训练,号称不仅媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。 模型 推理模型 o1pk 2024-11-22 14:52 4