斯坦福揭秘o1-preview软肋!数学竞赛题稍作修改 斯坦福大学最近的一项研究发现,尽管o1-preview在数学、代码等领域能力逆天,但只要对数学竞赛的题目稍修改,模型解答的准确率竟会立刻下降30%。 斯坦福 数学竞赛 普特南 2025-02-06 15:31 3