AI 模型训练到一半,突然开窍了?(解读 Grokking 现象)
Randall Balestriero:好的。首先,为了避免一些误解。样条曲线理论很丰富,可能从 20 世纪 80 年代甚至更早就被用于函数逼近。但问题是,大多数研究针对一维、二维或三维输入空间,因为这是函数逼近的主要应用场景,比如偏微分方程。所以我们在 20
训练 模型 样条曲线 grokking grokking现象 2025-02-13 04:38 4
Randall Balestriero:好的。首先,为了避免一些误解。样条曲线理论很丰富,可能从 20 世纪 80 年代甚至更早就被用于函数逼近。但问题是,大多数研究针对一维、二维或三维输入空间,因为这是函数逼近的主要应用场景,比如偏微分方程。所以我们在 20
训练 模型 样条曲线 grokking grokking现象 2025-02-13 04:38 4