苹果自动驾驶新进展:36块钱训练百万公里数据,10天跑完16亿公里 该论文的创新之处在于提出了一种全新的大规模自博弈强化学习框架GIGAFLOW,并证明其能够有效训练出通用且具备鲁棒性的驾驶策略。 苹果 训练 gigaflow 2025-02-24 19:16 2