得主sutton资讯

智能体版《苦涩的教训》，图灵奖得主Sutton、谷歌RL大佬Silver新作：超人智能靠经验

图 1：主流人工智能范式的简要时间线。纵轴显示该领域在强化学习（RL）上的总体努力和计算资源的占比。人类数据时代提供了一个吸引人的解决方案。海量的人类数据语料库包含了大量任务的自然语言示例。与模拟时代相对有限的成功相比，基于这些数据训练的智能体实现了广泛的技能

与此同时，David Silver 和他的老师、2024 年图灵奖得主 Richard Sutton 合作撰写的论文《 Welcome to the Era of Experience 》称人们正站在人工智能新时代的门槛上，并有望达到前所未有的水平；同时展望了