从OpenAI回清华,吴翼揭秘强化学习之路:随机选的、笑谈“当年不懂股权的我” | AGI 技术 50 人
人工智能的浪潮席卷而来,从大模型竞赛到智能体系统的探索,从生成模型到推理模型,技术巨头们纷纷入场,推动着一场“AI 重新定义一切”的时代跃迁。但在这场热潮背后,真正推动技术向前的,从来不是一场场轰动的发布会,也不是那些令人眼花缭乱的融资神话,而是一群敢于直面复
人工智能的浪潮席卷而来,从大模型竞赛到智能体系统的探索,从生成模型到推理模型,技术巨头们纷纷入场,推动着一场“AI 重新定义一切”的时代跃迁。但在这场热潮背后,真正推动技术向前的,从来不是一场场轰动的发布会,也不是那些令人眼花缭乱的融资神话,而是一群敢于直面复
从技术上说,所谓的偏见(bias),就是在特定的场景下,大模型的过度自信现象。在AI领域,偏见其实非常普遍,并不仅仅局限于性别和种族。
近日,ACM 将 2024 年的图灵奖授予强化学习之父 Richard S. Sutton 和其导师 Andrew G. Barto,以表彰他们在强化学习领域的开创性贡献。正如 Sutton 所言:“尽管生成式 AI 目前备受关注,但强化学习一直在稳步提升自己
在 ChatGPT 诞生两年后,DeepSeek App 上线仅 20 天,日活超 2000 万,成为比 ChatGPT 增长还要迅猛的超级 APP 。
deepseek 吴翼 deepseek专场 2025-02-07 20:52 17
近日,有消息称蚂蚁集团已成立强化学习实验室,大模型初创企业边塞科技创始人吴翼已入职,担任该实验室首席科学家。吴翼就入职蚂蚁事件在朋友圈回应称:“最近受蚂蚁邀请做蚂蚁大模型强化学习方向的研究,我在清华大学交叉信息院的任教以及边塞科技都在继续。蚂蚁有很好的大模型应