rl

强化学习之于 AI Agent,是灵魂、还是包袱?

而要谈真正具备决策能力和自我意识的 Agent,其实要从 AlphaGo 的问世说起。这是 AI 首次展示出非模板化、非规则驱动的智能行为。而 AlphaGo 也靠着深度神经网络与 RL,进行自我对弈与自我优化,最终击败人类顶级棋手,敲响了 Agent 时代的

灵魂 agent aiagent 包袱 rl 2025-04-22 18:33  5

机器人竞技真实世界,敢为天下先加速

19日,北京亦庄半程马拉松暨全球首个人形机器人半程马拉松开跑,吸引了20支人形机器人赛队和12000名人类选手同台亮技。约21公里的赛程,横跨多种复杂地形,对参赛机器人续航能耗和散热能力,环境感知与步态、关节结构与谐波减速器,及运动算法等,都是一种多多益善的考

马拉松 机器人 人形机器人 真实世界 rl 2025-04-21 08:42  5