姚顺雨提到的“AI下半场”,产品评估仍被误解
机器之心报道编辑:张倩前段时间,OpenAI 研究员姚顺雨发表了一篇主题为「AI 下半场」的博客。其中提到,「接下来,AI 的重点将从解决问题转向定义问题。在这个新时代,评估的重要性将超过训练。我们需要重新思考如何训练 AI 以及如何衡量进展,这可能需要更接近
机器之心报道编辑:张倩前段时间,OpenAI 研究员姚顺雨发表了一篇主题为「AI 下半场」的博客。其中提到,「接下来,AI 的重点将从解决问题转向定义问题。在这个新时代,评估的重要性将超过训练。我们需要重新思考如何训练 AI 以及如何衡量进展,这可能需要更接近
今天,红杉中国对外宣布推出一款全新的AI基准测试工具xbench,并发布了一篇解释其工作原理的论文。这是自2022年ChatGPT点燃AGI赛道之后,第一家由投资机构主导发布的基准测试(Benchmark),给火爆的AI圈增添了新的话题。
5月23日,《麻省理工科技评论》35岁以下科技创新35人中国区(以下简称“TR35中国”)名单在沪发布。据悉,这是TR35中国区评选的第8年。
入选者中,有人以开源生态推动技术普惠,有人以合成数据突破具身智能瓶颈,有人将光合系统跨物种移植逆转退行性疾病,有人用拓扑超材料改写声波操控法则。他们的研究从实验室原子级成像到生产线分钟级装配,从微观蛋白质降解到宏观量子优越性验证……
从DeepBlue击败象棋世界冠军、AlphaGo征服围棋、GPT-4刷爆各类考试榜单,到o1、R1等新一代模型横扫数学、编程、写作、操作等任务,每一次历史性突破的背后,都是训练方法、模型架构的根本性创新。
AI发展分为上下两阶段。上半场以模型和方法为中心,核心构建了模型和训练方法;随着AI技术成熟,下半场的重点转向如何定义有现实意义的任务、如何有效评估AI系统的表现。
其中第三集聚焦一个叫 ReDream 的前沿技术,允许现代演员通过 AI 和虚拟现实与经典黑白电影中的虚拟角色互动,快速重拍经典影片。随着故事发展,主角发现 AI 角色似乎拥有自我意识。