红杉中国推出xbench,量化智能体真实世界生产力 随着人工智能技术的飞速发展,特别是 AI 智能体(Agent)能力的显著增强,现有基准测试在衡量其真实世界效能方面已显不足。针对这一挑战,红杉中国(没错,那家知名投资机构)今日推出了一个 AI 基准测试工具 xbench,并同步发布了相关技术报告《xbench 智能体 红杉 真实世界 xbench 智能体真实世界 2025-05-26 21:53 2