腾讯研究院AI速递 20250514

360影视 动漫周边 2025-05-14 08:01 1

摘要:OpenAI为Deep Research新增PDF导出功能,支持表格、图片和可点击引用链接,获得大量用户好评;立即向Plus、Team和Pro用户开放;

生成式AI

一、 OpenAI 为 Deep Research 功能推出全新的 PDF 导出功能

1. OpenAI为Deep Research新增PDF导出功能,支持表格、图片和可点击引用链接,获得大量用户好评;立即向Plus、Team和Pro用户开放;

2. 此更新是新任应用事业部负责人Fidji Simo上任后的首个动作,显示OpenAI正加速向企业市场转型,将AI能力与实际工作流程深度融合;

3. AI研究助手竞争加剧,各公司从比拼功能转向优化用户体验和工作流集成,PDF导出成为企业级AI工具的基本门槛。

二、 一手实测深夜发布的世界首个设计类的Agent产品 - Lovart

1. Lovart是首个设计垂类Agent,具备设计规范生成、图像生成、尺寸延展、图文分离等功能;能基于设计专业知识自动匹配风格和制定执行计划;

2. 产品支持全流程设计,从需求分析到视频合成、二次修改,集成了可灵、11labs、suno等工具,能实现从静态图到动态视频的转换;

3. 这标志着在Agent加持下设计工作流将发生重大变革,从单纯的作品创作转向完整的产品资产交付,垂直领域Agent或将成为行业发展趋势。

三、 昆仑万维开源Matrix-Game,单图打造游戏世界无限宇宙

1. Matrix-Game是昆仑万维开源的首个10B+交互式世界基础模型,能根据用户输入生成连贯可控的游戏互动视频,在视觉质量、物理一致性等方面超越现有开源模型;

2. 模型通过两阶段训练(无标签预训练+标注数据可控训练)和Matrix-Game-MC数据集训练,结合独特的图像到世界建模架构,实现了高精度的动作响应和场景泛化;

3. 这代表空间智能领域的重要突破,不仅适用于游戏开发,还可与天工、Mureka等AI产品联动,推动影视、广告、XR等领域的内容生产革新。

四、 腾讯发布首个多模态统一CoT奖励模型,奖励能力大幅跃升

1. 腾讯混元联合多家机构推出UnifiedReward-Think,首次实现具备长链式推理能力的统一多模态奖励模型,通过三阶段训练(冷启动激发、拒绝采样巩固、GRPO强化)提升评估能力;

2. 该模型解决了现有奖励模型只能"表面判断"的问题,展现出显式和隐式推理能力,在图像生成和理解任务中性能显著提升,同时保持高可解释性;

3. UnifiedReward-Think已全面开源,包含模型、数据集和工具,代表奖励模型从简单"打分器"向具备认知理解的智能评估系统转变。

五、 今天起,Manus AI 开放注册人人免费可用,每天免费玩一次

1. Manus AI取消邀请码制度,开放全民免费使用权限;每位用户可获得每日300积分的免费任务额度,以及一次性1000积分奖励;

2. 平台提供三档付费订阅方案(19美元、39美元、199美元/月),可解锁更多功能和优先服务;同时免费积分当日有效,不支持结转;

3. Manus AI近期完成由Benchmark领投的7500万美元融资,估值升至5亿美元,资金将用于拓展美国、日本和中东等海外市场。

六、 刚刚,美国正式废除《AI扩散规则》,但提出了替换新规则

1. 美国商务部废除拜登《AI扩散规则》,认为其会扼杀创新并损害外交关系;特朗普政府计划推出新的简化规则,同时向沙特等可信赖盟友开放AI技术出口;

2. 但同时加强对海外AI芯片管制,禁止全球使用华为昇腾芯片,并发布指南防止AI芯片转移;OpenAI等科技巨头认为过度管制可能促使其他国家转向中国AI技术;

3. 沙特承诺向美国投资6000亿美元,涉及AI数据中心、航空航天等多个领域,英伟达等科技股因此大涨;中方回应称美方做法将阻碍全球半导体产业发展。

前沿科技

七、 5千段真实对话,262名医生参与,OpenAI开源医学基准测试

1. OpenAI推出医疗评估基准HealthBench,由262名医生参与构建,包含5000段真实对话,通过4.8万个标准全面评估AI模型;

2. 测试显示最新模型o3得分60%,远超早期GPT系列,且小型模型性能提升显著,成本降低;

3. 项目开源两个版本并发布完整评估工具,基于模型的评分系统与医生判断达到相似一致性。

报告观点

八、 黄仁勋:AI工厂是下个千兆瓦级产业革命,正在大力投资

1. 黄仁勋认为AI工厂将引领下一代产业革命,NVIDIA正在建设投资五六百亿美元的千兆瓦级AI工厂,预计未来十年全球将建成数十座同级工厂;

2. AI首次实现了真正的数字劳动力扩充,不仅替代已有IT系统,还能影响几乎所有行业,将成为继信息和能源之后的新一代基础设施;

3. 英伟达通过长期主义文化保持创新,已从芯片公司转型为AI基础设施公司,年研发投入200-300亿美元,致力于构建全球AI生态系统标准。

九、 奥特曼:AI智能体加速登场,年轻一代将把AI视为操作系统

1. OpenAI计划将ChatGPT发展为个性化AI服务,奥特曼预测2025年AI智能体大规模应用,2026年具备发现新知识能力,2027年进入物理世界创造商业价值;

2. 团队坚持精简高效结构和快速迭代策略,目标定位为用户核心AI订阅服务提供商,致力打造一个能记住用户终身信息的轻量化模型;

3. 不同年龄段对AI应用差异显著:老年人将其视为搜索工具,中年人视为顾问,年轻人已将其作为操作系统使用。

来源:腾讯研究院

相关推荐