摘要:从12月5日起,OpenAI将举行为期12天的活动,发布多个新产品,包括Sora、ChatGPT语音增强、GPT-4o图像功能等;
生成式AI
一、 OpenAI圣诞大礼包连更12天!满血版o1、Sora确认亮相
1. 从12月5日起,OpenAI将举行为期12天的活动,发布多个新产品,包括Sora、ChatGPT语音增强、GPT-4o图像功能等;
2. 奥特曼确认AGI将在2025年初步实现,但强调其影响将较小,不会立即改变世界经济;
3. OpenAI对与微软的合作进行策略调整,计划在AGI实现时解除与微软的商业协议。
二、 谷歌 Genie 2 世界模型发布,还要和马斯克一起做AI游戏
1. Google DeepMind发布Genie 2,基于单张图像生成无限3D环境,支持人类与AI互动;
2. Genie 2支持动态交互、动作控制、长跨度记忆和多样环境生成,推动3D世界模型广泛应用;
3. 与李飞飞的World Labs对比,Genie 2侧重视频扩散和像素预测,而World Labs更注重物理世界建模。
三、 英伟达全新Star Attention,10倍加速推理,登顶HF论文榜
1. Star Attention显著提高LLM推理速度,在长上下文任务中加速比高达11倍,同时精度损失极小;
2. 通过将上下文分块处理,Star Attention有效降低计算成本,支持边缘设备处理更长序列;
3. Star Attention无缝集成至现有大模型,减少内存需求,实现更高效的推理,适用于本地和云端部署。
四、 AI Pin 失利后,Humane 公司押注 CosmOS AI 生态系统
1. Humane发布的CosmOS是由多个智能代理组成的AI驱动操作系统,专为智能设备和复杂任务设计;
2. CosmOS支持多种输入方式,代理能自主学习和协作,实时适应用户需求,确保任务相关性;
3. 核心组件Ai Bus协调任务分配和数据共享,确保代理高效协作,自动寻找替代方案应对问题。
五、 央企 AI 视频模型发布,2032年全球视频类规模将超180亿
1. 中国电信发布首个全自研的AI视频生成模型,支持全流程视频制作,涵盖脚本编写、拍摄、剪辑等;
2. 该模型在VBench评测中排名第一,展现出高水平的画面稳定性、语义一致性和动作流畅度;
3. 预计2032年全球AI视频生成市场将达180亿美元;TeleAI致力于推动AI产业应用,并与多家企业合作推进技术发展。
六、 Lilian Weng加盟Fellows Fund,助力AI探索与下一代创业者
1. 前OpenAI副总裁Lilian Weng加盟Fellows Fund,担任Distinguished Fellow,推动AI研究与投资;
2. Weng在OpenAI期间,推动AI安全技术进步,尤其在大型语言模型和对抗鲁棒性方面;
3. Fellows Fund专注于早期AI投资,已支持30余家初创企业,并致力于为创业者提供资源与资本支持。
七、 谜底揭晓!David Mayer等名字,ChatGPT死活都不说的原因
1. ChatGPT拒绝说出“David Mayer”名字,因其涉及隐私保护措施;
2. 该名字与几个申请“被遗忘权”的人相关,OpenAI出于避免法律诉讼而屏蔽了这些名字;
3. 通过UI输出和API调用等方式,仍可绕过这一限制,OpenAI已确认并修复该问题。
前沿科技
八、 Nature重磅:DeepMind GenCast,8分钟预测15天全球天气
1. DeepMind的AI模型GenCast能在8分钟内提供15天全球天气预报,且精度超过现有最先进的天气系统;
2. GenCast通过条件扩散模型生成多种天气场景,特别在极端天气、热带气旋和风能预报中表现突出;
3. 相比传统预报方法,GenCast在预报速度、准确性和不确定性量化方面实现显著突破,推动天气预报领域向AI化发展。
报告观点
九、 红杉美国:2025 年AI 智能体将进入“群体协作”的Agent元年
1. 2025年起,AI智能体将进入“群体协作”时代,多个智能体将协作或对抗,完成复杂任务;
2. 医疗和教育等领域将成为AI技术的关键战场,AI能有效降低成本,提高社会效率;
3. AI的潜力巨大,智能体将在增强人类能力的同时,也能独立完成任务,推动各行业的变革。
十、 对话DeepMind资深科学家:大模型时代AlphaZero依然重要
1. 强化学习仍然是AI领域的重要研究方向,尤其在大语言模型和通用AI(AGI)实现中起到关键作用;
2. AI对医疗等领域具有巨大潜力,但要投入使用需要谨慎设计和长期验证;
3. AGI是远期目标,当前大语言模型虽然具备通用能力,但仍有局限性,未来的进展取决于AI社区的创造力和灵感。
来源:腾讯研究院