摘要:ChatGPT新功能"Tasks"支持用户设置定时任务,可自动执行一次性或周期性任务,将向ChatGPT Plus、Team和Pro用户推送;
生成式AI
一、 ChatGPT的全新功能「Tasks」上线,AGI跨入L3级智能体
1. ChatGPT新功能"Tasks"支持用户设置定时任务,可自动执行一次性或周期性任务,将向ChatGPT Plus、Team和Pro用户推送;
2. 用户可通过"GPT-4o with scheduled tasks"模型设置最多10个活跃任务,支持Web、iOS、Android、MacOS平台,支持通知推送;
3. OpenAI联创表示2025年将是"Agents"爆发年,此次更新是向L3级智能体迈进的重要一步,更强大的"Operator"功能已在开发中。
二、 MiniMax开源大更新,4560亿参数,支持400万长上下文
1. MiniMax开源4560亿参数基础语言模型MiniMax-Text-01,首创Lightning Attention机制,支持400万token超长上下文;
2. 新模型表现对标GPT-4o、Claude 3.5,在HumanEval、GPQA Diamond等多个测试集上超越主流开源和闭源模型;
3. 同步推出视觉多模态模型MiniMax-VL-01,团队正研发无限上下文窗口技术,希望为AI Agent应用发展打基础。
三、 MiniCPM-o 更新2.6版本,视觉语音和多模态流式能力增强
1. MiniCPM-o 2.6使用端到端全模态架构连接不同模态编解码模块,总参数量8B,多模态能力对标GPT-4o水平;
2. 支持配置化的中英双语语音对话,具备声音克隆、情感控制等高级功能,并优化了OCR等视觉能力;
3. 创新设计时分复用的全模态流式处理机制,可在iPad等终端设备实现实时多模态交互。
四、 Vidu 2.0发布 ,100镜实测,一致性新玩法再次称霸2D动画界
1. Vidu 2.0版本生成速度提升至10秒内,较前代提速3倍,且提供闲时不限量免费生成模式;
2. 强化多主体一致性,支持人物表情迁移和精准的镜头景别控制,首尾帧转场更加流畅自然;
3. 能稳定保持水墨、扁平等多种艺术风格,单价0.258元/秒,在AI动画领域具有优势。
五、 科大讯飞基于国产算力的推理大模型X1,率先落地教育、医疗
1. 科大讯飞发布全由国产算力驱动的讯飞星火X1大模型,中文数学能力居国内首位,已在教育和医疗场景落地应用;
2. 升级星火4.0 Turbo,图文识别准确率提升40%,具备混域知识搜索功能,长文本错误率降低40%;
3. 推出其首个端到端语音同传大模型,最低时延5秒,将于2025年推出商务套装。
六、 Sakana AI的Transformer²,「活」AI模型,动态调整权重
1. Sakana AI提出Transformer²自适应模型架构,能像生物一样动态调整权重适应任务,支持终生学习;
2. 引入奇异值微调(SVF)技术,与传统LoRA相比显著减少参数量,降低过拟合风险,提升模型组合性;
3. 在数学、编程、视觉理解等任务上性能显著提升,实验显示随测试条件增加效果越好。
七、 微软宣布开源AI Agent AutoGen 发布0.4版本,多层级架构
1. 微软AutoGen 0.4版本全面重构,引入异步消息机制,增强代码稳定性、通用性和可扩展性;
2. 新增模块化设计、跨语言支持和可视化拖拽界面,内置指标跟踪和调试工具,支持社区扩展;
3. 集成Magentic-One多层级架构,包含5个专业Agent,通过Orchestrator协调实现异步事件驱动和高度模块化。
八、 英伟达投资中国台湾初创公司MetAI,打造AI+3D数字孪生平台
1. 英伟达首次投资中国台湾AI公司MetAI,参与400万美元种子轮融资,助力数字孪生平台发展;
2. MetAI技术可将CAD文件快速转换为仿真环境,将仓库数字孪生仿真时间从数千小时缩短至3分钟;
3. MetAI计划2025年将总部迁至美国,专注物理AI训练和自动化系统实施,预计单个项目可带来300万美元收入。
前沿科技
九、 交大O1的医疗探索:延长AI思考时间,解锁复杂推理诊断
1. 上海交大通过延长AI思考时间,仅需500个样本训练即可提升医疗诊断准确率6%-11%;
2. 采用LongStep和LongMonolog两种长思维链数据训练方法,让AI模仿医生诊断思维模式;
3. 研究发现复杂医疗问题方面,需更长推理链,大参数模型从推理时间扩展中获益。
报告观点
十、 「全球第一商学院」教授谈AGI:应如何看待AI实验室的预言?
1. 沃顿商学院教授Mollick对AI实验室AGI预测持怀疑态度,需谨慎看待,且人类采用和适应AI技术的速度可能被高估;
2. OpenAI的o3模型在GPQA、FrontierMath等基准测试中超越人类表现,显示AI能力突破性进展;
3. AI狭域Agent已具实用价值,如谷歌Gemini的Deep Research能在短时间完成复杂研究报告。
AI50节选
👇订阅下方合集,获取每日推送
来源:腾讯研究院