腾讯研究院AI速递 20250116

摘要：ChatGPT新功能"Tasks"支持用户设置定时任务，可自动执行一次性或周期性任务，将向ChatGPT Plus、Team和Pro用户推送；

生成式AI

一、 ChatGPT的全新功能「Tasks」上线，AGI跨入L3级智能体

1. ChatGPT新功能"Tasks"支持用户设置定时任务，可自动执行一次性或周期性任务，将向ChatGPT Plus、Team和Pro用户推送；

2. 用户可通过"GPT-4o with scheduled tasks"模型设置最多10个活跃任务，支持Web、iOS、Android、MacOS平台，支持通知推送；

3. OpenAI联创表示2025年将是"Agents"爆发年，此次更新是向L3级智能体迈进的重要一步，更强大的"Operator"功能已在开发中。

二、 MiniMax开源大更新，4560亿参数，支持400万长上下文

1. MiniMax开源4560亿参数基础语言模型MiniMax-Text-01，首创Lightning Attention机制，支持400万token超长上下文；

2. 新模型表现对标GPT-4o、Claude 3.5，在HumanEval、GPQA Diamond等多个测试集上超越主流开源和闭源模型；

3. 同步推出视觉多模态模型MiniMax-VL-01，团队正研发无限上下文窗口技术，希望为AI Agent应用发展打基础。

三、 MiniCPM-o 更新2.6版本，视觉语音和多模态流式能力增强

1. MiniCPM-o 2.6使用端到端全模态架构连接不同模态编解码模块，总参数量8B，多模态能力对标GPT-4o水平；

2. 支持配置化的中英双语语音对话，具备声音克隆、情感控制等高级功能，并优化了OCR等视觉能力；

3. 创新设计时分复用的全模态流式处理机制，可在iPad等终端设备实现实时多模态交互。

四、 Vidu 2.0发布，100镜实测，一致性新玩法再次称霸2D动画界

1. Vidu 2.0版本生成速度提升至10秒内，较前代提速3倍，且提供闲时不限量免费生成模式；

2. 强化多主体一致性，支持人物表情迁移和精准的镜头景别控制，首尾帧转场更加流畅自然；

3. 能稳定保持水墨、扁平等多种艺术风格，单价0.258元/秒，在AI动画领域具有优势。

五、科大讯飞基于国产算力的推理大模型X1，率先落地教育、医疗

1. 科大讯飞发布全由国产算力驱动的讯飞星火X1大模型，中文数学能力居国内首位，已在教育和医疗场景落地应用；

2. 升级星火4.0 Turbo，图文识别准确率提升40%，具备混域知识搜索功能，长文本错误率降低40%；

3. 推出其首个端到端语音同传大模型，最低时延5秒，将于2025年推出商务套装。

六、 Sakana AI的Transformer²，「活」AI模型，动态调整权重

1. Sakana AI提出Transformer²自适应模型架构，能像生物一样动态调整权重适应任务，支持终生学习；

2. 引入奇异值微调(SVF)技术，与传统LoRA相比显著减少参数量，降低过拟合风险，提升模型组合性；

3. 在数学、编程、视觉理解等任务上性能显著提升，实验显示随测试条件增加效果越好。

七、微软宣布开源AI Agent AutoGen 发布0.4版本，多层级架构

1. 微软AutoGen 0.4版本全面重构，引入异步消息机制，增强代码稳定性、通用性和可扩展性；

2. 新增模块化设计、跨语言支持和可视化拖拽界面，内置指标跟踪和调试工具，支持社区扩展；

3. 集成Magentic-One多层级架构，包含5个专业Agent，通过Orchestrator协调实现异步事件驱动和高度模块化。

八、英伟达投资中国台湾初创公司MetAI，打造AI+3D数字孪生平台

1. 英伟达首次投资中国台湾AI公司MetAI，参与400万美元种子轮融资，助力数字孪生平台发展；

2. MetAI技术可将CAD文件快速转换为仿真环境，将仓库数字孪生仿真时间从数千小时缩短至3分钟；

3. MetAI计划2025年将总部迁至美国，专注物理AI训练和自动化系统实施，预计单个项目可带来300万美元收入。

前沿科技

九、交大O1的医疗探索：延长AI思考时间，解锁复杂推理诊断

1. 上海交大通过延长AI思考时间，仅需500个样本训练即可提升医疗诊断准确率6%-11%；

2. 采用LongStep和LongMonolog两种长思维链数据训练方法，让AI模仿医生诊断思维模式；

3. 研究发现复杂医疗问题方面，需更长推理链，大参数模型从推理时间扩展中获益。

报告观点

十、「全球第一商学院」教授谈AGI：应如何看待AI实验室的预言？

1. 沃顿商学院教授Mollick对AI实验室AGI预测持怀疑态度，需谨慎看待，且人类采用和适应AI技术的速度可能被高估；

2. OpenAI的o3模型在GPQA、FrontierMath等基准测试中超越人类表现，显示AI能力突破性进展；

3. AI狭域Agent已具实用价值，如谷歌Gemini的Deep Research能在短时间完成复杂研究报告。

AI50节选

👇订阅下方合集，获取每日推送

来源：腾讯研究院

标签：腾讯速递 agent

本文地址：https://news.43u.com.cn/a/454827.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐