腾讯研究院AI速递 20250530

360影视 日韩动漫 2025-05-30 00:01 4

摘要:DeepSeek-R1新版本正式开源,编程能力超越Claude 4 Sonnet,与o4-mini(Medium)性能相当;

生成式AI

一、 新版DeepSeek-R1正式开源!已放出权重!直逼o3编程

1. DeepSeek-R1新版本正式开源,编程能力超越Claude 4 Sonnet,与o4-mini(Medium)性能相当;

2. 新模型核心优势包括深度推理能力、自然文本生成、支持30-60分钟长时思考,一次运行即可完美执行复杂代码;

3. 实测表明在3D动画、网站设计和复杂推理问题上表现优异,思考过程更稳定,能完整处理长链条推理。

二、 可灵2.1刚刚上线,价格降了65%,更快、更听话、也更强

1. 可灵2.1正式上线,价格降低65%,效果、速度均有提升,形成标准版、高品质版、大师版三档清晰分层;

2. 高品质版(35灵感值)效果媲美旧版大师版,1080P画质,运动效果出色,普通创作需求足够,但仅支持图生视频;

3. 新版本性价比显著提升,普通用户适合选择2.1高品质版,而商业级制作可搭配2.1大师版,让AI视频创作更加亲民。

三、 一天内完成更新!腾讯多款产品接入DeepSeek R1最新版

1. 腾讯元宝、ima、搜狗输入法、QQ浏览器等多款产品已率先接入DeepSeek R1-0528最新版,从开源到上线仅用不到1天;

2. 用户可在腾讯多款产品中选择DeepSeek模型R1深度思考,实现免费不限量使用

3. 腾讯将坚持双模型驱动,始终选择更好、更先进的模型,并第一时间部署上线,始终为用户打造「好用的AI」

四、 Opera浏览器迎来了新成员Opera Neon“AI Agent”浏览器

1. Opera发布AI时代入口级产品Opera Neon,这是首款"AI Agent"浏览器,旨在重新定义浏览器在代理网络中的角色;

2. Opera Neon由三大功能组成:Neon Chat(聊天)、Neon Do(执行网页任务)和Neon Make(复杂创作),能够理解用户意图并转化为行动;

3. Neon Make是最具创新性功能,利用云技术执行复杂任务如生成报告、设计游戏原型和构建Web应用,在用户离线时也能工作。

五、 3D大模型明星初创VAST推出的Tripo Studio四功能升级

1. VAST升级Tripo Studio,推出四大核心功能:智能部件分割、贴图魔法笔刷、智能低模生成和万物自动绑骨,实现从"给模型"到"交成果"的质变;

2. 智能部件分割实现一键拆建,可精准识别模型各部分;贴图魔法笔刷简化贴图修复流程;智能低模生成在保留细节前提下大幅减少面数;

3. 万物自动绑骨功能能识别各类生物力学特征并快速完成骨骼权重分配,非专业人士也能完成全流程3D创作,效率提升10倍以上。

六、 两位自动驾驶大牛创业世界模型:40毫秒/帧,实时可交互

1. 自动驾驶大牛Oliver Cameron和Jeff Hawke创立Odyssey,推出世界模型实现视频实时生成,速度达40毫秒/帧,支持实时交互;

2. 该技术区别于传统视频模型,通过真实生活视频学习像素和动作,采用窄分布模型架构解决自回归建模挑战,无需游戏引擎即可实现持续生成;

3. Odyssey已获2700万美元融资,当前预览版由H100 GPU集群支持,输出30FPS的5分钟连贯交互视频,用户可免费体验,开启世界模型的新阶段。

前沿科技

七、 又有一个 AI Scientist 的论文通过了顶会同行评审,叫Zochi

1. AI科学家Zochi的论文被顶会ACL主会录用,成为首个独立通过A*级别会议同行评审的AI系统,Beta测试同日上线;

2. Zochi的论文《Tempest: 基于树搜索的大型语言模型自主多轮越狱》展示了其多轮攻击方法,在GPT-3.5上成功率达100%,GPT-4上达97%;

3. Zochi能自主完成从文献分析到同行评审的科学研究过程,论文质量高,但其公司曾引发学术界对科学同行评审过程被滥用的批评风波。

八、 从实验室到茶水间,可量产十万内全尺寸具身机器人Wanda 2.0

1. 优理奇推出的轮式双臂机器人Wanda 2.0售价8.8万元起,已量产交付,具备自主完成复杂长序列任务的能力;

2. Wanda 2.0搭载融合触觉的预训练多模态大模型UniTouch和长序列任务规划模型UniCortex,通过UniFlex模仿学习框架仅需5-10次示教即可学习新动作;

3. 优理奇通过全栈自研降低70%成本,面向类C端小B客户市场,已完成数亿元融资,致力于将人形机器人落地商业、安保、娱乐等多种场景。

九、 波士顿动力机器人新进展,3D感知+实时追踪,人类捣乱也不怕

1. 波士顿动力Atlas机器人重磅升级,具备3D空间感知和实时物体追踪能力,可360°旋转头部和腰部,在汽车工厂中执行复杂工业任务;

2. 技术核心包括2D物体检测系统(识别边界框和关键点)、基于关键点的3D空间定位以及SuperTracker物体位姿跟踪系统,能应对物体遮挡和位置变化情况;

3. 系统融合运动学数据、视觉数据和力反馈,通过"渲染-比较"方法估计位姿,实现精确手眼协调,团队正致力于构建统一基础模型,推动感知与动作融合。

报告观点

十、 Google CEO Pichai:AI 比互联网还大,未来将是多终端并行

1. Google CEO Pichai认为AI是比互联网更大的平台级变革,已进入"研究变为现实"的全面展开期,未来将走向多终端并行;

2. AI进入构建可用产品的第二阶段,搜索正转变为能代表用户执行任务的Agent,并将创造Web 2.0级别的杀手级应用;

3. AI带来的关键变革在于交互方式转变和创作门槛降低,第三阶段将是AI与物理世界结合形成通用机器人系统,XR眼镜等AI原生硬件将成为下一个平台突破口。

来源:腾讯研究院

相关推荐