腾讯研究院AI速递 20250521

360影视 欧美动漫 2025-05-21 00:01 3

摘要:Coding Agent将GitHub Copilot升级为自主编程助手,实现bug修复、代码维护的全流程自动化;

生成式AI

一、 微软一夜50弹,纳德拉要建智能体伊甸园!Agent成高频词

1. Coding Agent将GitHub Copilot升级为自主编程助手,实现bug修复、代码维护的全流程自动化;

2. NLWeb开源项目实现网站自然语言交互,Agent Factory平台支持Grok等模型构建智能体应用;

3. Copilot Tuning支持企业用自有数据微调智能体,精准适配企业独特语言风格。Microsoft Discovery助力科研创新,具备生成想法、结果模拟和自主学习能力。

二、 谷歌超级编码智能体Jules上线了,免费使用直连GitHub

1. 谷歌发布AI编程助手Jules,基于Gemini 2.5 Pro模型,提供每日5次免费使用额度,可直接连接GitHub仓库;

2. Jules能自主完成代码编写、Bug修复、测试运行等任务,会先生成详细计划供开发者审查,并可在云虚拟机中验证代码;

3. 产品即将推出Codecast功能可生成代码库音频摘要,Gartner预测到2028年75%新应用开发将使用AI辅助编程。

三、 混元游戏来了,首个工业级AIGC游戏内容生产引擎正式发布

1. 腾讯发布首个工业级AIGC游戏内容生产引擎"混元游戏",基于百万级游戏动漫数据集训练,面向游戏行业设计师开放申请;

2. 平台提供AI美术管线、实时画布、2D美术生成、角色多视图生成四大核心功能,可将角色多视图生成时间从12小时缩短至30分钟内;

3. 混元游戏包含四大图像模型和五大视频模型,首创游戏特效生成模型,支持多种游戏风格和特效类型,可实现实时交互生成。

四、 实测ListenHub,收藏夹积灰党狂喜,AI一键喂饭到嘴边

1. 火星电波公司推出AI一键生成播客工具ListenHub,支持链接、文档转播客,可将积压内容快速转化为2-3分钟的对话式音频;

2. 相比谷歌NotebookLM,ListenHub生成速度更快、中文语音更自然,适合快速知识获取,但内容深度略逊,不支持长文和微信文章转换;

3. 产品已开启公测,支持网页、App和浏览器插件,主打轻量级操作和碎片时间学习,但存在内容长度不可调、创作类型受限等问题。

五、 智源BGE向量模型三连击,代码、多模态检索全面登顶SOTA

1. 智源研究院发布三款向量模型:BGE-Code-v1(代码向量)、BGE-VL-v1.5(多模态向量)和BGE-VL-Screenshot(视觉化文档向量),全部开源并在多个基准测试中登顶;

2. BGE-Code-v1基于Qwen2.5-Coder构建,支持14种编程语言,在CoIR和CodeRAG-Bench基准超越商业和开源模型;在代码库检索方面表现突出;

3. BGE-VL-v1.5和BGE-VL-Screenshot分别针对通用多模态检索和视觉化文档检索场景优化,其中Screenshot模型在新发布的MVRB基准上达到60.61分的SOTA成绩。

六、 Google NotebookLM 终于出 APP 了!走到哪儿学到哪儿

1. 谷歌NotebookLM推出iOS和安卓APP,主打文档转播客功能,支持离线听书、实时互动提问和跨平台内容分享,让用户随时随地学习;

2. APP三大核心功能:离线音频播放实现碎片时间学习、实时互动提问支持深度理解、全平台分享按钮便捷导入各类文档资料;

3. 产品目前支持网页、PDF和视频链接转播客,适合学生、职场人和终身学习者使用,但仅限海外用户下载。

前沿科技

七、 AI发现新物质,仅用200小时!零代码,筛选36.7万种物质

1. 微软推出的企业级AI科研平台Microsoft Discovery,无需编程即可使用超算能力,在200小时内发现新型环保冷却剂,比传统方法快数月;

2. 平台结合基础模型和专业模型,构建AI博士后团队,通过图谱知识引擎理解复杂科学数据,支持协同推理和持续迭代研发;

3. Microsoft Discovery基于Azure基础设施,已开放私密预览,面向医药、芯片设计等领域,并预留量子计算接口,降低科研门槛。

八、 UC伯克利5千美元造全开源人形机器人,网友可抄作业

1. UC伯克利推出全开源人形机器人Berkeley Humanoid Lite(BHL),总成本低于5000美元,所有材料可通过3D打印或在线购买获得;

2. BHL采用摆线齿轮设计和模块化结构,配备英特尔N95迷你PC和手机级IMU,可实现双足行走、遥操作等功能,机械效率达90%;

3. 项目由四位华人博士生主导,已被RSS 2025会议接收,开源了所有代码和文档,支持灵活定制,可用于工程教育和动画领域。

报告观点

九、 AI接管程序员!Anthropic创始人Amodei曝行业末日时间表

1. Anthropic CEO Amodei预测AI将在3-6个月内能写90%代码,一年内可能编写所有代码;谷歌已有25%代码由AI生成,97%技术人员使用AI编码工具;

2. 专家认为AI不会完全取代程序员,而是改变工作形态:从代码编写者转向AI引导者和创新者,需要重新定义价值并学习与AI协作;

3. OpenAI产品负责人认为AI能降低编程门槛并提升上限,未来程序员角色将演变为AI系统架构师、AI训练师等新职位,人类将专注更具创造性的工作。

十、 对话腾讯 ima :有价值的产品,不需要告诉用户「这是智能体」

1. 腾讯ima团队从PC端信息处理痛点出发,将产品定位为基于AI的"搜、读、写"工作台,帮助用户高效管理和利用知识库内容;

2. ima通过知识库、知识号、知识库广场三个层次逐步演进,从个人知识管理拓展到知识共享与生态共建,目前已积累近1000万篇内容;

3. 产品团队强调"古典"产品思维的重要性,注重用户反馈和体验优化,将AI能力自然融入功能设计中,而非过分强调AI属性。

来源:腾讯研究院

相关推荐