腾讯研究院AI速递 20250513

360影视 日韩动漫 2025-05-13 00:01 1

摘要:CTM在迷宫求解和图像识别等任务中展现出类人思维过程,思考时间越长准确率越高,且可根据任务难度调整思考时长。

生成式AI

一、 Transformer八子之一初创Sakana AI提出「连续思维机器」

1. CTM将神经元活动同步作为核心机制,通过时序信息实现更复杂的神经行为,推理过程更像人类思维;

2. 神经元可访问自身历史并学习利用这些信息计算下一输出,所有行为均为自然涌现,未被预先设计;

3. CTM在迷宫求解和图像识别等任务中展现出类人思维过程,思考时间越长准确率越高,且可根据任务难度调整思考时长。

二、 苹果发布 FastVLM, iPhone 直接运行的极速视觉语言模型

1.苹果发布移动端视觉语言模型FastVLM,采用双阶段处理(图像转token、token生成语言),可直接部署在iPhone等设备上运行;

2.FastVLM在效率方面表现突出,0.5B版本较LLaVA首token输出快85倍,体积减少3.4倍;7B版本配合Qwen2较Cambrian模型快7.9倍;

3.FastVLM具有高效处理高分辨率图像的能力,结合轻量级设计,显示出在智能眼镜等移动设备上的应用潜力。

三、 腾讯混元T1-Vision上线元宝:融合多模态原生长思维链

1.腾讯元宝升级视觉模型Hunyuan T1-Vision,能深度理解图片内容,支持多模态原生长思维链,完答速度提升1.5倍;

2.应用场景广泛,可识别植物品种、分析棋局、翻译游戏界面、进行选择分析、评估商品价值等实际场景;

3.新版本强调"边看图边思考"的能力,通过开启"深度思考T1"模式,可以更精确地捕捉和分析图片中的关键信息。

四、 Perplexity 的Comet AI 浏览器开始内测,将在 5 月中旬发布

1.知名AI搜索工具Perplexity推出基于Chromium框架的AI浏览器Comet,预计5月中旬发布,目前开放内测申请;

2.Comet具备AI Agent能力,能自动执行复杂任务,集成Perplexity的分析工具,简化用户工作流程;

3.继Arc推出Dia后,AI浏览器正成为新趋势,并显示出AI与操作系统、跨平台助手深度融合的发展方向。

五、 快手推出AI作图工具Poify,专注于电商领域,目前免费

1.快手推出专注电商领域的AI作图工具Poify,集成多种功能如文生图、AI模特试衣、背景替换等,目前免费使用;

2.Poify针对电商场景优化,可降低商品拍摄成本,提高制图效率,增强视觉吸引力,并适配各大电商平台规则;

3.相比同类工具,Poify专注电商图像创作,提供简单易用的界面和针对性功能,适合商家快速制作商品展示和营销素材。

六、 字节开源8B代码模型Seed-Coder,自己筛数据训练自己

1.字节团队开源8B参数代码模型Seed-Coder,采用"LLM教LLM"方式筛选训练数据,构建了支持89种编程语言的6万亿token高质量代码库;

2.模型采用Llama 3架构,通过仓库级代码拼接支持32K长度,使用填空训练法和长思维链强化学习提升代码生成能力;

3.Seed-Coder在HumanEval+等测试中超越70B级模型,在Codeforces达到接近人类铜奖水平,但在通用能力和数学能力方面仍有提升空间。

七、 逆向工程八出各大 AI 的隐藏人设,可能比你想象得还离谱

1.通过逆向工程获取的主流AI系统提示词揭示不同产品定位:GPT-4o注重专业理性,Grok-3强调全能助手,Gemini重视活力友好,DeepSeek追求简洁务实;

2.系统提示词作为AI的"行为说明书",决定了模型的边界、禁区和行为逻辑,其泄露可能导致用户更容易绕过限制或理解模型工作方式;

3.系统提示词对AI产品体验影响重大,未来可能发展出让用户自定义提示词的功能,但需要在自由度和安全性之间找到平衡。

前沿科技

八、 18岁高中生独著发顶刊,利用AI竟发现上百万个隐藏天体

1.18岁高中生Matteo Paz利用AI处理NASA的2000亿条NEOWISE数据,发现150万个未知天体,独著发表天文学顶刊论文,获得Regeneron科学竞赛25万美元奖金;

2.他创新开发VARnet模型,能快速识别天体时间序列数据中的变异性,处理速度达53微秒/天体,在变星识别任务中取得0.91的F1分数;

3.研究成果形成首个完整红外变异性巡天项目VarWISE,有望助力探索宇宙起源之谜,Paz已获斯坦福大学录取。

报告观点

九、 Agent 产品如何定价?一文说清 AI 产品的四种付费模式

1.AI产品正从按量计费向更高级的付费模式演进:按工作流收费、按结果收费、按智能体收费,最终目标是将定价与客户价值对齐;

2.AI应用最适合切入那些依赖BPO(业务流程外包)和低薪工作的领域,而非高薪工作,因为后者竞争激烈且用户更倾向于将AI作为辅助工具;

3.Paid公司为解决AI产品定价难题应运而生,提供完整的账单、发票、变现、定价等后台运营系统,帮助AI公司避免陷入低水平的按量计费竞争。

十、 a16z:Git 将被取代,AI 时代的 9 种全新软件开发模式

1.a16z预测未来软件开发将围绕AI Agent重塑,核心变化包括意图驱动的版本控制取代Git、AI驱动的动态仪表盘、交互式文档系统等9大趋势;

2.开发方式从"自底向上"转向"自顶向上",开发者通过描述意图让AI Agent寻找合适构建块,并趋向异步协作模式,AI Agent在后台独立执行任务;

3.MCP(模型上下文协议)有望成为AI Agent能力的通用标准,让各类工具和服务能被AI Agent直接调用,同时AI Agent仍需依赖认证、计费等基础设施服务。

来源:腾讯研究院

相关推荐