摘要:今天,在 FORCE 原动力大会上,火山引擎正式发布豆包大模型1.6、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型,豆包·实时语音模型在火山引擎全量上线,豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型。截至2025年5月
今天,在 FORCE 原动力大会上,火山引擎正式发布豆包大模型1.6、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型,豆包·实时语音模型在火山引擎全量上线,豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型。截至2025年5月底,豆包大模型日均 tokens 使用量超过16.4万亿,较去年5月刚发布时增长137倍。
字节跳动 CEO 梁汝波表示,做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。
字节跳动 CEO 梁汝波
在价格方面,豆包大模型1.6采用统一定价模式,首创按“输入长度”区间定价,在企业使用最多的输入区间0-32K 范围内,豆包大模型1.6的价格为输入0.8元/百万 tokens、输出8元/百万 tokens,综合成本比豆包1.5·深度思考模型、DeepSeek R1降低63%。Seedance 1.0 pro 模型每千 tokens 0.015元,相当于每生成一条5秒的1080P 视频只需3.67元,行业最低。
目前,能自主思考、规划、完成任务的 Agent 正在逐步进入企业生产场景,这不仅需要模型做到强推理、多模态、低成本,也需要升级 AI 云原生全栈服务。大会上,字节跳动技术副总裁洪定坤、火山引擎总裁谭待发布了12款面向 Agent 开发和应用的工具产品。
针对 Agent 开发,升级 AI IDE“TRAE”,发布火山引擎 MCP 服务、Prompt 优化工具“PromptPilot”、开源的 veRL 强化学习框架、AI 知识管理产品;大数据服务上,发布多模态数据湖、AI 数字专家“Data Agent”;AI 基础设施上,针对 Agent 开发、模型训练和推理,发布 AgentKit、TrainingKit、Servingkit;安全是一切 Agent 运行的基础,为此火山引擎发布 AICC 私密计算、大模型应用防火墙。
谭待表示,AI 时代,开发范式、大数据、计算、安全都在发生重大变化,由此构成的“AI 云原生”全新技术栈,是企业构建好 Agent、创新发展的关键。
火山引擎总裁 谭待
豆包大模型1.6正式发布
更强模型、更高性价比
全新发布的豆包大模型1.6系列由三个模型组成,为企业提供多样化选择。
doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少 tokens 消耗。
doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的强化版本;在代码、数学、逻辑推理等基础能力上进一步提升;支持256K 上下文。
doubao-seed-1.6-flash:豆包大模型1.6系列的极速版本,支持深度思考、多模态理解、256K 上下文;延迟极低,TOPT 仅需10ms;视觉理解能力比肩友商旗舰模型。
豆包大模型1.6具有更强的模型效果,在众多权威测评集上,得分均属于国际第一梯队。在推理能力、多模态理解能力、GUI 操作能力上具备领先优势。
推理能力
豆包大模型1.6在推理速度、准确度与稳定性上显著提升,可支撑更复杂的业务场景落地。
例如,有媒体针对今年的高考全国新一卷数学单科做了测评,豆包的成绩是144分,全国第一。而在高考前,在针对海淀区模拟全卷的测评中,相比去年的模型,豆包大模型1.6理科成绩显著提升了154分,文科提升了90分。
豆包大模型1.6具有边想边搜、DeepResearch 深度研究能力,能独立思考、规划、使用搜索等各种研究工具。例如豆包 APP 和 PC 端正在小流量测试的 DeepResearch 功能,可以把过去需要多名专业人士花费数天写成的调研报告,缩短到5-30分钟内完成,还能自动提炼信息,总结成网页,方便查阅。
为方便企业使用“边想边搜”和 DeepResearch 功能,火山引擎打造了大模型应用实验室,并开源了手机助手、实时视频理解、DeepSearch 等应用,帮助企业快速搭建 AI 应用原型,灵活编排自己的专属智能体。用户可在火山引擎官网大模型应用实验室、GitHub 方舟开源站点下载使用。
多模态理解
多模态理解的核心是“让模型像人一样理解世界”。豆包大模型1.6全系列均原生支持多模态思考能力,让模型可以理解和处理真实世界的问题。该能力支持了豆包 APP 最新的实时视频通话功能,在企业端可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。
GUI操作能力
豆包大模型1.6凭借领先的视觉深度思考能力、精准的视觉定位能力,能够让智能体与浏览器及其他软件进行交互和操作,高效执行各类任务。
更高性价比
豆包大模型1.6采用统一定价模式,无论是否开启深度思考模式,无论是文本还是视觉,tokens 价格均一致,按照输入上下文长度区间定价。
从综合成本来看,绝大部分请求输入都在32K 以内,输入输出占比在3:1,豆包大模型1.6的综合成本(2.6元)比豆包大模型1.5·深度思考模型、DeepSeek R1的综合成本(7元)下降63%,相当于只需原来三分之一的价格,就能使用能力更强、原生多模态的新模型。
此次火山引擎还增设特惠区,对于输入32K、输出200 tokens 以内的请求,豆包大模型1.6的价格将进一步降低到输入0.8元/百万 tokens、输出2元/百万 tokens。相当于绝大部分非思考模型的需求,也可以安心使用更好效果的新模型。
豆包·视频生成模型
Seedance 1.0 pro正式发布
全新发布的豆包·视频生成模型 Seedance 1.0 pro 具备三大特性:无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感,在电商、影视、游戏等行业应用前景广阔。
根据第三方权威榜单 Artificial Analysis 最新结果,Seedance 1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一。
Seedance 1.0 pro 的价格是每千 tokens 1分5厘,相当于每生成一条5秒的1080P 视频只需3.67元。假如有1万元预算,通过 Seedance 1.0 Pro 可制作2,700多条5秒的1080P 视频,通过 Seedance 1.0 lite 可以制作9,700多条视频。
两款豆包语音大模型上新
语音正在成为 AI 应用和 Agent 的核心交互方式,小米汽车、OPPO、美图、儿歌多多等企业已使用豆包语音大模型提升产品创新体验。
今天,豆包·实时语音模型全量上线火山方舟,对企业客户开放使用。该模型支持自然语言高级指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,语气、用语、思考方式等拟人感大幅提升,能随时打断与主动搭话。
此外,火山引擎还发布了豆包·语音播客模型。只需输入一句话、网页链接、长文本或文档,语音播客模型即可快速搜索学习,生成播客脚本后创作出来;模型可秒级生成双人对话式播客作品,效果自然,具有互相附和、插话、犹豫等播客节奏;自带的深度搜索功能可生成跟进热点话题的播客内容。
AI云原生全栈服务发布
让Agent走进企业生产系统
AI 时代,开发范式将发生重大变化,调用中心正在从程序员转移到大模型,这就需要更好的模型和模型工具平台。在基础设施层,计算(以 GPU 为核心的计算和网络系统)、大数据(多模态)、安全(防御恶意AI)也正在发生巨变。为此,火山引擎发布 AI 云原生全栈服务,帮助企业加速 Agent 落地。
Agent开发:用好AI+做好AI
火山引擎智能算法负责人吴迪表示,要构建高生产力的 Agent,既要用好 AI,整合高质量的应用;又要做好 AI,关注底层技术本身的优化和创新。
为帮助企业高效构建 Agent,此次火山引擎发布和升级了五款产品:
AI IDE 产品 TRAE 升级:为开发者提供代码补全、局部代码生成功能,支持代码重构、批量修改、知识问答等复杂任务,下一个版本还将整合不同 Agent 和工具,协调任务流程,实现自动串联操作,逐步从 AI 辅助编程向支持 AI 开发全流程进阶。今年1月上线至今,TRAE 月活用户已经超过了100万。
发布火山引擎 MCP 服务:链接 Agent 开发体系、大模型工具生态、云服务。与 TRAE、 火山方舟、扣子打通,一键选择200+丰富 MCP 服务;开发者可以通过 MCP,控制火山引擎的云服务组件,便捷地完成计算、网络、存储等环境部署,更快地把一个创意,变成一个成熟的产品。
发布 PromptPilot:可以帮助开发者把模糊的诉求变为具象化的目标,在互动中引导用户明确需求、理想回答和评估标准;自动撰写和优化提示词;产生 badcase 能自动优化提示词,实现精准调控;具备多轮对话、视觉理解、复杂工具调用的优化能力,以及自主判断是否开启模型精调等。
发布 AI 知识管理产品:支持文本、图像、音频、视频等多模态内容对话式交互,融合本地与互联网知识,提供内容理解和问答服务;首创可交互的推理“做个计划”功能,实现人机协作制定、修改计划。目前已在火山引擎全量邀测。
发布开源的 veRL 强化学习框架:可轻松扩展多种强化学习算法,无缝集成现有 LLM 基础设施与模块化 API,助力开发者快速搭建 RL 模型开发管线,提升对话规划、智能编程、复杂策略优化等场景的开发效率与资源利用率。 除了提供开源框架,此次还上线了 veRL 平台,用充沛的算力支持强化学习需求。
数据:从支持BI到支持AI
AI 时代,数据基础设施的价值已从 “支持 BI” 迈向 “支持 AI”。火山引擎发布多模态数据湖解决方案、Data Agent,助力企业构建智能化、可感知、可行动的数据体系,实现数据的“主动思考”,让数据真正成为企业的智慧大脑”。
多模态数据湖:新一代 AI Native 的数据基建,帮助企业在多模态数据处理、检索和分析场景上,更快、更好地识别和利用多模态数据资产,成为驱动企业 AI 模型训练与决策的核心设施。
Data Agent:新一代企业级 AI 数字专家,具备数据主动分析、智能洞察、策略生成能力;可将日常取数速度从小时级到分钟级,数据获取成本降低80%;复杂分析效率从周级到小时级,洞察及时性提升90%;深度分析报告及营销方案的产出时间和人力成本都能大幅节省。
AI基础设施:
更强、更易用、更开放的AI Infra
火山引擎 AI infra 提供性能和功能更强大、使用更简易的 Agent 套件、推理套件、训练套件,帮助企业全链路加速 Agent 构建。
AgentKit:为企业级 Agent 打造的全栈开发和服务工具链,集成豆包大模型1.6与 Computer Use 等工具;基于火山引擎 veFaaS 预置模板,用户只需选择模型和配置参数即可快速部署,可实现分钟级10万核扩容;构建完整工具生态体系,支持多终端 Tool Use、覆盖数十类三方 MCP Server。
云原生训练套件 TrainingKit:实现高达60%+的 MFU(算力利用率);面向后训练环节,通过 veRL 框架、 Sandbox 百万核秒并发能力,有效提升后训练效率,为 AI 训练全流程筑牢技术底座。
云原生推理套件 ServingKit:从模型部署、在线推理、服务运维三个阶段进行加速和提效,支持开源推理框架,并针对主流模型进行算子优化,性能相比社区最新版本可以提升2-3倍;已在互联网、物流、汽车等各行业应用,提升模型训推效率,降低成本。
安全:一切Agent运行的基础
针对企业数据和用户隐私保护,如何防止恶意攻击等安全挑战,火山引擎发布两款 AI 安全产品,目前已在联想、中国银联、长安汽车等众多企业落地。
AICC 密态计算:通过用户个人密钥加密、CPU/GPU 硬件可信环境计算、数据流转落盘全密文的方式,在不损失推理效果的前提下,让企业像使用私部模型一样安全合规的使用云端模型。
大模型应用防火墙:通过精调的小参数模型、分层漏斗策略、流式送检机制,保障精准拦截攻击变种,同时不会增加推理延迟,为企业智能体应用构建安全可信的大模型推理空间。
来源:蓝鲨财经社