摘要:在今天召开的火山引擎Force原动力大会上,豆包大模型升级为1.6版,推理、数学、指令遵循、Agent等能力有较大提升;豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型也正式发布。
*本音频由豆包·语音播客模型生成,该功能已在豆包电脑版开启小流量测试,并上线扣子空间
在今天召开的火山引擎Force原动力大会上,豆包大模型升级为1.6版,推理、数学、指令遵循、Agent等能力有较大提升;豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型也正式发布。
01. 豆包大模型1.6
豆包1.6-thinking模型在多个权威测评集上达到全球第一梯队水平:GPQA Diamond测试成绩达到81.5分,是目前最好的推理模型之一;数学测评AIME25成绩达到86.3分,相比豆包1.5深度思考模型大幅提升12.3分。
豆包大模型1.6系列均支持深度思考、多模态理解、256k长上下文、图形界面操作等能力,能够更好地支持复杂Agent的构建,促进AI生产力的提升。
目前,豆包大模型1.6系列已在火山引擎上线,企业和开发者可调用API体验。
02.
豆包·视频生成模型Seedance 1.0 pro
Seedance 1.0 pro支持文字与图片输入,可生成多镜头无缝切换的1080p高品质视频,主体运动稳定性与画面自然度较高。在国际知名评测榜单Artificial Analysis上,Seedance 1.0 pro在文生视频、图生视频两个任务的表现均排名首位。
通过调研影视创作者等群体的实际需求,Seedance 1.0 pro不仅将指令遵循、运动稳定性、画面质量等行业共识性指标纳入攻坚方向,同时,也将多任务生成、1080p高清生成、快速视频生成等难题作为核心目标。新版模型在动态图像生成的各维度上,有较好的综合表现,尤其动作生成、指令遵循等关键能力处于业界前列,推理速度、用户好评度等方面也比较突出。
提示词:赛车比赛,紧张激烈地运动,速度激烈,多镜头切换
提示词:广角镜头,金黄色草原随风起伏,一匹白马静立。中景,女孩缓缓走近,风吹起裙摆。她抬手触碰白马,光线柔和逆光
目前,Seedance 1.0 pro已通过火山引擎、豆包App、即梦AI等平台对外开放。
Artificial Analysis 文生视频榜单,数据截至 2025-06-09 11:00 (GMT+8)
Artificial Analysis 图生视频榜单,数据截至 2025-06-09 11:00 (GMT+8)
(注:为实现评估上的统一,Artificial Analysis 将 Veo 3 Preview 生成视频去掉声音后参与上述榜单评测。)
关于Seedance 1.0 pro的更多技术细节,详见项目主页(可查看完整技术报告):https://seed.bytedance.com/seedance
03. 豆包·语音播客模型
语音正在成为生成式AI应用和Agent的重要交互方式。自从豆包实时语音模型上线后,实时语音、视频通话迅速成为深受豆包用户喜爱的功能。
全新发布的豆包·语音播客模型源于端到端实时语音的进一步拓展,能够实现从文本创作到双人对话式播客作品的秒级生成,同时具备互相附和、插话、犹豫等自然的播客元素生成,达到了媲美真人的生成效果。
用户可以在扣子空间(https://space.coze.cn/)体验语音播客相关功能。同时,豆包产品已启动小流量测试,近期将全量上线播客模型,敬请关注。
来源:字节跳动技术团队