DeepSeek-R1-0528上线火山方舟，新客5折！

摘要：依托大模型服务领域的深厚技术积累，火山方舟围绕性能保障、功能覆盖、使用便捷性三大核心维度，构建起更全面的模型服务体系，为企业用户与开发者带来性能更卓越、响应更灵活、运行更可靠的大模型调用体验。

火山方舟正式接入 DeepSeek-R1-0528版本！

依托大模型服务领域的深厚技术积累，火山方舟围绕性能保障、功能覆盖、使用便捷性三大核心维度，构建起更全面的模型服务体系，为企业用户与开发者带来性能更卓越、响应更灵活、运行更可靠的大模型调用体验。

性能有保障，提供大模型调用服务“天花板”

针对大模型应用的速度和稳定性两大核心需求，火山方舟平台构建了高性能服务体系，以技术实力树立大模型应用的优质体验标杆。

极致的推理速度：依托自研 xLLM 高性能推理框架，模型延迟低至30ms Per Token，且凭借行业领先的稳定性，即便面对负载波动也能保持高效低延迟输出，保障实时交互体验；

超大规模并发支持：火山方舟为 DeepSeek-R1-0528提供全网最高在线推理承载力，默认支持500万 TPM（Token Per Minute）、3万 RPM（Request Per Minute），充分满足企业级高并发调用需求，无需担心流量峰值下的服务中断。

场景覆盖全，支持“在线+离线”多元化需求

在强劲性能之外，火山方舟平台为 DeepSeek-R1-0528模型同步提供 Function Call 、联网等实用功能支持，并针对企业与开发者在实际应用中的多元场景需求，构建“从效率提升到成本优化，再到稳定性保障”的全方位支持体系，为不同类型企业与开发者提供“按需适配、灵活高效”的大模型应用最优解。

离线批量推理：对于需大规模处理数据的场景如数据标注、内容审核等，支持 Batch 离线批量推理，通过一次性处理多任务显著提升效率；

前缀缓存：针对含重复提示或标准化开头文本的应用场景，通过智能缓存历史对话或固定前缀内容，调用时无需重复发送相同信息，可显著提升响应速度、降低使用成本；

TPM 保障包：考虑企业级业务的流量波动风险，TPM 保障包提供灵活定制化的流量额度方案，用户可根据业务峰值需求动态调整，确保关键场景下服务稳定不中断，并提供更低的延迟。

应用落地易，多入口支持“即开即用”

为助力企业用户与开发者快速上手、轻松落地大模型应用，火山方舟为 DeepSeek-R1-0528模型提供多元体验入口，真正实现“想用就用、即用即得”的便捷服务。

体验中心：尝鲜用户的“零门槛试金石”

无需注册登录，可直接在火山引擎体验中心免费体验新版 DeepSeek-R1-0528模型核心功能，效果一键验证。若体验后希望进一步深度使用，支持一键跳转控制台， 2分钟即可完成注册配置。从“尝鲜体验”到“正式调用”无缝衔接，操作流畅无断点。

官方控制台：专业开发者的“高效配置舱”

登录火山方舟官方控制台，可快速完成模型调用配置，支持 API 直连与可视化参数调试，从功能选择到参数调整全程可视化操作，大幅缩短开发链路。

应用实验室：企业用户的“现成工具箱”

火山方舟应用实验室已开源多款高价值大模型应用模板，覆盖从基础功能到复杂场景需求。以联网搜索场景为例，应用实验室已针对 DeepSeek-R1-0528模型适配了开源应用模板。

未来，应用实验室还将持续扩展模板类型，覆盖更多高频场景，并根据模型迭代动态优化模板适配性，为企业提供“即用即新”的大模型应用支持。

为助力新用户快速开启大模型应用探索，火山方舟特别推出新客户5折优惠活动：未注册过火山引擎账号的企业或个人，注册火山引擎账号并完成实名认证。在火山方舟平台开通 DeepSeek-R1-0528模型，自开通时刻起 14天内，在保持 DeepSeek R1原价不变的基础上，可享有该模型最高10亿 tokens 用量的5折优惠。

来源：夙沙玩游戏

标签：推理火山 tpm 火山方舟过火山

本文地址：https://news.43u.com.cn/a/1954876.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!