人工智能行业观察:DeepSeek突破推理效率瓶颈;阶跃星辰开源多模态模型

360影视 2025-02-23 23:35 2

摘要:当前,人工智能技术正加速向多模态与推理效率方向突破。DeepSeek凭借创新的架构设计大幅降低推理成本,推动AI部署普惠化;阶跃星辰则通过开源多模态模型,探索智能终端与工业场景的深度融合。两大技术路径的演进,为行业应用提供了更多可能性。

当前,人工智能技术正加速向多模态与推理效率方向突破。DeepSeek凭借创新的架构设计大幅降低推理成本,推动AI部署普惠化;阶跃星辰则通过开源多模态模型,探索智能终端与工业场景的深度融合。两大技术路径的演进,为行业应用提供了更多可能性。

一、DeepSeek:优化推理效率,推动AI普惠化

架构创新打破算力依赖

DeepSeek基于MLA+MoE混合架构,MLA技术有效降低推理成本,而MoE架构通过预训练提升算力利用率,减少集群训练等待期。这一技术路径打破了行业对算力的过度依赖,推动模型研发重心从训练端转向推理端。据测试,DeepSeekV3和R1模型的推理性能已可对标OpenAI-o1,同时在输入令牌数量与定价上具备显著成本优势。

开源模式赋能B端部署

DeepSeek坚持开源路线,其V3系列支持私有化部署与自主微调,解决了闭源模型在数据隐私和场景定制上的限制。随着性能逼近或超越海外闭源模型,DeepSeek在高校、实验室等场景的渗透率持续提升,进一步挤压闭源方案的市场空间。开源与闭源的差异化定位,也为细分场景的共存提供了基础。

加速机器人多模态交互落地

人形机器人产业趋势明确,TeslaOptimus预计2024-2035年将率先在工业、物流等领域落地。DeepSeek的高效推理能力有望助力复杂环境指令理解、工业任务分解及多模态交互。例如,其模型在智能制造场景中已支持部分企业实现降本增效,如领储宇能等公司通过部署R1模型优化AI平台效能。

二、阶跃星辰:开源多模态模型,布局智能终端生态

多模态开源生态初步成型

阶跃星辰近期开源了文生视频模型Step-Video-T2V与语音模型Step-Audio,覆盖视频生成、语音交互等能力。其中,Step-Video-T2V参数量达300亿,可生成204帧540P分辨率视频;Step-Audio则支持情绪、方言等多样化语音输出。公司计划在3月进一步开源图生视频模型,并探索视觉推理技术的慢思考能力,为AGI实现提供技术储备。

智能终端Agent成核心落地方向

阶跃星辰将智能终端Agent视为技术落地的突破口,重点布局汽车、手机、具身智能与IoT领域。例如,与吉利合作推动“AI+车”深度融合,通过多模态模型优化智能座舱交互体验;与OPPO联合开发AI手机功能,实现图像识别、跨应用任务执行等场景应用。在具身智能领域,其与智元机器人合作探索工业机器人任务规划能力。

强化推理能力延伸应用边界

阶跃星辰提出Agent发展的五级能力框架,从执行简单任务到具备情感陪伴逐步进阶。其研发的视觉推理模型Open-Reasoner-Zero采用强化学习算法,训练效率较同类模型提升25倍。该技术可支持导航、工业检测等场景的复杂决策,例如在动态环境中实时规划路径或识别设备故障。

来源:金融界

相关推荐