2025年DeepSeeK开启AI算法变革元年

360影视 日韩动漫 2025-03-29 17:10 2

摘要:人工智能历经近七十年发展,已至战略拐点,从技术驱动迈向需求驱动。DeepSeek的出现标志着算力效率拐点显现,其通过优化算法架构,显著提升算力利用效率,打破传统认知,验证了“性价比”训练路径。2025年发布的大模型呈现低参数量特征,为本地化部署提供可能。AI技

公众号『行业报告之家』

报告共16页

导读:人工智能历经近七十年发展,已至战略拐点,从技术驱动迈向需求驱动。DeepSeek的出现标志着算力效率拐点显现,其通过优化算法架构,显著提升算力利用效率,打破传统认知,验证了“性价比”训练路径。2025年发布的大模型呈现低参数量特征,为本地化部署提供可能。AI技术创新围绕算力、数据、算法三要素动态循环,2025年重回算法创新阶段。DeepSeek的R1-zero模型完全基于强化学习训练,未使用监督训练或人类反馈,通过自我学习提升性能。其训练流程创新,采用GRPO算法优化奖励模型,提升训练效率。此外,非Transformer架构的算法模型成为新发展方向,如LFM(Liquid Foundation Model)在性能上超越同等规模的Transformer模型,小巧便携,可直接部署在手机等终端设备上。AI终端的爆发推动端侧模型和算力需求增加,小参数量模型需求爆发,进一步推动算法变革。DeepSeek的高性价比模式有望解锁具身智能的理解与推理能力,其多模态模型Janus-Pro在推理和多模态感知方面表现出色,有望加速具身智能的普及。同时,推理成本的大幅降低将推动C端产品在多数应用场景落地,如网站创建、直播带货、智能客服等。



来源:行业报告之家

相关推荐