摘要:中国 AI 公司 DeepSeek 正全力投身于一款更为先进的 AI 智能体模型研发,意图在这一新兴技术领域与 OpenAI 等行业巨头展开激烈角逐。据悉,该模型功能强大,用户仅需下达简单指令,它便能自主完成一系列复杂的多步骤任务。同时,该系统还具备从过往操作
9 月 5 日消息,据媒体最新报道,中国 AI 公司 DeepSeek 正全力投身于一款更为先进的 AI 智能体模型研发,意图在这一新兴技术领域与 OpenAI 等行业巨头展开激烈角逐。据悉,该模型功能强大,用户仅需下达简单指令,它便能自主完成一系列复杂的多步骤任务。同时,该系统还具备从过往操作中汲取经验、实现自我学习与改进的能力。
匿名人士透露,DeepSeek 创始人梁文锋正积极督促研发团队,计划在今年第四季度正式推出这款备受瞩目的新款软件。
自 2023 年 7 月成立以来,DeepSeek 在 AI 领域发展迅猛。由量化专家梁文锋带领的核心团队,汇聚了来自浙江大学、清华大学等顶尖高校的科研精英,以及拥有 Google Brain、微软亚洲研究院等国际机构工作经历的技术专家。
尽管团队规模不足 200 人,却展现出了强大的工程化落地能力。在成立后的短短时间内,DeepSeek 推出了一系列具有影响力的模型。2024 年 1 月 5 日,发布首个包含 670 亿参数的大模型 DeepSeek LLM,其基于 2 万亿 token 的数据集从零开始训练,涵盖中英文。同年 5 月,开源第二代 MoE 大模型 DeepSeek-V2,因性能比肩 GPT-4Turbo,价格却仅为 GPT-4 的百分之一,被业界赋予 “AI 界拼多多” 的称号。
进入 2025 年,DeepSeek 的发展势头更为强劲。1 月 20 日,正式发布的 DeepSeek-R1 模型在数学、代码、自然语言推理等任务上,性能与 OpenAI o1 正式版相当,迅速在国外大模型排名 Arena 上崭露头角,基准测试升至全类别大模型第三,在风格控制类模型分类中与 OpenAI o1 并列第一。
8 月 21 日,DeepSeek-V3.1 正式发布并开源,该模型将上下文窗口扩展至 128K,参数量约为 685B,用户可通过官方网页、APP 及小程序进行测试,API 接口调用方式保持不变。值得一提的是,DeepSeek-V3.1 在智能体能力方面实现了重大突破。
通过 Post-Training 优化,新模型在工具使用与智能体任务执行上的表现显著提升,不仅能够同时支持 “思考” 与 “非思考” 双模式,让用户可依据任务复杂度灵活切换,实现高效推理,而且在响应速度上相比 DeepSeek-R1-0528 模型,在保持高准确性的同时大幅提高,官方测试显示,DeepSeek-V3-Think 在输出 token 数减少 20% - 50% 的情况下,表现依旧出色甚至更快。
AI 智能体作为人工智能领域的新兴热点,正逐渐成为行业竞争的关键赛道。AI 智能体通常指具备主动思考和行动能力的智能实体,能够像人类一样理解用户需求,自主规划并达成目标,同时使用各类工具完成任务。其核心驱动力在于大模型,并在此基础上新增规划、记忆和工具使用三个关键组件。自 2023 年 3 月起,西部世界小镇、BabyAGI 等多款重大 Agent 研究项目相继上线,引发了广泛关注。2025 年 1 月 24 日,OpenAI 发布首款 AI Agent——Operator,该系统能够自动执行编写代码、预订旅行、自动电商购物等各种复杂操作。
据国际市场研究机构 Research and Market 发布的报告预测,AI 智能体的市场规模预计将从 2024 年的 51 亿美元大幅增长至 2030 年的 471 亿美元,年均复合增长率高达 44.8%。在刚刚结束的 2025 世界人工智能大会上,腾讯、京东、MiniMax、商汤科技等众多科技企业纷纷推出最新的智能体产品,为这一领域注入了新的活力。
此次 DeepSeek 涉足 AI 智能体模型研发,有望进一步丰富其产品矩阵,提升在全球 AI 市场的竞争力。若 DeepSeek 的新型 AI 智能体模型能够如期在第四季度发布,凭借其过往在模型研发上展现出的技术实力与创新能力,或许将为用户带来全新的智能化体验,同时也可能对现有的 AI 智能体市场格局产生冲击。
然而,研发过程并非一帆风顺,如何确保模型在复杂任务执行中的稳定性、准确性,以及如何更好地实现与现有应用场景的融合,都是 DeepSeek 团队需要攻克的难题。随着 AI 智能体技术的不断发展,未来 DeepSeek 与 OpenAI 等竞争对手之间的较量,无疑将成为全球 AI 领域的焦点,值得持续关注。 截至目前,DeepSeek 官方尚未对该研发计划发布正式声明。
来源:咫尺观察