【西部计算机】从Copilot到Agent:AI编程的范式革新

360影视 动漫周边 2025-03-12 17:23 2

摘要:特别声明《证券期货投资者适当性管理办法》、《证券经营机构投资者适当性管理实施指引(试行)》于2017年7月1日起正式实施。通过新媒体形式制作的本公众号推送信息仅面向西部证券的专业投资者。若您并非西部证券的专业投资者。请取消关注本公众号,不再订阅、接收或使用本公

特别声明

特别声明《证券期货投资者适当性管理办法》、《证券经营机构投资者适当性管理实施指引(试行)》于2017年7月1日起正式实施。通过新媒体形式制作的本公众号推送信息仅面向西部证券的专业投资者。若您并非西部证券的专业投资者。请取消关注本公众号,不再订阅、接收或使用本公众号中的任何推送信息。因本公众号受限于访问权限的设置,若给您造成不便,烦请谅解!感谢您给予的理解与配合。

· AI Coding正在成为Agent商业化的突破口。

我们认为编程领域的规则明确性为Agent应用提供了天然约束框架,编程环境的技术特性为Agent自纠错提供了理想试验场,同时编程原子化任务与大模型链式推理机制深度契合。而在需求端,企业开发效率的刚需则创造了明确付费意愿,AI编程领域已逐步形成"技术验证-产品迭代-商业变现"的完整闭环。

· AI大模型在编程中的应用发展分为“Copilot→Agent→Multi-Agent”三个阶段,目前各大厂商AI coding产品多处于第一阶段向第二阶段迈进的关键节点。

第一阶段:LLM as Copilot。大模型作为 Copilot,辅助程序员完成任务,但并不改变软件工程的专业分工。

第二阶段:LLM as Agent。Agent能够自主完成一部分任务,成为一个单一职能专家,能够自主使用工具完成预定的任务。人在这个阶段的作用是给定上下文完成知识对齐。

第三阶段:LLM as Multi-Agent。多智能体互相协作完成复杂任务,人类则负责创意、纠偏和确认的工作。

· 我们梳理国内外部分AI编程产品如下:

· GitHub Copilot:AI编程先驱,即将推出SWE Agent。

· Cursor:打造深度集成AI的IDE,改变coding范式

· Devin:AI程序员未来已来

· 字节豆包MarsCode:推出国内首个AI IDE Trae

· 百度文心快码Comate:由Copilot模式升级为Agent模式

· 阿里通义灵码:正式发布 AI 程序员,开发效率提升数十倍

· 腾讯云AI代码助手:接入DeepSeek-R1,代码生成准确率提升30%+

· 智谱CodeGeeX:携手英特尔发布CodeGeeX智能编程助手AIPC版

· 商汤代码小浣熊:2B+2C双轮驱动,产品矩阵完善

· 艾普阳SnapDevelop:纯国产化低代码IDE,AI赋能

· 普元信息:低代码Copilot上线,接入DeepSeek

建议关注

商汤-W(已覆盖)、卓易信息、普元信息、金现代、科大国创等

AI技术突破不及预期、AI商业化落地不及预期、宏观经济增长不及预期、国际环境变化。

AI Agent有望在编程场景率先形成商业闭环

AI Coding正在成为Agent商业化的突破口。编程场景的强规则性天然适配Agent落地,而企业开发效率的刚需则创造了明确付费意愿。AI编程领域已逐步形成"技术验证-产品迭代-商业变现"的完整闭环。

· 编程领域的规则明确性为Agent应用提供了天然约束框架。编程语言的有限语法构成天然屏障,语法规则、API规范、测试标准等明确边界,使Agent的行为路径更容易被定义和评估。

· 编程环境的技术特性为Agent自纠错提供了理想试验场,与强规则性共同抑制大模型的幻觉问题。错误日志、单元测试等明确反馈信号,使Agent可构建动态迭代机制:当代码编译失败时,系统自动解析错误信息并触发重写流程。所以在RL范式中,编程场景具备天然的奖励模型(测试通过率、代码性能),支持Agent通过试错学习优化策略。

· 编程原子化任务匹配大模型链式推理机制。编程本质上要求工程师将问题分解成更小、更易管理的任务,与大模型的链式推理机制深度契合。

阿里将大模型在编程中的应用分为“Copilot→Agent→Multi-Agent”三个阶段,目前各大厂商AI coding产品多处于第一阶段向第二阶段迈进的关键节点。

第一阶段:LLM as Copilot。在这一阶段,大模型作为 Copilot,辅助程序员完成任务,但并不改变软件工程的专业分工。它提供了一个强大的工具来增强领域内的专业技术,帮助人类程序员提升工作效率。人在这个过程中起主导作用,负责提供提示词和进行确认。

第二阶段:LLM as Agent。在这个阶段,大模型作为Agent能够自主完成一部分任务,成为一个单一职能专家,能够自主使用工具完成预定的任务。人在这里的作用是给定上下文完成知识对齐,从而让模型更好地理解和执行任务。

第三阶段:LLM as Multi-Agent。在第三阶段,大模型作为 Multi-Agent 系统来协同处理复杂任务。多智能体互相协作完成复杂任务,人类则负责创意、纠偏和确认的工作。

GitHub Copilot:AI编程先驱,即将推出SWE Agent

GitHub Copilot是微软旗下开发者平台GitHub推出的AI编程工具,直接集成了Visual Studio Code和GitHub两大平台。通过插件的方式安装到编辑器后,GitHub Copilot可以提供强大的代码补全功能,支持超过数十种编程语言。通过深度学习模型训练,Copilot能够理解上下文并生成合理的代码片段,极大地提高开发效率。

2021年6月29日,微软与OpenAI共同推出了一款AI编程工具GitHub Copilot。2022年6月22日,Copilot已正式上线,定价$10/月或$100/年。2024年4月,微软宣布GitHub Copilot拥有180万付费订阅用户。2024年7月,GitHub Copilot的年化经常性收入(ARR)达到3亿美元,占GitHub整体收入增长的40%。

GitHub Copilot接入三大模型:Claude 3.5、Gemini 1.5、OpenAI o1。免费用户和AI的聊天次数每个月为50次,实时代码补全则是每个月2000次。而付费用户能体验无限次的AI交流和代码补全。目前付费用户分为三类,Pro/Business/Enterprise每月分别需要付费$10/$19/$39。

GitHub Copilot推出Agent模式,自主执行能力显著提升。2025年2月,GitHub Copilot推出了Agent模式(预览版)。相比此前智能补全代码功能,Agent自主执行能力显著提升,可以实现:1)自主迭代代码,识别错误并自动修复;2)主动建议终端命令,并请求执行识别;3)运行时错误,主动修复。所以,在智能体模式下,Copilot不仅会对自己的输出进行迭代,还会对输出结果进行持续改进,直至完成所有子任务,满足开发者的请求;值得注意的是,它不再仅仅执行要求的任务,还能去推断额外的必要任务,确保请求完整运行。这次,同时上线的还有多文件编辑工具GitHub Copilot Edits,可以一次性处理工作空间中的多个文件,并给出代码的更改意见。所有这些处理都可以在编辑器中直接完成,非常便于快速审查代码,同时了解周围代码的完整上下文。在操作过程中,用户还可以对每一次编辑选择接受或者放弃,从而拥有更加灵活的控制。

展望未来,GitHub还展示了一个完全自主的SWE Agent——Project Padawan,它可以独立处理整个开发任务,将于今年发布。

Cursor:打造深度集成AI的IDE,改变coding范式

Cursor是VS Code的一个分支,是一个更专门化、深度集成AI的IDE。基于顶尖大模型,Cursor团队将打磨产品的重点放在了优化开发用户体验和模型交互方式,以及如何让模型给出更好的答案。不同于GitHub Copilot重点放在根据上下文提供代码建议和补全,Cursor被设计为能够基于整个代码库提供智能代码提示。Cursor更加注重AI与开发流程的无缝集成。其核心优势在于,不仅具备代码补全和对话式编程功能,还引入了“Composer”功能,允许用户通过自然语言对整个项目提出需求,进行跨文件编辑。

ARR或达1.5亿美元,Cursor估值或突破百亿美元。2022年,麻省理工学院的四名学生创办了一家名为Anysphere的公司;2023年,Anysphere从OpenAI加速器计划中毕业,并完成了由OpenAI Startup Fund领投的1100万美元种子轮融资。2024年8月,Anysphere宣布完成4亿美元A轮融资;24年11月,Anysphere宣布收购AI代码模型Babble背后的Supermaven;24年12月,Anysphere估值跃升至25亿美元。

2025年3月,彭博社报道,Anysphere正以近 100 亿美元的估值筹集资金。据纽约时报报道,Anysphere 在去年12月融资时,公司的估值为其 1 亿美元ARR的 25 倍。根据The Information报道,Anysphere 当前的ARR 可能已增长 1.5 亿美元。

Devin:AI程序员未来已来

Devin 是Cognition推出的AI程序员,是一款完全自主的AI智能体。2024 年 3 月,初创公司Cognition宣布推出第一个 AI 程序员 Devin,引发全网关注,Devin能够熟练运用多种编程语言、独立完成网站和应用程序的构建与部署,甚至可以自主发现并修复代码缺陷。Devin理论上可以独立编写代码,无需人工介入,并且能够完成通常由开发人员承担的完整项目。Cognition表示,Devin已通过多家 AI 公司的实践性工程师面试,并成功在 Upwork 等自由职业平台上完成实际项目。

2024 年 4月,Cognition估值达到20亿美元;2024年12月,Devin 全面开放,订阅费用为$500/月。Cognition首席执行官Scott Wu表示,公司目前的客户包括年收入3亿美元的支出管理公司Ramp,它用Devin编写测试代码并清理死代码;另一个客户是年收入17亿美元的数据平台MongoDB,其首席产品官萨Sahir Azam表示,MongoDB用Devin更新过时的代码架构,为客户节省了数百万美元。年收入80亿美元的金融科技公司Nubank的程序员也在使用Devin来完成更新代码库等任务。

字节豆包MarsCode:推出国内首个AI IDE Trae

2024年6月,字节跳动推出AI编程产品豆包MarsCode,包括两种形态——编程助手和Cloud IDE,并面向开发者免费开放。

· 豆包MarsCode编程助手兼容 Visual Studio Code、JetBrains IDEs 等主流编程工具,支持 Python、Go、JS、TS、C++、Java、Kotlin、C、Rust 等 100+ 种编程语言。豆包MarsCode 编程助手的能力包括生成代码、解释代码、注释代码、生成单测等,在开发中遇到任何问题,都可以随时唤起编程助手提问。

· 豆包MarsCode 还提供了AI Native的云端 IDE ,有开箱即用的线上开发环境,用户随时随地打开浏览器就能快速进行项目开发,无需运维本地环境。豆包MarsCode IDE 为每个用户提供 2C4G 的计算资源和单项目 10G 的免费空间,内置数十款开发模板,支持通过新建或 GitHub 拉取等方式快速创建项目。豆包MarsCode IDE 在 AI 交互上可以选择编辑器内或在侧边栏对话,快捷键唤起十分便捷。此外,豆包MarsCode IDE还提供了Webview 工具,开发者可以在不离开编辑器的情况下在预览工具内查阅文档,测试网页,或进行其他互联网相关的简单任务。

2025年3月,字节旗下中国首个AI原生集成开发环境(AI IDE)Trae 国内版正式上线,配置Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型。Trae定位为“智能协作AI IDE”,以“人机协同、互相增强”为核心理念,对代码补全、代码理解、Bug修复、基于自然语言生成代码等开发过程全场景都有非常好的适应性,不仅是一个开发工具,更是一位全天候开发“拍档”。无论是初学者还是资深的开发者,借助Trae都能够通过自然语言描述迅速的、端到端的生成应用:只需要用简单的语言描述需求,Trae 就可以迅速搭建起项目框架,还能持续进行调优修改,产出可用代码。

· 在代码理解维度,Trae凭借对开发项目上下文的极致理解,能深入剖析代码仓库,实时获取IDE中的各种环境上下文,精准洞察开发者的需求,从而为开发过程提供最为契合、准确的解决方法。

· 针对需求沟通效率问题,Trae 的实时代码续写技术可基于开发项目整体上下文进行智能补全,提升编码效率,而在交互体验方面,开发者可以便捷地将 AI 生成的代码一键应用到多个模块,还能根据实际需求随时灵活调整指令,并实时预览 AI 生成代码的前端效果。

百度文心快码Comate:由Copilot模式升级为Agent模式

百度推出Baidu Comate,目前已走入了喜马拉雅、三菱电梯、软通动力等上万家企业。2023年4月,百度内部智能工作平台上线了编码智能推荐工具Comate;2023年10月24日,Comate智能编程助手全面开放。2024年6月,在百度WAVE SUMMIT深度学习开发者大会上,百度正式宣布其旗下智能代码助手Baidu Comate的中文名为“文心快码”,同时,百度宣布公司80%的工程师已经在深度使用文心快码,其中代码采纳率已达到46%,新增代码生成占比29%。而文心快码的落地经验仅用了3个月就赋能喜马拉雅深度落地。

文心快码升级至3.0版本,由Copilot模式升级为Agent模式。文心快码升级至3.0版本,开发全流程升级为智能体模式,从辅助编码升级为可独立完成任务的智能代码助手。在设计、编码、调试、测试、安全等核心开发任务上,文心快码从提供信息辅助,由人进行实际操作的Copilot模式,升级为可独立自主完成单项任务并直接呈现最终动作,再由人进行确认的Agent智能体模式。

文心快码3.0包含代码问答、编码、单测、Debug、安全这五个智能体,覆盖开发的设计、编码、构建、测试&验证全流程,在读、写、改三个方面再度升级,这五大智能体在开发过程中担任不同角色,共同构成了一个智能编程系统,让编码效率更高、效果更好。

阿里通义灵码:正式发布 AI 程序员,开发效率提升数十倍

通义灵码是由阿里云和通义实验室联合推出的一款基于通义大模型的智能编码辅助工具,具备代码智能生成和研发智能问答等多项功能。通义灵码核心优势在于:1)代码智能生成:通义灵码能够根据当前代码文件及跨文件的上下文,生成行级/函数级代码、单元测试和代码注释,帮助开发者更高效地完成编码工作。2)自然语言生成代码:通过自然语言描述功能需求,通义灵码可以在编辑器中直接生成相应的代码和注释,保持编码的连续性。3)单元测试生成:支持根据多种测试框架生成单元测试代码,包括但不限于JUnit、Mockito、Spring Test等,提高代码的测试覆盖率。4)研发智能问答:基于大量研发文档和API/SDK数据,通义灵码能够解答编程相关问题,提供解决方案和建议。5)异常报错智能排查:当代码运行出现异常时,通义灵码可以结合运行代码和异常堆栈信息,快速提供排查思路或修复建议。6)多IDE支持:通义灵码支持包括JetBrains全家桶、VS Code以及Visual Studio在内的多种集成开发环境,提供一致的编码体验。

通义灵码全面升级为AI程序员,接手复杂开发任务。在2024年云栖大会上,阿里云宣布“通义灵码”完成全面升级,并正式发布 AI 程序员,即能独立自主完成研发任务的 AI 智能体,能够自主执行任务拆解、代码编写、缺陷修复、测试等开发全过程任务,而且生成的速度最快可达分钟级,开发效率显著提升了数十倍。相比于以往 IDE 上的“AI 编程助手”,“AI 程序员”不需要启动 IDE 软件,直接在 Web 端就可以完成需求分析、开发、测试等一系列工作。

阿里云在 AI 编程领域的产品演进分为三个阶段:第一阶段是基于 IDE 实现辅助编程。第二阶段依然基于 IDE 实现智能体自主处理专业任务。第三阶段则是跳出 IDE,基于多智能体实现自主研发。现阶段阿里云重点做深前两个阶段,同时在布局和探索第三阶段 AI 程序员方向。

腾讯云AI代码助手:接入DeepSeek-R1,代码生成准确率提升30%+

腾讯云AI 代码助手是腾讯云自研的一款编程提效辅助工具,目前已接入DeepSeek-R1满血版。腾讯云AI 代码助手提供了两种产品形态和场景:一种是在 IDE 中的场景,包括主屏写代码模式和侧屏 Chat 对话模式,主侧屏协同打造良好体验;一种是在腾讯内部源代码托管平台中进行代码评审时的场景。

2025年2月,腾讯云AI代码助手接入DeepSeek-R1,性能大幅提升。1)代码生成准确率提升 30%+,更懂用户的开发习惯,减少重复劳动;2) 支持函数级/模块级代码生成,研发工期更短;3) 超长上下文理解,在复杂工程项目中表现更好;4)支持基于当前项目工程、知识库、代码文件进行上下文引用,代码生成更精准,还能自动生成部署流程图。

智谱CodeGeeX:携手英特尔发布CodeGeeX智能编程助手AIPC版

CodeGeeX是智谱AI旗下的代码生成大模型。2022年9月,智谱发布第一代CodeGeeX,然后以每半年更新一代模型的迭代速度不断进化,致力于探索大模型代码生成能力的上限。基于模型打造的CodeGeeX智能编程助手,不仅支持代码补全、代码注释、代码修复、代码翻译等基础功能,还支持联网代码问答、代码解释器、检索增强等进阶实用功能。CodeGeeX对个人用户完全免费,在各种主流IDE均可免费下载使用。此外,智谱还发布CodeGeeX4系列模型的开源版本CodeGeeX4-ALL-9B,集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等所有能力于一体。

截至2024年7月,CodeGeeX的个人用户数量已经超过100万,企业版本也已经应用于科技、金融、医疗和制造等多个行业。

智谱与英特尔合作,发布CodeGeeX 智能编程助手 AIPC版。依托酷睿 Ultra 处理器,CodeGeeX 智能编程助手 AIPC 版能够部署在端侧,以低功耗和高性能完成AI任务,为有编程需求群体提供代码自动生成和补全、代码翻译、智能问答、项目级代码解释以及项目地图等功能。

商汤代码小浣熊:2B+2C双轮驱动,产品矩阵完善

商汤的代码小浣熊是一款基于大模型的软件智能研发助手,于 2022 年底启动研发,2023 年 4 月正式发布,是国内第一批基于大模型的代码助手类工具产品。在原有代码补全、问答交互的基础上,全新的代码小浣熊2.0实现了多维度的数据融合和多模态推理等能力。1)多维度数据融合能力:本地资源直连、企业云端协同、全网知识补给;2)在任务单点修改的同时,代码小浣熊2.0能实现跨文件执行多个任务修改,提供更加全面的编程辅助能力。

代码小浣熊2.0能为C端和B端用户均提供更好用的生产力工具:为个人开发者提供更高效的编程体验,同时为企业打造覆盖需求分析→测试迭代→资产管理的端到端软件开发解决方案,助力开发效率与规范性双提升。代码小浣熊C端分为个人免费版和49元的升级收费版,B端的企业标准版,按899元/人/年收费,同时提供企业私有化部署服务。此外,商汤还发布“小浣熊软件研发助手一体机”,可免费安装部署开箱即用,单台支持超150人团队使用。

艾普阳SnapDevelop:纯国产化低代码IDE,AI赋能

SnapDevelop是艾普阳(卓易信息全资子公司)旗下一款低代码集成开发环境(IDE),旨在帮助用户快速开发云原生应用,同时满足企业信创研发需求。SnapDevelop 采用模型驱动的方式自动生成应用的前后端代码,并提供应用项目后续的开发和维护功能,包括编译、调试、测试、发布和部署等。此外SnapDevelop为纯国产化低代码 IDE,全面满足信创研发需求。

SnapDevelop有多个可视化设计器+代码自动生成器+AI 助手+可视化测试工具等,能够帮助各类技能水平的开发者,轻松实现倍速提升开发效率。AI助手方面,SnapDevelop集成了 ChatGPT(海外用户支持),无需离开IDE即可轻松使用优质 AI 服务,全面提升编码效率,例如提供精准的代码建议,添加代码注释,代码诊断与优化等。

普元信息:低代码Copilot上线,接入DeepSeek

普元信息以“AI+平台”双轮驱动,率先完成可编排的MaaS底座架构升级,基于多模型协作技术重构智能知识库,实现模型能力的灵活匹配与编排调度,为企业打造私有化大模型部署的“中枢系统”。目前,普元已完成DeepSeek 32B、671B超大规模私有化模型的场景适配与部署验证,支持企业根据业务需求灵活调用模型资源,兼顾性能与安全。

普元信息推出“低代码Copilot模式”,将DeepSeek大模型与自研低代码平台深度融合。基于DeepSeek的代码理解与生成能力,用户可通过自然语言指令实现个性化需求开发。无论是应用生成、微服务拆分,还是实体设计、页面国际化等复杂场景,开发者只需描述业务目标,AI即可快速生成代码补丁或逻辑调整建议,经人工确认后一键完成低代码资源配置。该模式大幅降低高级开发场景门槛,让“人人皆是开发者”迈向现实。

分析师声明

免责声明

证券研究报告:《从Copilot到Agent:AI编程的范式革新》

对外发布时间:2025年3月11日

对外发布机构:西部证券研究发展中心

参与人员信息:

分析师:郑宏达

邮箱:zhenghongda@research.xbmail.com.cn

联系人:卢可欣

邮箱:lukexin@research.xbmail.com.cn

在任何情况下,本公众号所载的观点、结论和建议仅供投资者参考之用,并非作为购买或出售证券或其他投资标的的邀请或保证。客户不应以本公众号取代其独立判断或根据本报告做出决策。该等观点、建议并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本公众号内容,不应视本公众号为做出投资决策的唯一因素,必要时应就法律、商业、财务、税收等方面咨询专业财务顾问的意见。西部证券以往相关研究报告预测与分析的准确,不预示与担保本公众号及西部证券今后相关研究报告的表现。对依据或者使用本公众号及西部证券其他相关研究报告所造成的一切后果,西部证券及作者不承担任何法律责任。

本公众号版权仅为西部证券所有。未经公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号版权。如征得西部证券同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“西部证券研究发展中心”,且不得对本公众号进行任何有悖原意的引用、删节和修改。如未经西部证券授权,私自转载或者转发本公众号,所引起的一切后果及法律责任由私自转载或转发者承担。西部证券保留追究相关责任的权力。本公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91610000719782242D。

来源:新浪财经

相关推荐