实测AI到底能不能抢走软件架构师的饭碗

摘要：自从2022年起，"AI会不会取代程序员"就成了科技圈的热门话题，后来大家又担心起产品经理、UI设计师这些岗位。今天咱们不聊这些，就来掰扯掰扯一个更硬核的问题——要是没有软件架构的真本事，光靠AI能设计出复杂的大型系统吗？

AI到底能不能抢走软件架构师的饭碗？这个问题在科技圈都快被问烂了！

【开场白】
自从2022年起，"AI会不会取代程序员"就成了科技圈的热门话题，后来大家又担心起产品经理、UI设计师这些岗位。今天咱们不聊这些，就来掰扯掰扯一个更硬核的问题——要是没有软件架构的真本事，光靠AI能设计出复杂的大型系统吗？

【现状分析】
现在程序员们慌得一批，主要是因为AI写代码确实有模有样。但写代码只是软件开发里最基础的一环！真正要命的问题是：AI能不能从头到尾搞出一个能用的完整应用？或者至少手把手教人把系统搭起来？

说白了就是：AI能取代软件架构师吗？更准确地说，AI有没有本事替代架构设计这项核心能力？

【灵魂拷问】
软件架构师可是能把各种零件组装成能跑起来的系统的老司机啊！不过在小公司里，架构设计经常是程序员自己顺手就干了。程序员经验越丰富，他干的活就越像架构师。所以关键问题不是"能不能用AI写代码"，而是"能不能用AI生成完整的系统蓝图"？

【终极问题】
软件架构师到底是不是不可替代的？还是说我们离被AI淘汰就差一个提示词（prompt）的距离？

【真人实测】
我做了个实验：把真实的架构设计题目丢给几个当红AI模型，看看它们能不能给出像资深架构师那样的方案。结果...有点出乎意料！

【实验设定】
我选了四位顶尖大模型LLM来考AI——既要处理敏感数据又要符合监管要求，还有一堆复杂模块，正是架构师最爱的挑战类型。

我希望选择一个现实但又复杂的架构，并且不要太过千篇一律。例如，电子商务系统、库存跟踪应用程序和视频流等经常在架构练习中被讨论和提及。我希望设计一些更独特的东西。因此，我为LLM学生设计的挑战是加密货币交易所。这是一个复杂的领域，风险高，数据敏感，监管严格，并且有很多不确定的环节，这正是许多软件架构师热衷于钻研的领域。

我处理这个问题的方法是先发出一个初始提示，然后再提出后续提示。这样做是为了模拟我们架构师设计系统时的典型流程。首先，我们会与利益相关者进行初步讨论。这些讨论通常比较模糊和不完整。然后，我们开始深入挖掘细节，揭示系统的更多层次。

我结合自己在软件、解决方案和企业架构方面的经验，从自己的角度审视了这些答案。然后，我请每位大模型（LLM）评估自己的答案，结果非常有趣。

我给每个大模型（LLM）都提了同样的题目，也问了同样的问题。出发点也一样。我没有提供任何额外的背景信息或背景信息。

首先我询问了系统的总体架构。
然后，我要求深入了解一个特定的方面（KYC——了解你的客户）。
最后，我要求每个LLM学生回顾自己的架构并进行评分。大多数答案都让我感到惊讶。

测试流程完全模拟真实工作场景：

先给个模糊需求（模拟甲方爸爸的初始brief）逐步深入细节（像真实项目那样层层深入）最后让AI自己给自己打分参赛选手：ChatGPT-4o、Claude 3.7、Gemini 2.0、Grok 3（每个AI我都给起了外号方便区分）

4轮测试五个提示词：
第一回合：整体架构设计：
提示 #1：你是一位经验丰富的软件架构师，负责设计一个现代加密货币交易平台的完整架构，其范围和功能与 Coinbase 或 Kraken 类似。你的设计必须详尽，并兼顾技术和业务的复杂性。

第二回合：画架构图：
提示 #2：
用 C4 符号绘制以下架构图，以表示你刚刚描述的服务生态系统。系统景观图、系统环境图、容器图。请使用 ASCII 码绘制这些图。

第三回合：深挖KYC服务：
提示 #3：
让我们深入探讨一下 KYC 服务。这项服务的架构考量有哪些？您将如何设计它？请描述负责创建此服务架构的人员在设计中需要包含的所有内容。不要深入探讨代码，但要概述构建此服务时需要考虑的所有技术和非技术因素。

最终回合：让AI自己打脸
提示 #4
担任银行内部架构审查委员会的角色。审查您刚刚提出的KYC架构，并找出任何差距、风险、缺失部分以及需要澄清的一般事项。

提示 #5
以 1 到 10 分（10 为最高分）来评分，您如何评价您刚刚审核的 KYC 服务架构？为什么？

【第一回合：整体架构设计】
▷ ChatGPT像个PPT大师：架构图画得漂漂亮亮，7大层次分明，但全是正确的废话，就像咨询公司给的模板方案
▷ Claude像写投标书的：列了一堆组件清单，但没深度没重点
▷ Gemini像技术产品经理：写得最短，但莫名塞了一堆技术名词
▷ Grok意外地靠谱：唯一提到风险管理和合规要求的，结构最接近真实项目文档

ChatGPT：企业解决方案架构师 — 精良、高水平、通俗易懂
总体感觉
提供了一个完善的多层架构，并清晰地分离了关注点。将系统分为 7 层（客户端、API 网关、应用程序、域、数据、基础设施、运维）。输出结果结构化且达到咨询级别，但感觉更像是一个最终状态的参考模型。
它非常笼统，充满了本应被指出的隐含假设。例如，它建议使用 CQRS，但没有解释它是什么以及为什么要使用它。它没有讨论权衡利弊，而且架构特性（例如可扩展性、可观察性等）只是顺便提及，尽管这些特性是隐含的。
输出中使用的部分

高级业务需求架构概述（7 层：客户端、网关、应用程序、域、数据、基础设施、操作）领域层（钱包、匹配引擎）数据层基础设施层操作层安全架构可扩展性和性能可审计性和合规性可选增强功能技术栈示例过于理想化——缺乏分阶段实施的思维、演进式架构，以及许多选择的合理性。例如，技术栈。浅谈实施的现实性感觉应该深入探讨一些方面没有提到架构权衡做出了隐含的假设并使用了相当多的流行语，但没有清楚地阐明为什么做出这样或那样的架构选择

它最适合做什么
向利益相关者展示参考架构，作为监管机构大规模规划的初步参考框架。然而，这需要深入钻研架构细节，并考量架构各个方面的原因和影响。
使用第一稿蓝图作为起点只是为了让您了解所涉及的一些概念。

Claude：顾问 — 生成对 RFP 的回复
总体感觉
读起来像是对需求文档（RFP，即征求建议书）的回复。与上文提到的 ChatGPT 类似，它只是略微涵盖了所有内容，缺乏深度或强烈的意见。缺乏优先级或技术顺序。服务清单内容繁琐，要点清晰，但叙述有限。组件名称虽然醒目，但缺乏深入的联系。
感觉像是内部或面向供应商的需求调整。
输出中使用的部分

核心组件（用户管理、钱包、市场数据、KYC 等）数据存储（关系型、NoSQL、缓存）基础设施与部署安全注意事项商业考虑API 设计部署策略未来考虑

可能是最适合
内部或面向供应商的初始需求协调，其目标是生成一个需要考虑的非常广泛的项目列表，而无需深入探讨。

Gemini — 将最初的想法付诸纸面的技术产品负责人
体感觉
读起来和 Claude 和 ChatGPT 的很像，但感觉更粗略，更高级。在目前为止的三篇里，这篇感觉像是最高级别的概述，但同时，奇怪的是，它在技术方面也提供了最具体的说明。不过，它没有提到为什么要使用这种或那种技术。
输出中使用的部分

总体架构概述核心组件数据存储技术和基础设施安全注意事项商业考虑API 设计部署策略未来考虑

可能是最适合
技术产品所有者或解决方案架构师创建高级架构文档的初始大纲。

Grok：软件架构师希望涵盖一切
总体感觉
这感觉像是项目的一个良好开端。一方面，它足够通用。另一方面，它确实深入探讨了一些细节，并提供了一个坚实的总体视角，指导团队在着手构建加密货币交易所时需要考虑哪些方面。它对所有关键主题进行了清晰的细分，例如功能需求、非功能性（架构特性）、风险等。
这是唯一明确提到风险和操作问题以及明确指出非功能性需求的重要性的版本。
优势

在合规性、隐私、审计和监管准备方面非常强大很好地指出了风险和操作考虑。按照实际项目中通常处理的顺序清晰地细分各个部分感觉比其他的更全面

输出中使用的部分

功能要求非功能性需求高级架构详细组件设计安全可扩展性和性能合规与法律技术堆栈操作注意事项未来扩展能力风险与缓解措施

可能是最适合
团队开始思考如何构建这样的系统，如何创建初始架构文档，如何将项目分解成更小的部分，以及需要考虑的关键点。提供足够详细的高级描述，作为实际的起点。

【第二回合：画架构图】
让AI用ASCII字符画C4架构图（程序员都懂的灵魂画法）：
▷ ChatGPT和Claude画得中规中矩
▷ Gemini直接摆烂给了段PlantUML代码
▷ Grok不仅画得好，还给每张图加了详细说明

【第三回合：深挖KYC服务】
（KYC就是"实名认证"，金融系统最复杂的部分）
▷ ChatGPT居然设计了数据库表结构，但忘了灾备方案
▷ Claude把运维成本都算出来了，但没画图
▷ Gemini写得最泛泛而谈
▷ Grok再次惊艳：连OCR识别、反洗钱这些子模块都设计好了，还列出了风险点

✨ChatGPT

对 KYC 服务及其职责的全面概述。提供了关键的架构考虑——尽管这些与功能要求混合在一起。简要提到了域数据模型，甚至概述了基本的数据库表设计。提及与第三方的集成、可观察性、合规性和法规开始深入研究 API 设计并概述了基本的 C4 容器图总结最终清单并提及参与构建和运营此服务的角色没有提到灾难恢复和业务连续性

✨Claude

将功能性需求与非功能性需求分开，有助于使事情更清晰概述 KYC 主要服务中的子服务提及集成模式、部署架构和安全考虑呼吁法规和灾难恢复提到成本并将其细分为开发、运营和扩展类别，这很有帮助没有图表

✨ Grok

对 KYC 进行最全面的架构深入研究 — 分为服务（生物识别、反洗钱、OCR、评分、案例管理）。涵盖数据生命周期、监控、部署和监管要求。详细介绍了事件模式和数据库表设计明确指出风险和需要进一步阐述的要点每个部分都有相当多的细节明确区分功能性需求和非功能性需求，并深入研究后者

【最终回合：让AI自己打脸】
让AI扮演银行评审委员会，给自己刚做的设计挑刺：
▷ ChatGPT给自己打7.5分："放加密货币交易所还行，但银行级系统还差得远"
▷ Claude打7分："基础不错，但细节经不起推敲"
▷ Gemini只给6分："合规性部分像小学生作业"
▷ Grok也打6分，但写了500字改进方案，堪比架构师述职报告

✨ ChatGPT
确定了一些差距和风险，包括：

没有提及此数据的真实来源系统没有关于如何处理 GDPR 和其他法规的具体细节没有灾难恢复计划，没有 RTO/RPO 目标很少提及可审计性，尤其是手动工作流程没有提及使用第三方的风险测试方法的差距

最后，还提供了额外的建议。
评分：ChatGPT 的评分为7.5 分（满分 10 分）。

ChatGPT 对其自身架构的描述如下：
KYC 服务的架构在概念上很强大，并且对于现代、快速发展的加密平台来说结构良好——但如果不解决关键的合规性、操作性和安全性漏洞，对于银行级环境来说还不够成熟。

这种架构符合大多数正确的技术和功能模式，特别是对于针对上市时间和模块化进行优化的技术前沿、加密原生产品而言。
然而，从金融机构的角度来看——KYC 不仅仅是一项合规职能，而且是一项法律义务、审计风险和声誉保障——该架构在以下方面存在不足：

✨Claude

明确划分差距/风险类型：技术、合规、运营。并标注了关键差距。其中提到了培训和专业知识方面的差距，这一点非常重要，但却常常被忽视。明确指出哪些领域需要澄清。包括改进建议。总体来说，评论非常简短，切中要点，没有太多细节。

评分：克劳德给自己的评分为7 分（满分 10 分）。

以下是 Claude 对其自身架构的评价：
该架构提供了坚实的基础，但在实施之前仍需解决一些问题，尤其是考虑到加密货币交易所 KYC 流程相关的严格监管审查和财务风险。良好的 KYC 系统（7/10）和卓越的 KYC 系统（9-10/10）之间的区别，通常在于这些细节，这些细节确保了监管合规性、卓越运营和强大的欺诈预防能力。

✨Gemini
对差距和缺失部分进行了相当详细的审查，其中包括：

数据驻留和保留政策同意管理处理边缘情况KYC 工作流程的人工审核缺乏明确的可审计性服务水平协议灾难恢复和业务连续性数据训练——极其重要，但经常被忽视数据、合规、第三方风险不断演变的法规缺乏对各种物品所有权的明确认定

感觉大多数关键差距和风险都已提及，并进行了充分解释，足以让团队着手解决。Gemini 还提供了总体评估总结和一些详细的建议。
评分：Gemini 的评分为6 分（满分 10 分）。

Gemini 对其自身架构的描述如下：
本质上，初步提案展现了对 KYC 服务基本组成部分和考量因素的良好理解。然而，它缺乏必要的深度和具体性，因此我们无法自信地将其作为受监管金融机构稳健且可投入生产的架构。

它提供了坚实的基础（因此评分为6），但仍需开展大量工作来充实细节，解决已发现的差距和风险，并在安全性、合规性、可靠性和运营效率方面提供必要的保障。我们需要一份更加详细的蓝图，才能将其视为更高评级的架构。

✨ Grok

与其他法学硕士 (LLM) 相比，自我评价非常详细。其他法学硕士课程提供的是通用大纲，而 Grok 则深入研究它发现的每一个差距和风险，并建议应采取的行动方案详细分析了为什么给自己打了这样的分唯一解释为什么给出准确分数的法学硕士——不高也不低概述了改进计划

评级：Grok 的评级为6 分（满分 10 分）。

Grok 对其自身架构的描述如下：

KYC 服务架构凭借其强大的技术基础、监管意识和以用户为中心的特性，获得了 6/10 的评分，但在合规细节、运营成熟度、安全稳健性和第三方依赖管理方面存在显著差距。这些缺陷在银行业尤为突出，因为监管审查和安全需求至关重要。通过解决已发现的问题，该架构可以发展成为一个稳健、合规的解决方案，适用于在银行监管下运营的加密货币交易所。

【暴论结论】
目前AI还取代不了架构师——就像给你Photoshop不等于你会设计，给个CAD软件不等于你会造房子

正如每一位经验丰富的软件工程师和架构师所知，从头开始构建一个系统既是一门艺术，也是一门科学。
说实话？有时候，它感觉更像是艺术。

构建这样一个系统需要考虑的细微差别非常多。几乎太多了。太多了。一两次甚至三次都无法掌握。

构建这样一个系统——实际上任何系统——都需要经历一个既结构化又非结构化的过程，包括发现、调查、演进和实验。如果你没有架构经验，或者不懂如何以架构的方式思考——你就不知道该问哪些问题。

至少目前，GenAI 不会很快取代架构师。这是我的看法。如有不同意见，请随意。架构并非为业务利益相关者创建图表或演示文稿的能力。它是指在图表背后进行批判性、反思性和迭代性思考的能力。这在很大程度上仍然是一种人类技能。

但！未来的赢家是会用AI的架构师：就像现在建筑师都用CAD，将来不会用AI的架构师肯定淘汰

最让我吃惊的是Grok的表现，它居然会自我批判，这比很多人类架构师还强！

【人间真实】
架构设计最难的从来不是画图，而是：
✅ 知道该问什么问题（比如"你的设计有哪些漏洞？"）
✅ 在甲方说"随便设计"时，能挖出隐藏需求
✅ 在技术选型时能说清楚"为什么用A不用B"

这些...现在的AI还搞不定。但已经可以当架构师的"外挂大脑"了——就像程序员现在都用Copilot写代码，未来架构师也会用AI打辅助。所以别问"会不会被取代"，要问"怎么用AI让自己更值钱"！

来源：解道Jdon

标签：软件 gemini claude 架构师软件架构师

本文地址：https://news.43u.com.cn/a/2021773.html