摘要:SoC 的平面扩展使设计和验证工具和方法得以在相对线性的路径上成熟,但过去几年创造了一个自 EDA 行业诞生以来变化最为剧烈的环境。过去,重点通常涉及新工艺技术,有时会在整个流程中产生连锁反应。设计本质上是渐进式的,尽可能多地借鉴以前的设计。
本文由半导体产业纵横(ID:ICVIEWS)编译自Semiconductor Engineering
这将是令人难以置信的创新之年,由人工智能驱动,并为人工智能而创新,并突破基础物理学的极限。
芯片行业即将迎来创新的一年,这是几十年来从未有过的,但这一进步时期的真正独特之处在于需要专注于物理学和真正的设计技能。
SoC 的平面扩展使设计和验证工具和方法得以在相对线性的路径上成熟,但过去几年创造了一个自 EDA 行业诞生以来变化最为剧烈的环境。过去,重点通常涉及新工艺技术,有时会在整个流程中产生连锁反应。设计本质上是渐进式的,尽可能多地借鉴以前的设计。
但微缩不再像以前那样在功率、性能和面积方面带来巨大改进。未来越来越多地涉及异构和垂直微缩——这里通常称为 3D-IC,但也包括 2.5D——这已在一些最先进的数据中心内得到证实。除了这些设计之外,人工智能将充当推动者,从内部影响工具、方法和流程。此外,功率和热性能将成为主要的优化目标,多物理不再仅限于混合信号设计组件。
需求方面也发生了变化。人工智能需要大幅提高计算能力。业界不再满足于性能的渐进式改进,而是专注于根本性的架构变化,以实现数量级的提升。计算能力的提高还需要适当提高内存性能和通信带宽,但芯片和封装受到其散热量的制约。
2025 年可能是几十年来最令人兴奋的一年。在功率和热限制内对计算能力的无限需求的推动下,新的工具、方法和流程将会出现。设计团队将进行重大重组,以处理系统和硅片之间不断扩大的流程,以及对安全和保障(包括数据安全)日益增长的担忧。
数据中心是当今许多创新的核心,其驱动力来自于对与人工智能相关的计算能力的无限需求。
AI 创新周期正在超越典型的设计迭代时间。是德科技设计和验证业务部总经理 Nilesh Kamdar 表示:“生成式 AI 解决方案的发展意味着传统计算必须进行自我改造,并实现指数级的吞吐量。传统电子解决方案正在失去动力,而即将出现的第一个突破是硅光子学和更多的光通信。某种程度的光通信如今已经很普遍,但随着硅光子的出现,它将开始取代短途传输。到 2025 年,光子学解决方案将成为主流,并推动该领域的投资和招聘。半导体代工厂将通过更新的工艺变体进行创新,并帮助推动生态系统向前发展。”
其他形式的通信也在考虑之中。Point2 Technology 产品营销和业务开发副总裁 David Kuo 表示:“AI/ML 工作负载正在突破数据速率的极限,每秒要处理数万亿次计算。通信带宽和互连必须跟上步伐,以支持增长。这需要从铜和光学技术向新形式的通信进行革命性转变,例如使用毫米波射频信号通过塑料介电波导传输和接收数据。”
过去,设计团队并不太关心数据中心芯片的功耗。“如今,讨论的焦点是数据中心对功耗的意外影响,这已经超出了与手机和电池寿命相关的预测,”Ansys 总监 Rich Goldman 说。“讨论表明,人们的注意力已经转向数据中心巨大的电力需求,以及新建核电站以满足这些需求的潜在必要性。”
这将对数据中心设计的芯片和供应链产生重大影响。Quadric 首席营销官 Steve Roddy 表示:“大型 IP 供应商悄悄进入销售小芯片市场,并向上游进军销售硅片的传闻已经在媒体上流传。2025年很可能会有一家或多家 IP 供应商正式宣布进军小芯片市场。如果小芯片成功将 SoC 分解为小芯片系统,我们可以期待看到 CPU 子系统小芯片、连接小芯片、GPU 处理小芯片和 AI/ML 子系统小芯片。最有可能率先参与这一演变的细分市场是大型数据中心计算领域。该领域的大型半导体公司已经开始出货封闭的专有小芯片系统。随着 UCIe 等标准化工作取得进展,我们将首先看到这种影响在数据中心等 IP 供应商中产生,未来几年将影响汽车等销量更大的细分市场,并最终影响移动手机。”
虽然数据中心整合在过去几年一直在进行,但这种情况可能会改变。Ampere Computing 首席产品官 Jeff Wittich 表示:“部署灵活性变得至关重要。随着人工智能工作负载扩展到不同的环境(本地、边缘和隔离托管设施),对延迟敏感的应用程序将需要更靠近用户的基础设施,部署在现有的数据中心和 PoP(接入点)中。此外,推理不再是独立的工作负载。支持检索增强生成 (RAG) 和应用程序集成等任务将需要强大的通用计算以及人工智能专用资源,强调效率和可扩展性。”
我们还可以看到量子成为商业计算平台。“光子学之后的最后一个前沿是量子计算,”Keysight 的 Kamdar 说。“这是一个令人兴奋的研究领域,我们已经拥有可以处理一千多个量子比特的量子计算机。随着研究和创新的步伐,10,000 个量子比特只需几年时间。量子研究将传播到更多国家,尤其是亚洲,因为没有哪个地区愿意将任何计算优势拱手让给另一个地区。”
过去几年中,许多工具都因 AI 而得到了增强,但到目前为止,很少有工具或方法被 AI 从根本上改变。这种情况可能会在 2025 年发生变化。Arteris 产品管理和营销副总裁 Andy Nightingale 表示:“我们可以期待看到 AI 嵌入到布局、布线和优化等工具中。这将减少手动迭代。我们还可以期待看到生成式 AI 最初用于设计探索、系统架构建议和管理IP重用。在验证过程中,AI 将优先考虑极端情况测试、加速错误检测并分析大型数据集以进行功能和形式验证。”
2025 年很可能是人工智能代理之年。“高度专业化的人工智能代理可以聚集在一起,分析大量信息,涵盖软件架构、工作负载、制造规则、数据流、时间和其他参数,”Synopsys GenAI 中心杰出架构师兼执行董事 Stelios Diamantidis 表示。“这种人工智能之间的协作将有助于识别以前未见过的模式和相关性,为持续存在的挑战开发新的解决方案,并为优化芯片设计和性能提供详细的建议。”
AI 也可能扩展到更多工具领域。“在工程和设计领域,AI/ML 解决方案将从数字转向模拟,对 RF/模拟设计师产生更大的影响,”Kamdar 说。“生成式 AI 将影响设计界,基于 ML 的综合解决方案将有助于创造新颖独特的设计。企业将聘请数据专家并指派首席数据官专注于推动所有 AI/ML 工作的动力——数据。由于 AI/ML 的进步,所有职能部门对生产力的影响都将得到改善。”
事实证明,聊天机器人有助于提高设计师的工作效率。“尽管过去的一年主要关注聊天机器人的使用案例,主要使用公共数据,但未来在于将生成式人工智能应用于私有的安全数据集,以创建更有价值的工具,”Ampere 的 Wittich 说。“金融、保险和电子商务等行业的企业准备采用这些技术,从专有数据中提取有意义的见解。”
这将开始成为竞争优势。Altair 技术战略、电子设计和仿真高级副总裁 Sarmad Khemmoro 表示:“创新速度是制胜法宝。随着对 AI 芯片的需求持续激增,半导体公司将意识到新兴技术在设计过程中发挥的关键作用。通过将 AI 与仿真软件相结合,工程师可以测试新概念并做出设计决策,速度比传统方法快 1,000 倍,从而大大加快上市时间并降低成本。这种方法将是更高效地生产高性能芯片并在快速发展的半导体行业中保持竞争力的关键。”
不过,许可证方面需要做出改变。Driver 联合创始人兼首席执行官 Adam Tilton 表示:“企业将以两种不同的方式部署人工智能,一种是通过结构良好的输出自动执行高度受限的任务,另一种是为开放式任务提供协作工具——两者都旨在提高员工效率。不过,定价模型将反映这些不同的用例,结构化输出采用基于消费的定价,而协作工具采用按席位许可定价。”
人们常说数据是新的石油,但业界才刚刚开始意识到,保存和保护数据比储存石油更困难。数据必须不断验证和清理。“人工智能代理的不断发展强化了透明度的需求,”Synopsys 的 Diamantidis 说。“换句话说,我们需要清楚地了解每个人工智能代理。他们是如何开发和训练的?他们的运营目标是什么?他们如何与其他人工智能代理互动?他们利用了哪些数据集?”
数据主权和安全将极大地影响 2025 年的 AI 部署战略。“企业越来越意识到其专有数据集的价值,将其视为竞争资产,”Wittich 说。“这种转变意味着 AI 推理工作负载不仅在公共超大规模云上运行,而且还在更安全的环境中运行,例如私有云、本地数据中心或私人托管设施。数据泄露和篡改 AI 算法的风险凸显了对安全、隔离基础设施的需求。随着企业在 AI 驱动的创新方面展开竞争,保护知识产权和敏感信息的能力将成为成功的基石。此外,这一趋势将扩大企业拥有的计算资源的作用,创造一个更加分散和安全的 AI 生态系统。”
当工具和数据来自不同的地方时,就需要创造性的解决方案。Cadence 系统验证组产品营销总监 Paul Graykowski 表示:“EDA 供应商一直在寻找训练模型和隔离专有数据的最佳方法。解决方案即将问世。虽然我们暂时还看不到由 GenAI 设计和验证的复杂 SoC,但一些更平凡的文档、编码模板和自动化脚本工作即将出现。人工智能技术将成为验证下一代芯片所需的力量倍增器。”
如今,很少有人考虑使用人工智能的成本效益。Driver 的 Tilton 表示:“公司将通过构建人工智能产品而不是仅仅包装 LLM 来取得成功。”“这意味着混合技术堆栈包括传统软件处理、算法,然后是 LLM 的精确使用。人工智能解决方案需要展示具体的指标,例如成本节约、生产力提高或收入增长,以证明其实施成本是合理的。”
NPU 也将经历大洗牌。Quadric 的 Roddy 表示:“在 1998 年至 2001 年的繁荣时期,我们看到行业中出现了 50 多种不同的 RISC CPU 架构和 25 多种 DSP 架构。就像观看一部关于物种数量繁荣和不可避免的衰退的自然纪录片一样,NPU 的过度繁殖也会导致物种数量减少。那些认为构建矩阵加速器是差异化来源的公司将会发现,授权 IP 块比重新发明已经准备好的东西更便宜、更好。竞争的现实是,市场无法维持 10 或 15 家授权公司。我们已经看到 2024 年的人口峰值,许多实力较弱的 NPU IP 公司已经关闭。随着公司关闭内部 NPU 开发,即使交易量增加,这种趋势也会在 2025 年加速。”
直到最近,对于可以做什么,物理限制很少。许多设计现在都面临着光罩极限,虽然功率长期以来一直是考虑因素,但热现在正成为许多设计的限制因素。
Ansys 产品营销总监 Marc Swinnen 表示:“功耗始终有一个软目标。设计必须满足一定的频率,如果达不到,那么你就得回头再来,推迟产品生产,直到满足该频率。但功耗一直是‘我们已尽了最大努力’的问题。现在,功耗正在变成‘你必须设计功耗’。你不能将一个功耗很大的设计变成低功耗设计。这必须从一开始就做到。公司很早就开始考虑散热问题,他们将其视为设计的核心限制。为此,原型设计变得非常重要。当我们首次开始涉足 3D-IC 市场时,这让我们感到意外。”
它需要新型工具。“这是一个电热协同设计问题,”Arteris 的 Nightingale 说。“它需要能够解决功率、散热和结构力学协同仿真的工具。这对于管理堆叠架构中的热量和功率传输尤其重要。在极端情况下,它需要与设计和验证工作流程集成的实时热仿真,重点关注紧凑和主动冷却解决方案。”
人工智能对数据中心电力的无止境的需求给电网和地理电力限制带来了压力。“为了避免在短期内引入新的不可再生能源或延长其使用寿命,硬件优化将在降低电力需求方面发挥关键作用,”Wittich 说。“用现代高效处理器取代旧的耗电系统可以大幅减少能源使用,使现有基础设施更加可持续。这种效率转变对于平衡对更多能源的需求与负责任的环境管理至关重要。”
3D-IC 技术(包括 2.5D)已用于解决其中一些问题。“Chiplet 和 3D-IC 解决方案将继续成为主流,”Kamdar 说。“您可以期待更多封装公司加入 Chiplet 生态系统,并帮助标准化设计和协作的许多方面。包括异构集成 (HI) 在内的先进封装技术将为系统公司带来技术和业务优势,这将继续吸引该领域的投资。创建 3D-IC/HI 设计的设计解决方案将日趋成熟,系统设计人员将能够更轻松地进行前期设计和权衡。”
这可能会对 IP 市场产生重大影响。Quadric 的 Roddy 说:“Synopsys 和 Cadence 在物理 IP 领域占据市场主导地位。这源于将复杂的高速模拟接口移植到每个晶圆厂的每个新工艺变体的工程密集型性质。但是当芯片成为主流时会发生什么?SoC 设计团队不再需要在同一工艺中拥有所有 IO。如果您可以利用芯片和 3D-IC 封装在 5nm 芯片中使用现有的接口 IP,那么移植所有物理 IP 的需要就会大大减少。随着更多 IP 被重复使用,现有的物理 IP 参与者可能会看到许可收入上升,但对 NRE 移植费用的需求会减少。有抱负的新物理 IP 参与者将有勇气进入市场,因为他们知道他们的作品可以有更长的使用寿命。不要指望 2025 年前三名的排名会发生变化,但未来变化的种子将在 2025 年播下。”
新技术节点不断增加设计压力。Atomera 先进逻辑节点和电源业务负责人 Shawn Thomas 表示:“对于高度扩展的晶体管,例如 2nm 节点,诸如随机掺杂波动之类的效应会对晶体管特性(例如 Vt 或迁移率)产生很大影响。Vt 的变化会导致开关速度的差异,这在 GAA 结构中会加剧。GAA 晶体管中的每个通道可能具有不同的 Vt,然后聚合到器件的整体 Vt。这会导致电路级不匹配增加,并缩小电路设计人员必须使用的设计余量(即更保守的设计以考虑增加的可变性)。Vt 的变化还会导致晶体管的泄漏增加,从而增加晶体管和后续电路元件的关断状态功耗。”
先进封装技术需要新工具。“封装技术需要大变革,”Ansys 的 Swinnen 说。“组装多个芯片并进行键合的方法有无数种,但并非所有方法都有足够的投资来实现在整个市场上的全面生产可行性。推动这一趋势的原因是每个人都希望能够销售芯片,每个从事 3D 工作的人都需要芯片,因此对标准化的需求非常强烈。业界的利益一致,以确保为此制定标准。实现这一目标需要一年多的时间,但之后你就会看到该领域的进步。”
在制定标准的同时,合作也变得非常重要。Altair 的 Khemmoro 表示:“半导体公司将越来越重视与系统公司建立牢固的合作伙伴关系。这些合作至关重要,因为许多芯片制造商对其产品如何集成到最终设备中缺乏完整的了解。在未来几年,这种团队合作将变得更加重要,尤其是当系统设计师面临着创造更小、更高效产品的持续压力时。紧跟这些变化并做出相应的调整对于保持竞争力和推动创新至关重要。”
在 EDA 中,与 AI 相关的很多话题都集中在验证领域。Cadence 的 Graykowski 表示:“过去几年,我们看到 AI 验证领域取得了许多进展,这有助于优化回归并缩小调试验证失败的范围。由于业界有时间对这些解决方案进行原型设计和改进,我预计我们将获得更优化的功能集,并看到更多采用者将这项技术引入主流验证流程。明年最有可能取得最大进步的领域不仅仅是回归优化,还包括帮助缩小覆盖范围并在更短的时间内找出更多错误。自动化流程在分类和缩小调试范围以及确定可能的故障源方面具有很大的潜力。验证工程师将利用该技术筛选数据量,使他们能够跟上当今设计的规模。我还预计 GenAI 将在明年得到更多应用。”
AI 还将增强设计流程。“印刷电路板 (PCB) 设计需要多种学科和技能,”Khemmoro 说。“因此,公司越来越多地在整个工作流程中采用自动化,从初始需求和逻辑设计到制造和组装。通过在设计过程中将 AI 与仿真相结合,可以加速设计决策,并显著缩短开发周期。为了进一步增强这一过程,现在汽车、航空航天和国防等产品寿命较长的行业正在现场使用监控系统,以跟踪 PCB 性能,以及降低组件的额定值以将潜在问题直接传达给开发团队。然后可以将这些见解纳入 PCB 设计流程,以提高效率和可靠性。”
设计团队必须跨越越来越多的学科。Arteris 的 Nightingale 表示:“许多设计的范围正在扩大,这意味着模拟也必须扩展到涵盖光学、流体和机械效应,尤其是在复杂封装中。”“一些市场增加了其他要求,例如硬件级安全性的新方法,包括加密验证和抗攻击性,以及芯片级符合 ISO 21434 网络安全风险管理标准。而可靠性需要针对老化、电迁移和其他长期故障模式的预测工具。”
总的来说,这些只是行业在 2025 年将发生重大变化的几个领域。其中一些技术被原型化并发布到行业的速度正在加快。这是前所未有的,它说明了保持领先地位的重要性。整个行业正处于巨大的变革之中。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
来源:半导体产业纵横