摘要:SoC的平面扩展使设计与验证工具及方法沿着相对线性的路径走向成熟。然而,过去几年所发生的环境变化,却比EDA行业诞生以来的任何时候都更具变革性。过去,行业关注焦点通常在新的制程技术,这有时会在整个流程中产生连锁反应。设计本质上是渐进式的,可以尽可能多地借鉴之前
(本文编译自Semiconductor Engineering)
芯片行业即将迎来创新之年,这将是过去几十年都未曾有过的景象。但这一轮的技术进步真正独特之处在于,需要聚焦物理原理和实际设计技能。
SoC的平面扩展使设计与验证工具及方法沿着相对线性的路径走向成熟。然而,过去几年所发生的环境变化,却比EDA行业诞生以来的任何时候都更具变革性。过去,行业关注焦点通常在新的制程技术,这有时会在整个流程中产生连锁反应。设计本质上是渐进式的,可以尽可能多地借鉴之前的设计。
但如今,芯片微缩不再像以前那样为功耗、性能和面积方面带来巨大改进。未来越来越多地涉及异构和垂直微缩——通常称为3D-IC,但也包括2.5D——这在一些最先进的数据中心中已得到验证。除了这些设计之外,人工智能将成为推动力量,从内部影响工具、方法和流程。此外,功耗和散热问题将成为主要的优化目标,多物理场也不再局限于混合信号设计组件。
需求端也在发生变化。人工智能对计算能力有巨大的提升需求。业界不再满足于性能的渐进式改善,而是专注于根本性的架构变革,以实现数量级的性能提升。计算能力的提升还需要适当提高内存性能和通信带宽,但芯片和封装受到其散热能力的制约。
《Semiconductor Engineering》认为,2025年可能是几十年来最令人兴奋的年份之一。在功耗和散热的限制范围内,对计算能力的无限需求将推动新工具、方法和流程的出现。设计团队将进行重大重组,以应对系统和芯片之间不断扩展的流程,以及对安全和安保(包括数据安全)日益增长的担忧。
由数据中心驱动
数据中心是目前许多创新的核心,这背后是与人工智能相关的对计算能力永无止境的需求。
人工智能的创新周期正在超越传统设计迭代时间。是德科技设计和验证业务部总经理Nilesh Kamdar表示:“生成式人工智能解决方案的发展意味着传统计算必须进行自我革新,并实现指数级的吞吐量提升。传统电子解决方案正失去动力,即将到来的首个突破是硅光子学和更多的光通信技术。如今,一定程度的光通信已很普遍,但随着硅光子学的出现,它将开始取代短距离传输。2025年,光子学解决方案将成为主流,并推动该领域的投资和人才招聘。半导体代工厂将通过更新的工艺变体进行创新,帮助推动生态系统向前发展。”
其他形式的通信方式也在被考虑之中。Point2 Technology产品营销和业务开发副总裁David Kuo表示:“AI/ML工作负载每秒处理数万亿次计算,正不断挑战数据速率的极限。通信带宽和互连必须跟上步伐,以支持这种增长。这就需要从铜和光学技术向新的通信形式,例如使用毫米波射频信号通过塑料介电波导来传输和接收数据。”
过去,设计团队并不太关心数据中心芯片的功耗问题。“如今,讨论的焦点围绕数据中心对功耗的影响,这已超出了与手机及电池寿命相关的预测,”Ansys总监Rich Goldman表示,“这场讨论表明,人们的注意力已转向数据中心巨大的电力需求,以及新建核电站以满足这些需求的潜在必要性。”
这将对为数据中心设计的芯片和供应链产生重大影响。Quadric首席营销官Steve Roddy表示:“大型IP供应商已悄悄开始销售芯粒(chiplet),并向上游进军进行芯片销售的传闻,已在媒体上流传。2025年很可能会有一家或多家IP供应商正式宣布进军芯粒市场。如果芯粒成功将SoC分解为芯粒系统,我们有望看到CPU子系统芯粒、连接芯粒、GPU处理芯粒和AI/ML子系统芯粒。最有可能率先参与这一演变的细分市场是大型数据中心计算领域。该领域的大型半导体公司已开始出货封闭的、专有芯粒系统。随着UCIe等标准化工作取得进展,我们将首先看到这种影响在数据中心等IP供应商中产生,未来几年,将影响汽车等销量更大的细分市场,并最终影响移动手机市场。”
尽管在过去几年数据中心一直在进行整合,但这种情况可能会改变。Ampere Computing首席产品官Jeff Wittich表示:“部署灵活性正变得至关重要。随着人工智能工作负载扩展到不同的环境(如本地部署、边缘计算以及物理隔离的托管设施),对延迟敏感的应用将需要更靠近用户的基础设施,部署在现有的数据中心和网络接入点(PoP)中。此外,推理不再是独立的工作负载。支持检索增强生成(RAG)和应用集成等任务将需要强大的通用计算能力,以及人工智能专用资源,这凸显了效率和可扩展性的重要性。”
我们还有望看到量子计算成为商业计算平台。“光子学之后的一个前沿技术是量子计算,”是德科技的Kamdar表示,“这是一个令人兴奋的研究领域,我们已经拥有能处理一千多个量子比特的量子计算机。按照目前的研究与创新速度,实现一万个量子比特只需几年时间。量子研究将扩展到更多国家,尤其是亚洲国家,因为没有哪个地区愿意在计算领域向其他地区拱手让出优势。”
人工智能赋能
在过去几年里,许多工具都因AI而得到了改进,但到目前为止,几乎没有工具或方法因AI发生根本性改变。2025年这种情况很可能会有所变化。Arteris产品管理和营销副总裁Andy Nightingale表示:“我们有望看到AI融入布局、布线和优化等工具中,这将减少人工迭代。我们还预期生成式AI初步应用于设计探索、系统架构建议和管理IP复用。在验证方面,AI将优先考虑极端情况测试,加速漏洞检测,并分析大量数据集以进行功能验证和形式验证。”
2025年很可能是人工智能代理(AI Agent)之年。“高度专业化的人工智能代理可以协同工作,分析海量信息,这些信息涵盖软件架构、工作负载、制造规则、数据流、时间以及其他参数,”新思科技生成式人工智能中心杰出架构师兼执行董事Stelios Diamantidis表示,“这种人工智能之间的协作将有助于识别以前未见过的模式和相关性,为长期存在的难题开发新的解决方案,并为优化芯片设计和性能提供详细的建议。”
AI也可能扩展到更多工具领域。“在工程和设计领域,AI/ML解决方案将从数字领域转向模拟领域,对射频/模拟设计师产生更大的影响,”是德科技的Kamdar表示,“生成式AI将影响设计界,基于ML的综合解决方案将有助于创造新颖独特的设计。企业将聘请数据专家,并设立首席数据官,专注于驱动所有AI/ML工作的动力——数据。由于AI/ML的进步,所有职能部门对生产力的影响都将得到提升。”
聊天机器人已被证明有助于提高设计师的工作效率。“过去一年主要关注聊天机器人的应用场景,且大多使用公开数据,但未来在于将生成式人工智能应用于私有、安全的数据集,以创建更有价值的工具,”Ampere的Wittich表示,“金融、保险和电子商务等行业的企业已做好采用这些技术的准备,以从专有数据中提取有意义的见解。”
这将开始成为竞争优势。Altair技术战略、电子设计和仿真高级副总裁Sarmad Khemmoro表示:“创新速度是制胜法宝。随着对AI芯片的需求持续激增,半导体公司将意识到新兴技术在设计过程中发挥的关键作用。通过将AI与仿真软件相结合,工程师测试新概念产品并做出设计决策的速度比传统方法快1,000倍,从而大大加快产品上市时间并降低成本。这种方法对于更高效地生产高性能芯片以及在快速发展的半导体行业中保持竞争力至关重要。”
然而,授权方式也需要做出改变。Driver联合创始人兼首席执行官Adam Tilton表示:“企业将以两种不同的方式部署人工智能,一是通过结构良好的输出自动执行高度受限的任务;二是为开放式任务提供协作工具——两者都旨在提高员工效率。不过,定价模型将反映这些不同的使用场景,结构化输出采用基于使用量的定价,而协作工具则是采用按席位授权的定价方式。”
人们常说数据是新的石油,但业界才刚刚开始意识到,管理和保护数据比储存石油更困难。数据必须不断进行验证和清理。“人工智能代理的不断发展强化了对透明度的需求,”新思科技的Diamantidis表示,“换句话说,我们需要清楚地了解每个人工智能代理。它们是如何开发和训练的?它们的运营目标是什么?它们如何与其他人工智能代理交互?它们利用了哪些数据集?”
数据主权和安全将在2025年对人工智能部署策略产生重大影响。“企业越来越意识到其专有数据集的价值,并将其视为竞争资产,”Wittich表示,“这种转变意味着AI推理工作负载不仅会在公共超大规模云平台上运行,还会在更安全的环境中运行,如私有云、本地数据中心或私有托管设施。数据泄露和AI算法被篡改的风险凸显了对安全、隔离基础设施的需求。随着企业在AI驱动的创新方面展开竞争,保护知识产权和敏感信息的能力将成为成功的基石。此外,这一趋势将扩大企业拥有的计算资源的作用,创建一个更加分散和安全的AI生态系统。”
当工具和数据来自不同的地方时,就需要创造性的解决方案。Cadence系统验证组产品营销总监Paul Graykowski表示:“EDA供应商一直在寻找训练模型和隔离专有数据的最佳方法。相关解决方案即将问世。虽然我们暂时还看不到由GenAI设计和验证的复杂SoC,但一些诸如文档编制、编码模板和自动化脚本等较为繁琐的工作即将实现自动化。人工智能技术将成为验证下一代芯片所需的力量倍增器。”
如今,人们很少考虑使用人工智能的成本效益。Driver的Tilton表示:“企业要想成功,应构建人工智能产品,而不仅仅是围绕大语言模型(LLM)做包装。这意味着采用混合技术栈,包括传统软件处理、算法,然后有针对性地使用大语言模型。人工智能解决方案需要展示具体的指标,如成本节约、生产力提升或收入增长,以证明其实施成本的合理性。”
此外,NPU领域也将经历大洗牌。Quadric的Roddy表示:“在1998年至2001年的繁荣时期,我们看到行业中出现了50多种不同的RISC CPU架构和25多种DSP架构。就如同观看一部关于物种数量兴衰的自然纪录片一样,NPU的过度泛滥也会导致行业洗牌。那些认为构建矩阵加速器能形成差异化的公司将会发现,授权IP模块比重新发明现成的东西更便宜、更好。而且竞争的现实是,市场无法维持10或15家授权公司。我们在2024年已看到企业数量达到峰值,一些实力较弱的NPU IP公司已经倒闭。预计2025年这一趋势将加速,即便交易数量会增加,但会有更多公司停止内部NPU的开发。”
物理限制
直到最近,在设计方面的物理限制还很少。如今,许多设计都面临着光罩尺寸的限制,虽然功耗问题长期以来一直是需要被考虑的因素,但散热问题现在正成为许多设计的限制因素。
Ansys产品营销总监Marc Swinnen表示:“功耗始终有一个软性目标。一个设计必须达到一定的频率,如果达不到,那就只能回过头来重新设计,并推迟产品推出,直到满足频率要求。但功耗问题一直是‘我们已尽了最大努力’这种情况。现在情况变成了‘你必须考虑功耗进行设计’。你不能拿着一个高功耗的设计,然后把它变成低功耗设计。这必须从一开始就纳入考量。目前,企业很早就开始考虑散热问题,并且将其视为设计的一个核心限制上限。为此,原型设计变得非常重要。当我们首次开始涉足3D-IC市场时,这让我们感到意外。”
这就需要新型工具。“这是一个电热协同设计问题,”Arteris的Nightingale表示,“它需要能够解决功耗、散热和结构力学协同仿真的工具。这对于管理堆叠架构中的散热和电力传输尤其重要。极端情况下,它需要将实时热仿真集成到设计和验证工作流程中,重点关注紧凑且主动的散热解决方案。”
人工智能在数据中心对电力的巨大需求给电网和地区电力供应带来了压力。“为了避免在短期内引入新的不可再生能源或延长其使用期限,硬件优化将在降低电力需求方面发挥关键作用,”Wittich表示,“用现代高效处理器取代旧的、高能耗系统,可以大幅减少能源使用,使现有基础设施更具可持续性。这种效率转变对于平衡能源需求与环境责任至关重要。”
3D-IC技术(包括2.5D)已被用于解决其中一些问题。“芯粒和3D-IC解决方案将继续变得更加主流,”Kamdar表示,“预计会有更多封装厂商加入芯粒生态系统,并助力设计和协作等诸多方面的标准化。包括异构集成(HI)在内的先进封装技术,将为系统公司带来技术和商业优势,这将持续吸引该领域的投资。创建3D-IC/HI设计的设计解决方案将日趋成熟,系统设计人员将能够更轻松地进行前期设计和权衡。”
这可能会对IP市场产生重大影响。Quadric的Roddy表示:“新思科技和Cadence在物理IP领域占据市场主导地位。这源于将复杂的高速模拟接口移植到每晶圆厂的每个新工艺变体所具有的工程密集型特性。但是当芯粒变得更加主流时会发生什么呢?SoC设计团队不再需要在同一工艺中拥有所有I/O。如果您可以利用芯粒和3D-IC封装,在5nm芯粒中使用现有的接口IP,那么对移植所有物理IP的需要就会大大减少。随着更多IP被重复使用,现有的物理IP厂商可能会看到许可收入增加,但对NRE移植费用的需求会减少。而有抱负的新物理IP厂商会因了解到他们的成果能有更长的可用寿命,而更有勇气进入市场。预计2025年排名前三的格局不会改变,但未来变化的种子将在2025年埋下。”
在EDA领域内
新技术节点不断给设计带来压力。Atomera先进逻辑节点和电源业务负责人Shawn Thomas表示:“对于高度扩展的晶体管,例如2nm节点,随机掺杂波动等效应会对晶体管特性(例如Vt或迁移率)产生很大影响。Vt的变化会导致开关速度的差异,这种情况在GAA结构中会加剧。GAA晶体管中的每个通道可能具有不同的Vt,进而累加影响器件的整体Vt。这会导致电路级的不匹配增加,并压缩电路设计人员的设计裕度(即需要更保守的设计来应对增加的可变性)。Vt的变化还会导致晶体管的漏电流增加,从而增加晶体管和后续电路元件的关态功耗。”
先进封装技术需要新工具。“封装技术需要大变革,”Ansys的Swinnen表示,“组装多个芯片并进行键合的方法有无数种,但并非所有方法都能获得足够投资,使其在整个大众市场实现全面量产。推动这一趋势的原因是,每个人都希望能够销售芯粒,而每个从事3D工作的人都需要芯粒,因此对标准化的需求非常强烈。整个行业利益一致,都希望确保为此制定出标准。实现这一目标可能需要一年多的时间,但之后你会看到该领域的进展。”
在制定标准的同时,合作也变得非常重要。Altair的Khemmoro表示:“半导体公司将越来越重视与系统公司建立牢固的合作关系。这些合作至关重要,因为许多芯片制造商并不完全了解他们的产品是如何集成到最终设备中的。在未来几年,这种团队合作将变得更加重要,尤其是系统设计师面临着不断创造更小、更高效产品的巨大压力。紧跟这些变化并做出相应的调整,对于保持竞争力和推动创新至关重要。”
在EDA领域中,与AI相关的很多话题都集中在验证方面。Cadence的Graykowski表示:“过去几年,我们看到AI验证领域取得了许多进展,这有助于优化回归测试,并缩小调试验证失败的范围。随着行业有时间对这些解决方案进行原型设计和完善,我预计我们将得到一套更优化的功能集,并且会看到更多采用,使这项技术融入主流验证流程。明年,最有可能取得进展的领域不仅限于回归优化测试方面,还包括帮助缩小覆盖率差距,并在更短时间内找出更多漏洞。自动化流程在分类和缩小调试范围以及确定可能的故障源方面具有很大的潜力。验证工程师将利用这些技术筛选数据,使他们能够跟上当今设计规模的发展。我还预计生成式人工智能将在明年得到更多应用。”
设计过程也将因AI得到提升。“印刷电路板(PCB)设计需要多种学科和技能,”Khemmoro表示,“因此,公司越来越多地在整个工作流程中采用自动化,从最初的需求分析和逻辑设计,到制造和组装。通过在设计过程中将AI与仿真相结合,可以加速设计决策速度,并显著缩短开发周期。为了进一步优化这一过程,对于汽车、航空航天和国防等产品生命周期较长的行业,现在正采用现场监控系统,以跟踪PCB性能,以及降低元件的额定值,将潜在问题直接反馈给开发团队。这些见解随后可融入PCB设计过程,进一步提高效率和可靠性。”
设计团队必须跨越越来越多的学科领域。Arteris的Nightingale表示:“许多设计的范围正在扩大,这意味着仿真也必须扩展,以涵盖光学、流体和机械效应,特别是在复杂封装中。一些市场还增加了其他要求,例如硬件级安全的新方法,包括加密验证和抗攻击性,以及芯片级符合ISO 21434网络安全风险管理标准。而可靠性方面则需要用于预测老化、电迁移和其他长期失效模式的工具。”
结论
总体而言,上述这些只是2025年行业将发生重大变化的部分领域。其中一些技术进行原型设计并推向行业的速度正在加快。这是前所未有的,也凸显了抢占先机的重要性。整个行业正处于一场巨大变革之中。
来源:王树一