摘要:构成现代芯片基础的硅晶圆极其敏感。在制造过程中,许多步骤都可能引入缺陷。为了简化这一流程并确保尽早发现缺陷芯片,IBM 研究院的科学家们正在提出新的算法,以识别整个芯片制造流程中的缺陷来源,并挑战长期以来关于控制硅晶圆工作流程的假设。
IBM 研究科学家正在使用人工智能来追踪硅晶片加工过程中的缺陷和低效率。
构成现代芯片基础的硅晶圆极其敏感。在制造过程中,许多步骤都可能引入缺陷。为了简化这一流程并确保尽早发现缺陷芯片,IBM 研究院的科学家们正在提出新的算法,以识别整个芯片制造流程中的缺陷来源,并挑战长期以来关于控制硅晶圆工作流程的假设。
IBM 研究院半导体数据科学主管 Tsuyoshi Ide 领导的团队将在 5 月 5 日至 8 日于纽约州奥尔巴尼举行的先进半导体制造大会 (ASMC) 上发表三篇关于此项研究的论文。Ide 及其团队正在开发的 AI 算法依赖于 IBM 的SiView和Intelligent Fab半导体制造数据平台。
晶圆制造包括蚀刻和沉积等十几种不同的工艺类型,其中一半以上的工艺每层必须重复40到100次,这意味着制造一个芯片可能涉及1000个或更多步骤——每个步骤都可能带来缺陷。质量控制检验员使用显微镜根据缺陷的密度来量化硅片质量的好坏。
然而,一旦出现问题,追踪故障机床或确切的错误来源可能极其困难。每个步骤的结果都取决于之前所有步骤的保真度,因此多变量误差可能会累积起来,而无法确定单一的明确来源。
井出将硅晶圆的历史比作人的一生:“人生早期的一个小小的失误,可能会极大地影响你的人生轨迹。”他说道。同样,晶圆生产过程中某个环节的制造缺陷,也可能对后续生产造成难以估量的影响。“由于晶圆生产过程的连续性,分析其根本原因非常非常具有挑战性。”井出补充道。
目前没有可用的解决方案,因为这不是一个标准的机器学习问题。“机器学习擅长在给定一组复杂输入的情况下进行预测,但这有点像逆问题,”Ide 说。IBM 研究团队并不是根据一系列输入来预测下一步或最终结果,而是尝试根据最终输出来追溯单个步骤。实际上,唯一的方法是反复制造晶圆,采用不同的条件,然后应用简单的统计分析来找出缺陷发生的位置——换句话说,就是科学方法。除了最大的芯片制造商之外,这对其他所有制造商来说都是完全不切实际的,但即便如此,这种半手动方法也需要庞大的研究人员和管理人员团队,因此它突破了实用性的极限。
作为逐片生产晶圆的替代方案,Ide 和他的团队正在尝试其他方法。
在他们的第一篇论文中,该团队试图确定哪些测量值与特定类型缺陷的发生最相关。为此,他们计算了每个测量参数的归因分数。每种加工设备处理的物理过程截然不同——掺杂、抛光去除粗糙度、研磨去除材料等等——因此很难比较晶圆生产过程中不同部分的数据。因此,他们使用所谓的在线测量,通常在主要工序完成后立即进行。
这些在线测量可以作为每个步骤保真度的代理,并且基于它们,团队训练了一个分类器来计算每个项目的责任分数。
图中显示,在处理时间线的某个点,模型预测到出现不良晶圆的概率会大幅上升——简而言之,就是“不良”预测。这项分析意味着两件事。首先,时间戳在某种程度上与该缺陷相关;其次,在最终测量的几个月前,该晶圆就被预测为不良晶圆。“所以,如果你知道这个事实,你就可以停止这个过程,”Ide说道。
他们的评分算法名为“轨迹夏普利值”(Trajectory Shapley Value),是对博弈论中著名的夏普利值算法的全新扩展,旨在为工程师提供一些优先级建议。有了这个特殊的模型,井出和他的同事们无需猜测机器究竟发生了什么,只需识别出问题发生的时间即可。
在第二篇论文中,他们使用了另一种类型的模型。这种基于轨迹的预测模型并非基于好坏分类,而是预测实际缺陷密度,并试图找出哪个工序的责任最大。
同样,责任分数也是计算出来的,但这次它们来自工艺属性——在整个制造过程中收集的晶圆质量数据。但是,如何将工艺属性转换为可以分析的数字呢?为此,他们提出了一种名为 proc2vec 的技术,这种方法的灵感来自自然语言处理中著名的word2vec技术。就像转换器无需明确的语法知识即可自动分析单词之间的相互依赖关系一样,proc2vec 旨在自动捕获硅片工艺和在线测量之间隐藏的依赖关系。
例如,该团队利用 IBM 奥尔巴尼研究中心的晶圆历史数据证明,整合这些相互依赖关系可以显著提高缺陷预测的准确性。他们基于轨迹模型构建的新归因方法成功识别了由异常长的等待时间导致的潜在异常过程。
该团队的第三篇论文针对的是晶圆厂中的在制品(WIP)泡沫,这种泡沫类似于晶圆批次的交通拥堵,也就是多组晶圆同时进行制造流程。晶圆批次在晶圆厂的轨道上以不同的速度移动,因此可能会出现令人惊讶的随机性。
为了了解晶圆运输如何造成拥堵,晶圆厂使用先进的半导体制造模拟器 (ASMS),就像城市规划中的交通模拟器一样。运行 ASMS 需要大量的计算,因此多年来一直使用一种简化的模型,称为排队论。然而,据 Ide 所说,排队论可能使用了过于简单的假设,这可能会低估晶圆厂的真正多变性。
该团队使用一种名为“霍克斯过程”(Hawkes process)的替代数学模型(该模型考虑了事件历史),分析了 IBM 奥尔巴尼研究中心晶圆历史数据。他们发现,这种方法(使用名为“赤池信息准则”(Akaike Information Criterion,AIC)的统计模型选择标准进行评估)与排队论假设相比,能够更好地拟合预测批次到达时间与实际时间。
他们使用的一个衡量指标是“X 因子”,即实际周期时间与理想周期时间的比值。理想周期时间是指假设整个晶圆厂只有一块晶圆的情况下,最短的加工时间——无需等待,只需移动和加工。“所以 X 因子通常远大于 1,通常是 10 或 15,”井出说。
他们发现,某些设备位置上批次到达时间的不均匀性会显著增加晶圆的完成时间。根据他们的模型,如果平均设备利用率得到控制,X因子可能会比传统的排队模型预测的要大得多。
这表明,至少对于半导体制造而言,传统的基于排队理论的在制品分析需要修改。本文指出了现有方法的问题,但并不一定提出解决方案。不过,它确实表明霍克斯模型更为有效。
这项工作大部分尚处于早期阶段。在此过程中,团队发现了一个主要限制:我们仅掌握了有关工艺参数的肤浅信息。为了解决这个问题,IBM 研究团队计划在未来的工作中融入基于物理的信息。
从长远来看,他们的目标是将这些经验和模型应用到实际生产线中,以提高未来晶圆制造的质量。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!
来源:半导体产业纵横一点号