摘要:该技术将由密歇根大学牵头的一个项目开发,该项目由美国国家科学基金会的 “未来半导体” 计划提供 200 万美元资助。该项目还包括来自华盛顿大学、宾夕法尼亚大学、劳伦斯伯克利国家实验室的研究人员,以及来自谷歌、惠普企业、微软和 Nvidia 四个行业合作伙伴的意
一种新的芯片连接系统可以通过可重构的光路而不是电线传输数据,从而帮助打破限制计算速度和当今人工智能模型发展的“内存墙”。
该技术将由密歇根大学牵头的一个项目开发,该项目由美国国家科学基金会的 “未来半导体” 计划提供 200 万美元资助。该项目还包括来自华盛顿大学、宾夕法尼亚大学、劳伦斯伯克利国家实验室的研究人员,以及来自谷歌、惠普企业、微软和 Nvidia 四个行业合作伙伴的意见和指导。
虽然如今的数据处理速度 比 20 年前提高了60,000 倍 ,但计算机内存和处理器之间的数据传输速度仅提高了 30 倍。由于存在滞后,数据传输速率已成为 AI 模型规模的瓶颈,自 1998 年以来,AI 模型每两年就会增长 400 倍。更快的通信对于解决 AI 性能的这些限制至关重要。
“我们提出的技术可以使高性能计算跟上快速增长的人工智能模型中大量数据的步伐,” 密歇根大学电气与计算机工程教授、该项目首席研究员梁迪表示。“通过芯片之间的光学连接,我们认为我们可以每秒传输数十兆兆位的数据,这比最先进的电连接快 100 倍以上。”
如今,数据通过焊接在单个物理封装(称为中介层,类似于主板)上的金属连接在多个内存和处理器芯片之间移动。数据可以在单个中介层内传输,也可以在互连服务器(称为计算节点)上的中介层之间传输。
金属连接硬连线到中介层,这限制了数据传输带宽和信号完整性,因为更快的电信号会以热量的形式损失能量,并可能对相邻连接产生电磁干扰。因此,无法将所有不同的处理器和内存芯片硬连线。如今,单个超级计算机芯片可以包含超过 900,000 个核心或单个处理单元,而且随着 AI 模型规模的扩大,这个数字还会继续增长。
“所有这些处理器都需要与大量内存进行通信,” 华盛顿大学电气与计算机工程教授、该项目联合首席研究员莫李 (Mo Li)表示。“控制整个封装内的通信非常重要。在我看来,光学连接将是未来唯一可行的解决方案。”
光比电子传播得更远,能够传输大量数据,同时能量损失更少,研究人员将利用这些特性设计新的中介层。光脉冲将通过中介层中称为光波导的折射通道在芯片之间传播。每个芯片上的接收器将数据重新转换为电信号,供计算机解读。
由于中介层中存在一种特殊的相变材料,波导网络还可以在制造过程中以及在计算机内部进行重新配置。当受到激光照射或暴露于电压时,材料的折射率会发生变化,这意味着光线在穿过波导时会向不同的方向弯曲。
“这有点像开路和闭路,” 宾夕法尼亚大学材料科学和电气与系统工程教授、联合首席研究员梁锋表示。“如果一家公司出售基于这项技术的芯片,他们将能够在不改变其他组件布局的情况下重写不同批次芯片和服务器上的连接。”
研究人员将设计一个流量控制软件,监控中介层哪些部分在任何给定时间需要通信,并进行必要的电压切换以动态创建理想的连接。
“改变连接使我们能够根据我们想要运行的 AI 模型,或者我们是否想要训练或运行模型来重新配置网络,” 计算机科学与工程副教授兼项目联合研究员Reetuparna Das说。
除了推进技术进步之外,该项目还将使密歇根大学的学生与行业合作伙伴建立联系,并提供宝贵的现实世界经验。
“这些联系让学生能够体会到设计快速发展的技术时所面临的现实挑战,”梁说。“教科书没有充分解决这些现代问题,因为发展速度使教科书无法跟上。获得相关技能的最佳方式是与行业合作解决他们关心的问题。”
专注半导体领域更多原创内容
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4014期内容,欢迎关注。
来源:科技新观点