摘要:虽然制造出能够擅长多种事情的机器人(大多数当前只擅长重复做一件特定的事情)是古德温努力的重点,但他表示,当时在英国牛津机器人研究所进行研究时,他的兴趣不再是机器人能多好地拿起杯子,而是更多地关注扩展定律。
2022 年,Fractile 首席执行官 Walter Goodwin 博士试图打造“通用机器人大脑”。
虽然制造出能够擅长多种事情的机器人(大多数当前只擅长重复做一件特定的事情)是古德温努力的重点,但他表示,当时在英国牛津机器人研究所进行研究时,他的兴趣不再是机器人能多好地拿起杯子,而是更多地关注扩展定律。
古德温花了四年时间研究大型视觉和语言人工智能模型,这些模型通过从互联网上抓取的图像和文本进行训练,古德温说,他看到了缩放定律是如何“震撼人工智能世界”的,特别是在模型训练方面,以及增加基础模型训练运行的训练失败次数将为该模型的工作方式带来确定性的改进的想法。
古德温说,当时他是某个团队的一员,该团队开始推动这样一种观点:随着基础模型不断渗透到我们的生活,我们对人工智能的更广泛的看法将不可避免地发生转变。
他解释说,从 2011 年到“大概 2020 年”,每个问题都有自己特定的神经网络,这意味着公司会收集数据集,找到正确的神经网络架构,然后针对特定应用进行训练,直到它变得足够好。
“在我攻读博士学位的最后阶段,我越来越相信,[特定应用的神经网络] 将被这种‘万能’人工智能模型所取代,这种模型仅需大量数据进行训练,就能很好地推广,”古德温说。“我在机器人技术中看到了这一点,我可以看到同样的事情将开始发生在语言和视觉领域。
“而当你实现这种转变时,人工智能的重大问题就不再是:‘我们如何训练一个稍微好一点的模型’;它实际上不再与训练有关,而是更多地转向:‘如果我们要以如此大的规模运行这一小组模型,我们实际上如何以可持续的方式做到这一点?’”
考虑到这一点,古德温重拾电气工程专业,成立了 Fractile 公司来回答这个问题:“如果我们正走向一个大多数计算能力都集中在推理上的世界,那么我们当前的硬件是否适合这一目的?”
对于他创立的芯片公司 Fractile 来说,答案是肯定的“不”。
人工智能推理是你最好的新朋友
尽管在过去几年中,训练一直主导着人工智能讨论,但最近各种规模的公司都公开宣布放弃训练人工智能模型,转而专注于计算密集程度较低的推理,简单地说,人工智能模型使用经过训练的模式来做出预测。
在 10 月份微软 2025 年第一季度财报电话会议上,首席执行官萨蒂亚·纳德拉 (Satya Nadella) 表示,公司有望通过 AI 推理创造 100 亿美元的年收入,因此,公司拒绝了使用其 GPU 进行训练的请求,“因为我们对推理的需求太大了”。
Goodwin 表示,基于冯·诺依曼架构(大多数通用计算机的基础)构建的平台充满了受内存限制的阶段,这会导致延迟成本权衡。在训练模型时,这不是什么大问题,因为重点是吞吐量,而不是延迟。然而,当涉及到推理时,用户希望它能够快速完成,他称之为“推理时间概念”——“[OpenAI 的] o1 是世界上最好的模型,但你必须等待 15 秒才能得到答案。”
古德温说,在过去两年的大部分时间里,Fractile 一直在与人们讨论推理扩展这一概念。
“我们在训练中制定了缩放定律,即增加训练浮点数,但推理缩放表明,AI 性能实际上与两件事有关,”他解释道。“你能把基础模型做得有多好,以及如何使用更多计算来获得更好的 AI 结果。”
为了实现这些更好的结果,这家总部位于英国的公司一直在开发使用内存计算的芯片,这种方法允许处理器直接在计算机内存中运行计算。古德温表示,通过采用这种方法,该公司希望制造出能够降低功耗并提高性能的硬件,同时实现更快、更便宜的大规模推理。
2024 年 7 月,Fractile 脱颖而出,从 Kindred Capital、Nato Innovation Fund、Oxford Science Enterprises 和多位天使投资人共同领投的一轮融资中筹集了 1500 万美元的种子资金,其中包括企业家 Stan Boland,他曾是 Arm 和 Acorn Computers 的高管,创建并出售了多家芯片和人工智能公司。
自此次采访以来,该公司已将前英特尔和 VMware 首席执行官帕特·基辛格 (Pat Gelsinger) 添加到其支持者名单中。基辛格于12 月从这家芯片制造巨头“退休” ,并将在公司发展过程中为公司提供建议。在宣布其投资的LinkedIn 帖子中,他称赞 Fractile 解决推理问题的“激进方法”。
虽然 Fractile 尚未将其产品推向市场,但该公司相信,其硬件最终将能够以比 Nvidia GPU 快 100 倍、便宜 10 倍的速度运行大型语言模型,并且每瓦能耗性能比目前市场上任何其他 AI 硬件高 20 倍 - 尽管到它推出时,竞争对手的硬件已经取得了长足的进步。
古德温指出,虽然有少数公司也在探索更多片上内存的概念,但 Fractile 想要做的不同的事情是消除对单独的内存库和处理器的需求,从而使公司能够更好地解决古德温认为的目前计算扩展中最关键的限制,即功率。
“[使用 Fractile 的方法] 你能实现的效果远远高于你仅有近内存计算部件时所实现的效果。虽然 [近内存] 有利于提高带宽,但它不会提高每瓦 TOPS,因此你仍然有一个最终会受到热限制的芯片。长期以来,我们在扩展这些系统方面一直受到热限制。
“[对于 Fractile] 来说] 就是要构建一个系统,使我们能够以更快的速度大规模运行这些超大型模型的推理。这意味着每秒产生更多令牌,每个用户每秒输出更多单词,同时还能以更便宜的方式完成所有这些。”
与大多数专注于内存计算的公司迄今为止大多将硬件部署在低功耗边缘设备不同,Goodwin 表示,Fractile 令人兴奋的是,它是唯一一家试图将这项技术引入数据中心规模工作负载的公司之一。
“这是我们所做的事情比较独特的地方之一,”他说。
然而,尽管公司雄心勃勃,古德温解释说,Fractile 一直小心避免同时重新发明太多东西,因为重要的是,公司不仅要实现良好的产品上市时间,还要扩大生产规模,并遵守现有半导体制造规则。
“就我们为内存计算设计的电路以及我们对架构和软件的思考方式而言,Fractile 所做的事情可能有些激进,但从最低层级来看,从硅片设计的角度来看,我们在台积电工艺节点上制作测试芯片,我们的生产芯片将在标准代工工艺的尖端 FinFET 节点上制作。从这个意义上说,从可制造性的角度来看,我们正在寻求尽可能正常化。”
推理:零十亿(zero-billion)美元的市场
考虑到将硅片推向市场的成本——古德温说,单是一套掩模版的成本就高达 1000 万美元——该公司生产的第一批大规模硅片将是其第一个产品。
Fractile 一直在开发原型测试芯片,但迄今为止,这些设计只在计算机模拟中进行了测试。虽然 Goodwin 拒绝透露公司将产品推向市场的预计时间表,但 Goodwin 表示,预计在未来几个月内完成流片。
当被问及半导体行业是否正处于一个转折点,以及我们是否会开始看到一种分裂:一边是一直占据主导地位、凭借久经考验的芯片架构取得巨大成功的既有企业,另一边是热情的初创公司,认为可以找到新的、更好的方法,古德温对整个事件相当乐观。
“当一个非常大规模、可以说是新的工作量迅速出现时,我想我们今天可以通过这些非常大的模型推断出这一点,我认为对于初创企业来说,令人兴奋的是这些全新的市场正在涌现。
“这是黄仁勋的名言:‘零十亿美元的市场。’就 Fractile 而言,我认为当今极快的数据中心规模推理在某种程度上是一个零十亿美元的市场。没有人能够满足这种需求,也没有现成的硬件。Fractile 正在生产这种硬件,所以我认为我们兴奋的是进入这个全新的领域并创建一整套我们可以实现的应用程序。”
古德温表示,过去六个月对 Fractile 来说是令人兴奋的,他向DCD透露,截至 2024 年 10 月,该公司刚刚在布里斯托尔开设了一个新办事处,并希望在目前 23 名员工的基础上再增加 10 或 15 名员工。
“实际上,除了我们已经讨论过的硅片之外,我们目前正在研究的关键问题是,Fractile 所研究工作的很大一部分完全是在软件层。
“因此,就我们希望服务的市场而言,很明显,为了提供交钥匙解决方案,需要做的就是拥有一个带有软件堆栈的硬件平台。”
来源:智慧芯片