从“俄罗斯谷歌”到欧洲AI Infra领导者:过去、现在、未来

360影视 2025-02-05 10:18 2

摘要:Nebius是总部位于荷兰阿姆斯特丹的全栈AI原生云平台领导者,提供大规模GPU集群和专为AI与机器学习高强度工作负载优化的基础设施。2024年12月,公司完成了由Nvidia和Accel领投的高达7亿美元战略股权融资,并获得超额认购。

Nebius是总部位于荷兰阿姆斯特丹的全栈AI原生云平台领导者,提供大规模GPU集群和专为AI与机器学习高强度工作负载优化的基础设施。2024年12月,公司完成了由Nvidia和Accel领投的高达7亿美元战略股权融资,并获得超额认购。

在GenAI Assembling算力主题活动的第二场炉边对话中,Nebius联合创始人兼CBO Roman Chernin来到现场,与观众分享了他对于GPU市场策略、基础设施如何适应后预训练时代、以及Nebius未来布局的关键看法。

随着近期DeepSeek等高效模型的出现,业界对算力需求的争论愈发激烈。 Nebius作为这一背景下的核心参与者,其视角也让这场讨论显得尤为重要。

对话人:

Thomas Luo|Co-founder and CEO, GenAI Assembling

Roman Chernin | Co-founder and CBO, Nebius

Thomas Luo:今天我们要与Nebius的Co-founder兼首席商务官Roman对话。Roman,很高兴邀请到你,这次美国之行感觉如何?

Roman Chernin:一如既往地紧凑。这次我几乎没怎么睡,部分是因为时差,部分是实在没时间睡觉。自从去年11月底以来一切都在快速发展—比如H100 GPU的价格已显著下跌。其实我在过去五天内参加了大约50场会议,每场都很有意思。

Thomas Luo:在我们正式开始之前,能否先向观众介绍一下Nebius的背景?当我描述Nebius时觉得有点难,它像是一个既古老又年轻的创业公司,还在纳斯达克上市了。你能分享一下它的故事,特别是从Yandex转变的那部分吗?

Roman Chernin:当然。在座谁知道Yandex?谁在今天以前听过Nebius?——看来后者少得多哈哈,我们在提升知名度方面还有很多工作要做。

这是一个独特且相当不寻常的故事。有些人可能知道,Yandex常被称为"俄罗斯的谷歌",但这种说法其实不全面。它其实更像是俄罗斯的谷歌、优步、Spotify和Netflix的集合体—一个与俄罗斯互联网密不可分的公司。

我刚开始负责系统管理时,Yandex无处不在。这是一家拥有尖端技术和高质量人才的出色公司。我在那儿工作了十多年,先后领导搜索、中小企业服务和地理服务部门。在此期间,我们一直怀揣着国际化扩张的雄心。我们相信不论在哪儿,Yandex都能证明伟大的事物是可以被创造的。

但在2022年2月危机爆发时,即便是最乐观的人也意识到局势将发生巨变。我们中许多人对冲突深感担忧,难以相信这实际发生了。也因此公司开始变化—首先是人员。员工和创始人面临艰难抉择:是留在原地还是另寻他处。这一过程漫长而复杂,就像Netflix剧集一样。从2022年2月到2024年7月,历时两年半。到那时,我们已完成原有资产的调整,让公司全面转型。

以前,Yandex是一家注册在荷兰、估值350亿美元的纳斯达克上市公司,拥有2万名员工。当转型最终完成时,停摆两年半的纳斯达克交易得以恢复。而在此期间,持有Yandex股票的投资者看到他们的持股被冻结。当我们终于在2024年10月完成分离时,纳斯达克在某个周三通知我们下周一将恢复交易。那时我们正在进行融资,于是不得不告诉潜在投资者:"抱歉,但现在你们是在投资一家上市公司。"

这不是首次公开募股,而是重新上市,这在公开市场历史上从未发生过。Yandex的股东最初投资的是一家俄罗斯互联网公司,但现在我们是一家专注于完全不同市场的非俄罗斯、非互联网公司。幸运的是,市场反应积极。我们在12月完成了融资,由Accel Ventures领投,Nvidia作为战略投资者加入。所以现在我们在这里。我常把我们描述为一家身穿上市公司外衣的B轮创业公司。

Thomas Luo:听起来很不可思议。从我的角度来看,这个故事最引人注目的地方之一是,在这两年半时间里,你们成功保留了核心工程团队和管理团队,据我所知,你relocated到了以色列,其他人则迁往荷兰、美国或其他地方。同时,你们还在全球积极招募人才。

你们公司正在建立真正的全球化布局—你们在美国聘请了新的CMO,其他产品和工程岗位也在欧美各地落实。感觉Nebius已经在以一个完全全球化的公司模式运营。我有两个问题:首先,Nebius是如何做到这一点的?其次,为什么你们决定将GPU云服务作为从Yandex分离并建立新身份的关键领域?

Roman Chernin:回答你的问题,在2022年和2023年,我们专注的主要项目不是产品或市场,而是relocating 1300个家庭。我们的首要任务是帮助他们安顿下来,重启生活。当我们开始这个过程时,并没有明确的公司发展计划。但我们知道我们拥有一项独特的资产:世界级的工程人才。

这些人此前已经建立过hyperscaler(超大规模服务提供商),知道如何高效且有效地进行规模化运营。我们意识到,即使我们没有资金、数据中心或业务,这些人才是我们最宝贵的资产。我们知道可以围绕这个核心建立新的事业。

然而,俄罗斯人普遍不擅长销售。虽然我们拥有卓越的工程人才,但要将其转化为成功的业务和优秀的产品需要不同的技能组合。我们专注于通过在全球招募业务开发、销售和产品管理等领域的最佳人才来补充我们的工程优势。

我们所在的GPU云服务业务,其客户和人才自然高度集中在美国。因此,建立强大的美国业务成为重中之重。我现在的职责是在这里建立一个世界级的团队,这个团队既要人才出众,又能吸引更多顶尖人才加入。我们正在全力实现这一目标。

当我们最初开始建立美国业务时并不容易。许多人持怀疑态度—为什么一群总部在荷兰的俄罗斯人想要建立全球化业务?幸运的是,一些具有远见的勇敢者愿意给我们机会,随着时间推移,事情变得越来越容易。每周、每月,越来越多的人理解我们是谁、在做什么。现在,当新的人才加入时,他们面对的是来自不同背景的团队—不仅仅是像我这样带着浓重口音的俄罗斯人。这真正在成为一家全球化公司,这就是我们的发展方向。

Thomas Luo:很有意思。那么,为什么选择GPU?

Roman Chernin:这其实不仅仅关于GPU—而是关于AI。Yandex一直是一家AI驱动的公司。我们开发深度技术和智能驱动的产品,搜索业务也一直处于机器学习和AI的前沿。所以当我们创立Nebius时,我们知道要围绕AI来建设。

我们也很早就意识到不会成为面向消费者的B2C公司。相反,我们决定为开发者创造产品。我们的想法是,在Yandex积累的专业知识—构建hyperscaler和大规模系统—可以帮助我们服务其他工程师和开发者。我们将自己定位为一家"技术公司"或面向技术人员的公司。

我们的独特之处在于拥有罕见的专业知识组合。我们有知道如何建设物理基础设施的人才,比如高效的数据中心;有设计和构建硬件的专家;还有出色的软件工程师—大多数团队都有软件背景。

当我们看到计算能力需求的增长和AI的快速发展时,我们意识到我们的人才和资产自然而然地让我们适合进入这个市场。我们别无选择—这是最合理的前进方向。

但提供GPU算力并不是我们的全部长期愿景。我们的使命是为那些创造突破性AI产品的开发者和研究人员构建卓越的AI基础设施。这是我们的核心焦点。

Thomas Luo:你很好地指出了前Yandex团队—现在的Nebius团队—在业务扩展方面的专长。这就像你们在俄罗斯是全能型选手。你们的核心优势之一似乎是扩展业务和运营。正如你提到的,你们的使命是支持AI从业者、研究人员和开发者构建和扩展他们的AI产品。你是否认为加速这些产品的扩展过程也是你们使命的一部分?

Roman Chernin:是的,但这不是关于一般意义上的业务扩展—不同业务有不同需求。我们专注于构建可扩展的技术平台。这是关于创建能够高效运营并有效服务客户的基础设施。这是我们正在建设的核心。

Thomas Luo:好的,详细说说你们在美国市场的策略。

Roman Chernin:我们专注美国的主要原因是市场在这里。我们跟随需求。我们在美国做的是扩展基础设施。我们已经启动了第一个数据中心,很快就会启动第二个和第三个。今年我们的大部分部署都集中在美国。

首要任务是扩展基础设施。其次是直接与客户合作—不仅是销售,还包括建立客户成功和服务团队,确保客户成功。另一个我们正在解决的挑战是知名度不足。几个月前,没人听说过我们。但现在,GPU云业务的专业人士开始认识我们,客户群体中的认知度也在提升。这是一个渐进的过程,但这里的团队做得很出色。我相信我们正在正确的轨道上,将在这个市场上变得更加显眼并站稳脚跟。

Thomas Luo:但你们如何与CoreWeave等这个领域的老牌企业竞争?他们也得到了Nvidia的支持。有Nvidia作为投资者并不代表一定能保证成功,对吗?

Roman Chernin:当然不能。在以色列,我们称之为"kosher stamp"—这只是一个认可的标志,而非成功的保证。要"真正成功"需要建立业务。

在我们融资路演时,我们强调了三个核心信念:

首先,计算需求会持续增长。对此有两种理论:一种将计算比作早期互联网时代的光纤—基础设施最终会达到平稳;另一种将计算比作能源—在人类历史的每个阶段,人们都会消耗所能生产的所有能源。我们赞同后者。计算能力越多,我们创造的产品就越先进,导致更广泛的应用和持续增长的计算需求。

其次,我们相信市场将长期保持竞争性。虽然谷歌、微软和OpenAI等大玩家拥有近乎无限的资源优势,但开源的力量和新玩家在细分领域的涌现让我们相信竞争会持续。竞争市场不仅有利于商业,也有利于人类。如果AI领域被垄断,将对创新和整个社会构成重大风险。

第三,在这些条件下,我们问自己:作为Nebius,我们是否有权利成功并成为重要玩家?我们的答案是肯定的。我们相信我们独特的资产和能力组合让我们具备优势。

为什么?因为建立成功的基础设施需要技术和资本的结合。这是一个高度资本密集型业务—部署新基础设施需要数十亿资金。得益于我们的转型过程和现在是上市公司的事实,我们很幸运拥有充足的财务资源。我们还拥有有价值的资产,比如在Peakhouse的重要股份,我们认为它具有巨大潜力。

除了资本,你还需要技术。这不是一个简单地购买硬件、部署它就能开始赚钱的业务。它要复杂得多。例如,计算价格下降实际上对我们有利,因为我们有信心能比市场上许多玩家运营得更有效率。

我们的优势在于资本、人才和技术专长的结合。与其他新兴云服务提供商不同,我们大量投资软件开发,构建强大的平台而不是仅提供物理基础设施。这种方法使我们与众不同,并为长期成功奠定基础。

Thomas Luo:有种观点认为在预训练后时代,GPU变得不那么重要了。这也是价格下跌的原因之一。你同意这个观点吗?

Roman Chernin:我不这么认为。我认为价格下跌更多是因为Nvidia解决了供应链问题。此外,这种下降是由市场动态驱动的—客户对承诺变得更谨慎和理性,许多人避开旧一代GPU转而选择新一代。这是一种经济趋势,而不是需求减少的反映。

从在建数据中心的规模来看,计算需求显然没有放缓。实际上,我认为我们正在进入一个令人着迷的阶段,重点从产品开发转向产品应用。

训练是关于创造产品,但真正的成功来自于人们开始使用它—这就是推理变得关键的地方。举个例子,我们与开发视频模型的Luma Labs合作。在去年夏天他们取得巨大成功的发布之前,大约90%的算力用于训练,只有10%用于推理,因为他们仍在构建模型,使用量很小。但在他们推出广受欢迎的"Dream Machine"版本后,两周内总计算需求增加了5-7倍,推理占用了80%的算力。这种转变发生是因为他们的产品从开发阶段转向了实际应用。

我们仍处于AI产品应用的早期阶段,但随着使用量增长,我们将看到计算需求的大幅增加。使用将推动对更多GPU的需求—不是为了训练,而是为了推理。场景正在演变,我们将看到更全面的系统融入商业、日常生活等领域。关于市场对算力的需求我并不担心。

Thomas Luo:让我们谈谈端侧AI。在之前的讨论中,提到了计算能力从云端向端侧的转移。你如何看待这一趋势对GPU云服务的当前基础设施、定价模式或商业模式的影响?从历史上看,GPU服务提供商—有时被称为GPU农场—建立大型集群并直接向开发者提供算力。这种模式会演变吗?

Roman Chernin:我认为这种演变很自然。即使在GPU时代之前,我们就看到移动设备变得越来越先进,计算能力越来越强。但尽管如此,云计算需求仍在增长,因为随着设备能力的提升,应用的复杂性也在提高。

我相信端侧AI也会出现类似模式。确实许多应用会在设备上运行,但这不会完全取代云计算。相反,我们需要一种新型基础设施—我称之为边缘云。可以将其视为CDN(内容分发网络)之后的下一步。

我们需要高度分布式的计算基础设施来处理低延迟场景,确保资源靠近终端用户。实时视频、交互式游戏和其他对延迟敏感的应用将需要靠近客户的基础设施。然而,这并不意味着端侧会取代云;更多是关于用例的日益复杂和多样化。每种场景都需要其量身定制的基础设施,边缘和云将共存以支持这种复杂性。

Thomas Luo:现在想提问前最后一个问题。从更长远来看,你如何看待模型性能和计算需求之间关系的演变?这包括大语言模型、小型模型和更复杂的AI应用或代理。这种演变可能如何影响GPU服务市场?

Roman Chernin:我认为在未来五年左右,我们将看到专门针对特定用例设计的专用硬件取得重大进展。模型将变得更加多样化—不仅是规模,还包括类型和功能。

目前,许多工作负载在现有硬件上的优化都很差。我们依赖少数标准芯片设计,这与日益增长的工作负载种类并不完全匹配。未来,我预计会看到硬件更专业化,这将导致生态系统不同层面的竞争加剧。

云基础设施日益增加的复杂性将需要供应商之间更多的协作,以及采用更多样化的解决方案。这是我们如此坚信投资平台的原因之一。如果市场保持像今天这样简单—标准GPU和参考设计集群—Nvidia可以通过构建所有必要的软件轻松主导。但如果未来涉及更复杂和多样化的生态系统,产品和用例差异显著,那么灵活、强大的平台的价值将不容否认。

这就是为什么我们专注于创建一个能适应这种复杂性的平台,为客户提供在更具竞争性和专业化环境中蓬勃发展所需的工具和效率。

来源:硅星人

相关推荐