对话侯晓迪:泼冷水大王的赤子之心

360影视 国产动漫 2025-03-12 16:09 2

摘要:这一教条以渐近承诺(asymptotic promise)诱惑了人工智能行业:只有通过呈指数级增长的资源才能确保进步,而没有这些资源就不可能取得进步。

自动驾驶领域也会发生DeepSeek式剧变。

作者|苏霍伊

编辑|王博

科技行业最昂贵的假设是什么?

侯晓迪的回答是资源中心主义教条(resource-centric dogma)。

这一教条以渐近承诺(asymptotic promise)诱惑了人工智能行业:只有通过呈指数级增长的资源才能确保进步,而没有这些资源就不可能取得进步。

渐近承诺可以通俗地理解为 “规模越大,表现越好” 的保证,也可以理解为是Scaling Law(规模法则)的概括。

但侯晓迪一直以来的观点是:Scaling Law不是答案,坚决反对唯Scaling Law主义。

侯晓迪是自动驾驶卡车公司Bot Auto的创始人、CEO,在创办Bot Auto之前,他曾是“自动驾驶第一股”图森未来的联合创始人,并先后担任公司的CTO和CEO。

扩展数据规模、增加模型参数、提升计算能力……这套“法则”他再熟悉不过,但是他一直以来呼吁的是“不要盲目堆数据、GPU和车队规模”。

以前我讲的理论身边人都不相信。还坚持认为是“数据量不够”,这让侯晓迪很痛苦。但DeepSeek-V3&R1出现后,情况变了,有的人开始想起来:“晓迪,你当年好像也这么说过。”

在他看来,DeepSeek不仅颠覆了AI行业,还预示着其他以资源为中心的技术领域也将发生类似的剧变,尤其是自动驾驶行业,“DeepSeek的成功表明我们正处于范式转变的风口浪尖,这种转变可能会在一夜之间改写游戏规则。”

在DeepSeek团队身上,我们看到无情的务实主义和对效率的大胆追求,这些同样出现在了侯晓迪身上:作为现实主义者,他以近乎严苛的理性拆解行业迷思;作为理想主义者,他将“爱与勇气”视为技术变革的底层精神。

这种“矛盾”,直观地体现在侯晓迪的创业经历中。

当整个行业都在向数据驱动、大模型军备竞赛倾斜时,侯晓迪却走向了另一条道路——坚信认知能力比数据量更重要,坚信科学工程化才是正道。他可以滔滔不绝地讲述自动驾驶、AI、大模型的核心问题,却从不使用“高大上”的术语。他拒绝讲故事,只想走自己的路。

创业不是一场被资本驱动的豪赌,而是一个工程师对技术最极限的践行。”侯晓迪说。

侯晓迪与DeepSeek有许多“共鸣”,而这些“共鸣”也终因DeepSeek而被知晓。

本文,「甲子光年」对话Bot Auto创始人、CEO侯晓迪。

甲子光年:DeepSeek火了之后,你有什么感受?

侯晓迪:我好不容易等来了“拨云见日”时刻。

甲子光年:拨云见日?之前你不是被认为是科技行业“预言家”?

侯晓迪:以前我讲的理论身边人都不相信。他们坚持认为“自动驾驶系统的能力不够是因为数据量不够”,这让我很痛苦。但现在情况变了,他们开始想起来:“晓迪,你当年好像也这么说过。”

甲子光年:看来“预言家”身份坐实了。

侯晓迪:更深层次的开心是,世界终于出现了一些纠偏机制,让我们能更顺畅地按自己的节奏开发系统。如今,我们更容易获得应有的认同和肯定,尤其体现在融资方面。我不在乎他人的夸奖,但能让公司融资压力变小是好事。

甲子光年:我看你在LinkedIn上写一篇文章夸DeepSeek,并认为“DeepSeek的成功为以资源为中心教条敲响了警钟”,你是在DeepSeek上找到了共鸣吗?

侯晓迪:首先说明,我们应不偏不倚讨论DeepSeek的价值。

我发现有些人在把“科学玄学化”,如果一个人的资源很多,数据也很多,那他就会愿意相信“资源制胜论”。这也是我常说的“用战术勤奋掩盖战略懒惰”。但是资源制胜论本质上只是个信仰,相信一篇paper里面一个观测在更广场景、更大规模仍然适用。这不是科学,是玄学。

而DeepSeek是“科学工程化”。像Quantization、Multi-Head的预测优化,都是工程细节,但他们做得很好,说明团队执行力强。他们的执行基准不是靠模型大、GPU多,而是靠精细的工程优化把性能推到极致。

这一点和L4级自动驾驶很像,L4也是在工程优化上做了大量细节工作,而不是依赖单一的核心突破。两者的共鸣点在于,成功更多是工程驱动,而非基础理论创新。

甲子光年:把“科学玄学化”的是那些堆数据和算力的公司吗?

侯晓迪:是的,科学玄学化是结果。是多个角色共同造成的。比如,能力平庸但身居高位的中层管理人员,短期胜利对他们至关重要。比起搞有风险的创新,这种有投入就有业绩的项目肯定是最好的。

再比如,一些公司的高层,不关心技术,只关心融资。他们不在乎事情本质和真实发展规律,只要一个能说服金主的故事。

甲子光年:金主就没责任么?

侯晓迪:当然金主也有责任,都说自己是 “风险”投资人,但绝大部分人投资人最喜欢的肯定还是这种基于共识的“无风险投资”。

这就会出现“回音室效应”(Echo chamber),即互相放大的机制。比如八个投资人投向同一方向,彼此交流时会强化、统一观点,“我觉得Scaling Law很有用”“俺也一样”。这样的人多了,慢慢就形成了不可忽视的共识。

图片来源:电视剧《三国演义》

甲子光年:这样形成的共识会造成怎么的后果?

侯晓迪:Sometimes the biggest risk isn't betting against the consensus, it’s betting with it.用中文表达就是,有时候,最大的风险不是与共识对赌,而是与之同赌。

这种共识非常可怕,因为造成共识的人是决策者,但他们未必具备技术前瞻性。

甲子光年:你认为DeepSeek能做出正确决策的原因是?

侯晓迪:组织文化。我经常说的一句话——工程问题永远是大量的小问题,而非小量的大问题。

要解决大量小问题,就不能指望有“救世主”通宵达旦数月写出一篇发现世界真理的论文,这只是科幻小说情节。真正的开发是大量的人每天在做微决策,组织的艺术就是让有这些对“微决策”有决策权的人——未必是CEO或CTO,能自然而然地做出正确决策。

甲子光年:那健康的组织文化是怎么样的?

侯晓迪:要保持理性乐观,凡事基于事实和逻辑,去辩论去挑战,这样才能看的出来他人玄学化的东西,并进而把它们一个个的工程化解决。

甲子光年:哈佛教授Graham Allison曾发文称,DeepSeek的关键研发成员潘梓正曾是英伟达的实习生,他是“美国失去的超级人才”,你怎么看?

侯晓迪:我并不认同“某个人才流失是美国的损失”这种简单化的说法。真正决定成败的,是组织的纲领和执行力。组织的行动纲领,决定了个体的产出。如果一个公司的GPU资源充足时,谁还会去优化计算?标注数据管够时,谁还会研究自监督学习(Self-Supervised Learning),谁还会想去掉监督微调(Supervised Fine-Tuning)?

伟大的组织,关键在于敢于反常识地走不同的道路,并坚定执行。只有在逆境中坚持,才能赢得真正的胜利。

甲子光年:2月28日,OpenAI发布了GPT-4.5,这次他们主打“EQ(情商)”,你觉得OpenAI是在用情商掩饰模型能力突破有限吗?

侯晓迪:GPT-4.5证明Scaling Law又一次撞墙了。作为常年实名反对泛化Scaling Law的人,最近频繁目睹撞墙事件。讲实话,我是欣慰的。

我认为OpenAI开始讲EQ的故事是无奈之举,实际上他们并没有真正打算去定义EQ,连个正经框架都没有。OpenAI团队装也没装出来自己在EQ上有所突破的样子。

甲子光年:你是加州理工学院计算与神经系统专业博士,理论上对AI的EQ有发言权。

侯晓迪:我看到标题时,对OpenAI讲EQ这件事是期待的,但看完后感觉被戏弄了。其实挺可惜的,为什么做戏不做全套呢?EQ是理解认识“智能”的重要窗口,它也是个可以被科学测量的客观度量。

甲子光年:那么OpenAI应该讲什么内容,才更符合你的期待?

侯晓迪:EQ不应仅指个体的情绪管理,而应涉及对他人情绪的理解与反馈。真正的EQ涉及人的情绪认知和调节能力,而不仅仅是“说话得体”。但是现在OpenAI所强调的EQ,更像是一个外行的概念,实际上只是为了让模型能更“圆滑”地回应用户,而非真正衡量情商。

关于EQ,我们可以让大模型来测谎,分析情绪反应,甚至通过临床试验验证模型在心理辅导中的作用。EQ的研究应围绕人的行为展开,而不是作为一个概念随意包装。如果沿着这个科学的方向发展,是大有可为的。

甲子光年:但OpenAI的演示中并没有这么做。

侯晓迪:这本是一个值得深入研究的方向,也是我的专业领域——意识研究。

这件事属于心理物理学(psychophysics)的范畴。作为一个长期研究这一领域的人,看到他们以如此随意的方式处理这个问题,真的很难接受。真正要做EQ,就应认真对待,承认这是一片未知领域。

甲子光年:你觉得OpenAI的态度不真诚?

侯晓迪:如果他们真心想探索这个方向,至少可以组织几位研究员,花几个月时间做一些基础研究,初步定义一个Benchmark(基准测试),这种Benchmark应该以人类社会的福祉为目标。

我们不该局限于如何让大模型成为“小镇做题家”,堂堂正正的对大模型提出empathy/social skill(同理心/社交能力)等指标的定量研究,这才是科技向善的体现。

甲子光年:智能的本质是什么?

侯晓迪:智能的本质是多维度的,仅凭数学竞赛满分就认定实现了AGI,这是无法被接受的。

比如多任务测试(Multi-test)。文字处理能力也分多个方面,如摘要、语法纠正等,智能是由大量任务的集合刻画的。情感交互任务的集合及其表现与人类标准的接近程度,才真正有价值。

再比如,大模型能否通过测谎仪?能否感知他人情绪波动?能否像心理医生一样,在交互中识别病理现象或异常行为?这些才是智能的一部分。

甲子光年:离开图森未来之后,你再次投身L4级别无人驾驶卡车创业,在美国创立了Bot Auto。之前图森未来在对外宣传时是会强调数据和里程数的,你不怕再次掉入资源中心主义陷阱?

侯晓迪:一段时间以来,很多自动驾驶公司积累大量的测试里程以捕捉所有边缘案例,并建立庞大的GPU集群来训练端到端的AI模型以处理所有边缘案例。

但我觉得里程数被过度强调了。

离开图森后,我沉淀了一段时间才决定重新出发。2023年4月,我去见投资人,当时融资环境极差,主流观点是无人驾驶已经没机会融资了。甚至有人说无人驾驶的窗口已经关闭,应该去做机器人或大模型。

到2023年年中时,我也不敢说一定能成,但我直觉上认为无人驾驶未必那么“烧钱”,不是简单的“砸钱换结果”。基于这个想法,我才创立了Bot Auto。

甲子光年:说实话,你当时有没有想过去做具身智能、大模型的创业?

侯晓迪:我当然想过,而且非常认真地研究过、调研过。当时有投资人很直白跟我说,“你要是做机器人我给你钱,你做无人驾驶,我不给你钱。”但我最终还是决定做无人驾驶。

甲子光年:为什么还想做无人驾驶?

侯晓迪:开玩笑说,这就是“自讨苦吃”。(笑)

还想做无人驾驶是因为我在无人驾驶领域交过很多学费,踩过很多坑,这些经验很宝贵,放弃了很可惜。

另外就是,我真正追求的是持久而深远的,长期意义上的成功。一轮融资的顺利与否只是短期波动,我不应太关注。

没有选择做机器人是因为我决策时关注的全都是长期意义上的问题,这里面不确定性太多了。机器人创业有不可忽略的问题:运营成本、商业模式是什么?零部件稳定性如何?客户是谁?能从谁那里赚钱?这些问题我想不清楚。

投资人可以短期布局,中期收获,实现几年内的丰厚回报。但作为创业者,我的使命不同,我必须坚持到最后,确保我做的这份事业最终能创造真正的价值。

甲子光年:你在创立Bot Auto时,有没有赌的成分?

侯晓迪:我更倾向于说这是一种基于经验和专业直觉的判断力,而非盲目下注。Bot作为一家公司成立时,我确实有两个关键假设需要验证。

第一个假设是算法模块能整合到一起。当时团队三四十人,做深度学习的只有5人,没法按传统方式分组。我们逼着自己把所有模块整合在一起。2023年下半年,我们研究了大量预训练论文,预判预训练能节省标注的资源和算力,同时多任务和多模态能让分散的神经网络融合成一个大网络。这是最初的假设,只是一个不包含太多细节的大方向,但直觉告诉我,这个方向继续探索下去,肯定会有惊喜。

第二个假设是业务不能是数据密集型的。我们没钱做大规模标注,比如前司(图森未来)几千万张图片的标注规模,光标数据就得两年。所以我们Bot内部有个口号——“插上电就能跑”。新网络的冷启动必须是高度自监督的,不能用昂贵的人工标注数据。数据来源可以是基于过去帧的预测,比如给模型看前五帧预测第六帧,也可以用仿真数据。

甲子光年:结果如何?

侯晓迪:结果很喜人,“插上电就能跑”给了我们很大启发。有段时间,我们甚至开始算电费——这点电费能换来多少算法性能提升?结果发现非常划算。

到2024年3月之前,我们在数据标注上没花过一分钱,所有数据要么来自MIT License的公开数据集,要么是自己生成的仿真数据,要么是用各种自监督的预训练,最后真成了!尤其是模型的多模态特性给了我们很大启发,整体进展远超预期。

甲子光年:最初的大胆假设基本都被验证了,接下来有什么新的假设?

侯晓迪:比如车队规模到底多大?这是无人驾驶领域的一大误解。融资时,很多人拿特斯拉的保有量和无人驾驶测试车队规模类比。这是完全错的。

你看绝大多数无人驾驶的测试车队都不大,而且这些车也都不是开足马力每天连轴转的测试,因为对于大多数公司,开发重点根本没到非百万英里数据不可解决的程度

我一直坚持的观点是,关键不在于数据有多少,而在于你能不能用好。较少数据都没有挖掘出价值的时候,非归因到自己数据量不够,那不就是“差生文具多”么。

甲子光年:如果无人驾驶不靠“数据量即正义”,那该怎么做?

侯晓迪:经常有人问我这个问题。我积累100万英里,他们问200万英里的问题怎么解决;到了1000万英里,又问2000万英里的极端情况如何处理。按此逻辑,数据和测试里程永远不够,像在无尽的渐进路径上狂奔。

深度学习再强、数据再多总还会有检测不到的BoundingBox(边界框),这时有人会杠:“那解决不了怎么办?”

用数据规模来回应这些质疑是错误的。沿着积累数据这条路走到黑,到后面边际效益递减,会越走越绝望。这时候就需要转变思路了。哪怕业界著名的里程高车队大的Waymo,也不可能因为担心动物园的大象跑到马路上而做一个“大象检测器”,而是要靠一个“通用障碍物检测”的方案来解决。这样一来,是靠不同的传感器或者不同的算法做保险,成倍的降低失效率了。

另外一个点是,世界上没有绝对的安全。飞机有百万分之一的坠机概率,但我们仍然会选择坐飞机。自动驾驶同理,关键是把风险降到合理范围内。比如比人类司机安全数倍。

而且算法只是系统安全的一部分,比如轮胎爆胎这种硬件风险,就不是算法能彻底消除的。

科学的方法是抛弃主义,分析风险来源,尝试量化。如果接受贝叶斯主义,所有事情都有概率,即使不可观测或无法精确量化,至少可以估计。估计出一个可量化的区间,这件事就能达到。我们的目标是做出一套超越处于最佳状态下的优秀人类司机的系统。但是即便如此,我们并不保证无人驾驶系统能避开穿着隐身衣在夜间潜行横穿高速公路的忍者。

甲子光年:所以你认为,问题的根本在于我们对安全认知需要修正。

侯晓迪:我们在面对安全问题时,不能情绪化处理,就像科学不能被玄学化,而应该用科学方法解决问题。所以我们内部正在推进一个项目,叫做Safety Science(安全科学)。既然游戏是科学,那安全也应该是。

如果总是用情绪化的方式讨论,比如“生命只有一次”“你怎么能把路上的行人置于危险境地?” 这样的谈话容易把无人驾驶逼到不切实际的位置,不得不去面对一个永远不可能达到的安全目标,就陷入了没有意义的争论。

为平息此类争论,行业只能以更多测试里程回应,用更多资源缓解焦虑。一边投入资源消解焦虑,另一边是无科学依据的质疑。两者此消彼长,造成资源浪费,拖累行业走向错误方向。

现在是需要纠偏的时候,而DeepSeek就像一记当头棒喝,让不少人清醒了,这是好事。

甲子光年:那无人驾驶还需要回答如何确保安全的问题吗?

侯晓迪:需要。但问题归根结底很简单:第一,厘清路权;第二,无权时不涉险,有权时尽量避让;第三,确保前两条,同时最大化效率。

真正做起来你会发现,做到前两条相对容易,挑战在于保障前两条的同时满足第三条。历史上无人驾驶出的问题,也恰恰是因为前两条安全问题,向效率做了妥协,最终没守住安全边界,才导致的事故。在这一点上,我们做的是卡车,面对的问题比轿车容易许多。

甲子光年:无人驾驶卡车和无人驾驶乘用车有什么不同?

侯晓迪:无人驾驶卡车里没有乘客,只有货物。遇到突发情况,货物可以等,它们不会抱怨,这种等待成本和心理压力远低于载人场景。对我们而言,无人驾驶会变成一个纯粹的成本优化问题——在绝对安全的前提下,能否将效率提升到可以盈利的水平?

越早实现这个目标,公司就能越早进入扩张阶段。

甲子光年:你看到无人驾驶商业化拐点了吗?

侯晓迪:无人驾驶和可控核聚变类似,都指向商业化拐点。只要可控核聚变释放的能量大于维持成本,就能赚钱。无人驾驶也一样,系统复杂、维护成本高,但一旦低于雇佣司机成本,就进入盈利模式。

在拐点到来前,规模化只能缓解市场焦虑,但并不能解决根本问题,所以我们反对规模化扩张。这些年我一直强调车队或增加人员都按照最低限度配置,坚持节俭运营。在规模化有商业价值前,所有扩张都是错误的。遗憾的是,今天仍有很多公司走在错误方向。

甲子光年:今年国内很多车企开始卷智能驾驶,“端到端”自动驾驶也出现在了很多车企的宣传话术中。你之前跟我们说过,“端到端”不是一个学术概念,而是一个情绪载体。去年,《慎勇者侯晓迪》这篇文章发布后,你对于“端到端”的评价也引发了一些讨论。你有什么要解释的吗?

侯晓迪:可能大家太关注我喊的口号,而忽略掉了背后的意思。我想表达的是,要不要“端到端”或者扣什么帽子都不重要,关键是现在的人工智能,尤其是神经网络比五年前发生了什么变化?这些变化如何实现?理解了本质,就会发现有大量的不同的变体可以实现同一个目的。

我一直公开反对“端到端”,谁说无人驾驶是“端到端”,不是片面就是天真。

关于神经网络的进展趋势, 我总结两点:第一是多任务处理(multitasking),第二是多模态(multimodality)。这两点是无人驾驶和很多其他应用的核心。抓住这两点后,实现手段就很自然了。“端到端”只是其中一种方式,不是唯一。

我的态度是忘掉什么是“端到端”,借用李小龙的话:“像水一样,我的朋友(be water, my friend)。”

甲子光年:关于“端到端”,行业里的认知有什么变化吗?

侯晓迪:现在行业里越来越多人公开承认自己其实不是纯正的“端到端”了,但外界仍把“端到端”看作特别神圣的东西。

有些企业为了炒作,刻意营造神秘感,把自己的技术包装得很神圣,其实毫无意义,反而造成行业内耗。

而在线下的工程师交流场合,大家更容易说实话:“啊,你们家也是这么做的?我们也是这样。那这算端到端吗?”“嗨,管他呢,反正大家都叫端到端。”我听过几次这种对话,每次都被逗乐了,我心想:“行吧,你们爱怎么说就怎么说。”

甲子光年:行业里都这么说,你不这么说,会不会显得格格不入?

侯晓迪:当所有人都在打擦边球时,你会发现整个行业在逼着大家都去打擦边球。但我属于那种宁可不打这个球,也不去打擦边球的人。有时候我会有种交流困难的挫败感,但我发现投资Bot Auto的人,就是喜欢我这种敢撞墙的精神,所以做好自己就行。

甲子光年:我们了解到,Bot Auto的无人驾驶使用的全新的技术框架,你们团队此前是否有经验?

侯晓迪:具体架构肯定是一边做一边摸索。我们搞的是把Deep Learning 集中化,我们内部叫Foundation to All。成功的关键不是Scaling Law,而是科学方法的工程化。我们现在参数量也没有大到离谱,网络架构的变化是关键。

我们应该专注向怎么利用好这些新趋势,而不是陷入“冠名权”的争吵里。我们的神经网络是多头的。从某种意义上说它也是个MoE(混合专家模型)。以前我讲MoE时很多人不懂,现在也是拖DeepSeek的福,沟通成本一下子低很多。

甲子光年:MoE加上科学工程化,能直接移植到无人驾驶吗?

侯晓迪:这不是简单的移植,而是要看到本质。以前模块间的信息传输很稀疏,而我们要让它能承载更多上下文信息。用时髦的术语说,就是Token(标记),且Embedding(嵌入)的维度要足够高。

我描述的是核心原理。真正工程师先前的时候,自由度其实非常高。只要关键部分处理到位,总归会看到性能的进步。但原理不是一个化工厂的流程手册,让你“顺着做就一定成功”,这些原则勾勒出了一片地,告诉你地底下有石油,但怎么挖出来,还得看你的方法。

比如就刚才我说的这个原理——让不同功能模块或任务(Multitask)能放到一个基础的基座下,共享更多信息,改善模块间通信信道。这是一个方向性的观察。至于具体实现是否用混合专家模型MoE,甚至是端到端,并不是最核心的问题。可能过段时间,结构不再是MoE,而是另一种体系,甚至还包含非Deep Learning模块,但如果这些模块能高效共享背景信息,也完全有可能做出一个高性能的系统。

不要拘泥于具体实现方式,不要把问题框死在你这招“是剑宗还是气宗”,杀伤力高的,才是好招式。

甲子光年:其实,技术路径不应该成为判断智能的标准。

侯晓迪:行业内太多主义之争,吵来吵去,结果反而模糊了方向性的观察和论断。

甲子光年:无人驾驶领域为什么会有主义之争?

侯晓迪:如果不谈主义,那大部分人瞬间就没有参与资格了。他们没有经验积累,没有专业水平,没看过paper,也不知道成功实验背后的多少失败尝试。谈主义很容易让更多人有发言权。但坏处就是过度简化。任何事情过度简化以后就不再对未来有指导意义了。

你看商业航天领域有什么主义?谁能指导火箭发射?谁能决定耐热材料?没人谈主义,因为指导不了。医疗制药领域呢?谁能判断药物是左旋还是右旋?这些硬科学领域几乎没有主义。

但无人驾驶领域不一样,大家都会开车,自然觉得有发言权。大语言模型领域更是如此,人人都使用语言,就觉得自己能够评价。人们总以为自己拥有智能,就觉得自己能够评判智能。

甲子光年:你的很多观点是反共识的,甚至在给行业“泼冷水”,各方褒贬不一的反馈也随之而来,看到这些反馈,你内心是怎么想的?

侯晓迪:第一,观点就是力量。我相信这点,因为我是一个自洽的人。我讲这些没有任何企图,只是觉得这是我看到的真实世界,我愿意说出来。越纯粹,越有力量——这是我这么多年学到的重要一课。

第二,这个世界虽然有各种噪音,但整体还是好的,我依然爱这个世界。

甲子光年:有什么收获吗?

侯晓迪:当我讲真话时,我能交到真朋友,能得到意料之外的善意。

真的有完全不同行业的人,专门来加我微信,就为了说一句:“晓迪,我觉得你讲得太好了。”我觉得这些意料之外的善意,是人生旅程中很有意义的部分。

人生不是一长串小考试,而是一张体验卡。要去体验真实,体验这个世界里的善意。这是我对于“活着”的态度。

甲子光年:创办Bot Auto已经一年多了,在这个过程中,有没有经历特别艰难的时刻?

侯晓迪:我觉得没有。老话说“人无远虑,必有近忧”,而我没有近忧,全是远虑。我现在天天想的问题,基本都得以年为尺度来规划安排。

甲子光年:你变了。

侯晓迪:这的确是我的一个改变。以前我更关注技术,现在我发现技术不是全部。

我现在给自己的定位是守护者,希望守护这家公司。技术研发的日常工作就算没有我的参与,两个月后,工程师团队肯定也能圆满完成任务。但如何保证公司两年后不会面对生死存亡的危机——这才是我最关注的。

甲子光年:那你要面对的问题有哪些?

侯晓迪:比方说:到底走scrappy-centric(资源有限但灵活高效)还是resource-centric(资源充足但可能效率低下)的路?我们开始时选其中一条,然后一直坚持下去。

这次Deepseek的突破,我特别想为他们叫好,因为看到了这种“主义”的胜利。

但他们的胜利跟我们有关系吗?没有。无论Deepseek存在与否,我们仍会走自己的路。是我们能否在缺少外援,资源受限的情况下,依然能够把无人驾驶做到商业化,站着把钱挣了。我是清晰的看到这条路的,哪怕外部环境艰难,哪怕我们不去赌自己的运气,我们把自己该做的都做到,就能够自然的走到终点。

所以我没有近忧,全是远虑。

甲子光年:关于改变你说过:“现在抓的细节少了,如果有个算法问题要晚一个月才能攻破,以前你可能会拍桌子亲自上阵,但现在这种情况不太可能了。”那你觉得从执行者到守护者的角色转变难吗?

侯晓迪:不会,二者相辅相成。如果我天天在搞远虑的事,那近忧就会有一重、两重、三重防护网,我们在防护上做得不错。我觉得,现在团队的成熟度非常高。相比5年前,我很放心现在的团队。

甲子光年:会不会有时忍不住还想拍桌子亲自上阵?

侯晓迪:我仍然会在一些项目上抓细节,主要为了三件事:

第一,锻炼团队,亲自做项目打个样,让他们看看怎么做;

第二,保持手感,公司的大决定,基本都需要有战场前线的具体信息。

第三,愿景沟通,每个项目不同合作方的预期都不一样,这时候我就可以帮着串联软件与硬件、技术与运营、商务与法务。

下面这张图讲的就是愿景问题,很多时候大家嘴上说着以为一样,但其实出入非常大,所以需要大家一起做项目,把想法对齐。我们团队流动性强,没有固定组织架构,经常根据项目抽调人手,做完就解散再换。这样的组织形态下,我作为具体执行者创造的价值不重,但我给大家画一张图能兼容所有团队,就显得很重要。

甲子光年:2024年你经历的Magic moment是什么?

侯晓迪:我自己身上其实没有,我反倒觉得2024年,世界因为AI的技术突破变得特别浮躁。我一如既往的做着我的分析、判断、实践,没什么人信,但其实也不太影响我。唯一区别是,噪音确实大,稍微有点难以适应。

但回头来看,只不过是大家参加了一场极度疯狂的嘉年华。嘉年华散场,大家渐渐走出来了。世界的客观规律没变我的认知也没有变,变的是参与群众。

如果一定让我说一个2024年的Magic moment,那我不说我自己,换个更宏大的视角谈谈社会和人类文明演进吧。这是人类加速发展的一年。在2024年底,连我妈都开始用大模型了。大众正越来越多地拥抱技术,技术也正成为生活不可或缺的一部分,这是好事。同时我看到有更多的,比我认知更深、比我更有想象力的人,开始带领大众,对科技、对人工智能、对人类社会、甚至对我们文明的未来命运展开了广泛而深刻的讨论。这个过程是我们这个时代的启蒙运动。

虽然也有不少批评的声音,说钟摆一会儿摆向左边的极端,一会儿摆向右边的极端。但如果不站在个体而是站在文明的进程来看,文明的进程很少有直线前进的。这不是在原地兜圈子,而是在走一条蜿蜒曲折的盘山公路。

甲子光年:你对今年的人工智能和无人驾驶有什么新的期待?

侯晓迪:大模型要在产品层面实现飞跃,不仅靠自身技术突破,更在于与其他技术结合。我期待这一点,也反对盲目堆资源的做法,目前持这种看法的人已不少。

关键是把LLM融入计算机科学体系,而不是抛弃已有的技术积累。计算机科学发展近百年,现在很多人只会调大模型,导致技术断层。但RAG等方向已有突破,搜索和优化的价值也在回归。

就比如最近很多人谈的Chain of Thought 思维链,现在发出来的不少工作还是基于经验主义在探索,但其实有大量的上上代甚至上三代的古早AI技术,它们背后的哲学思辨和指导方向,远没有被吃透,被充分利用。我期待这方面能通过文艺复兴的形式,产生下一次大的突破——这和无人驾驶无关,但意义深远。

甲子光年:3月4日,Bot Auto发布了2025年的无人驾驶商业货运计划,这对你们来说意味着什么?

侯晓迪:2025年的无人驾驶商业货运计划对我们来说很重要,这事儿可不是拍脑袋决定的。先说重点,今天我们将启动的休斯敦到圣安东尼奥之间的自动驾驶卡车运营,我们不搞技术表演,这是实打实的商业试运营。

我们是冲着两个最实在的问题去的:

1.客户到底愿不愿意用无人卡车运真货?

2.对无人驾驶公司,这生意最终能不能赚到真金白银?

现在这个时间点,外界肯定会有质疑的声音。但我们看行业现状,大家都不约而同的把目标定在2025年。这些并非巧合,而是技术成熟度曲线的必然。当硬件冗余设计通过百万英里测试和软件迭代速度超过事故发生率时,商业化的窗口自然就打开了。

上一次美国高速公路上有无人驾驶卡车,是2021年。巧了,也是我们团队做的。自从那个时候起,我就一直在寻找这个问题的答案——怎么才能让无人驾驶公司盈利。Bot Auto的成立,人员组织架构的搭建,技术路径的选择,包括这次的Driver out试点,都是我答案的一部分。

关于这次试运行,有两点我想强调:

1.本次试点将严格记录完全无人驾驶卡车的真实运营成本,从硬件成本、油耗到出车效率,检修频次,我们会把所有运营数据都视为可审计的财会数据;

2.我们拒绝“为自动驾驶而自动驾驶”,所有技术创新必须经受商业验证。这四个月的试运营,会直接指导我们后续的工作重心。

最后引用我常对团队说的话:“无人驾驶的终极测试不在实验室,而在货运公司的损益表里。”2025年,我们会用真实货物、真实路线、真实账单,向行业证明自动驾驶卡车不是科幻概念,而是可规模化的生产力工具。

来源:甲子光年

相关推荐