【长期主义】第317期智能说:2024理想AI Talk,李想3小时对谈

360影视 2025-01-04 08:27 2

摘要:2024年12月25日~27日每晚8点,理想推出3期2024理想AI Talk,腾讯新闻科技主笔张小珺,深度对话理想创始人、CEO李想,理想智能驾驶研发副总裁郎咸朋,理想空间AI负责人陈伟。

2024年12月25日~27日每晚8点,理想推出3期2024理想AI Talk,腾讯新闻科技主笔张小珺,深度对话理想创始人、CEO李想,理想智能驾驶研发副总裁郎咸朋,理想空间AI负责人陈伟。

李想时隔9个月重回公众视野,分享关于AI完整技术与产品观。李想表示,AI对于理想意味着未来全部,将全力以赴迈向成为全球领先AI企业的目标,对内、对外明确传递理想All in AI的决心与气魄。

李想与团队成员,畅谈对AI、自动驾驶最新思考,分享理想智驾、理想同学等最新进展,披露理想为实现AGI的战略路线图,最终将打造硅基家人,推动AI普惠到每个家庭,完成创造移动的家、创造幸福的家使命。

本期长期主义,选择李想3小时对谈完整版、理想AI Talk访谈实录02、03,腾讯科技、理想汽车发布,六合商业研选精校,分享给大家,Enjoy!

正文:

全文35,669字

预计阅读72分钟

与李想3小时对谈

时间:2024年12月27日

字数:28,757

2024年12月,张小珺与理想汽车CEO李想有一场对话。此时,他们决定车机助手理想同学推出手机版APP,并于此前做了基座大模型,两者相加约等于Kimi。

这意味着,人们认知中的新能源电动车企业,宣告要进入与字节豆包、月之暗面Kimi、腾讯元宝、百度文心一言等个人助手之战。这场原本已然红海的基座大模型+个人超级助手商战,竞争烈度更大。

很多人脑海中,个人超级助手与智能驾驶,是截然不同的两件事,产品不同,底层架构无法打通。

李想不这么认为,在他看来,OpenAI定义的第三阶段智能体、自动驾驶定义的第四阶段自动驾驶,会在相近时间点交汇,合并到统一架构上。

各异的企业将汇入同一片赛场,基座模型是AI时代的操作系统+编程语言,基座模型所构建出的AI超级产品,会是新一代入口,它会在所有设备之上,在所有服务之上;如今这些企业,都在争夺AGI L3与自动驾驶L4的门票,这会是双边的iPhone 4时刻。

全球看,对AI的探讨,正从技术认知转向产品构想。对话中,这位非技术背景、被认为在产品上有天赋的创始人,复原这2年理想关于AI完整的技术与产品观。

他首度谈了Mega失利、苹果放弃造车、雷军造车成功、理想会做机器人、怎么管理00后等各种话题。

第一节、谈AI

我绝对不止做一棵树了

张小珺:别人都在做纯电,你在做增程;现在很多人开始转增程,你怎么不想造车、要做AI企业?

李想:造车肯定是要造的,大家经常讲:电动化是上半场,智能化是下半场。

我认为智能化,讲的不是传统软件智能,而是真正的AI,这是造车往下延续的必经之路。汽车将从工业时代交通工具,进化成为AI时代空间机器人。

张小珺:我看了一下你第一次对内说,2030年要做全球领先的AI企业,是在2023年1月,此时ChatGPT刚好诞生2个月。你这是跟风吗?

李想:不是跟风。

我们每年春季战略发布,起源于上一年9月,在北京雁栖湖开的每年一度内部战略会。

2022年9月,我们已经确定,要把AI包含自动驾驶作为真正重要的方向,这是未来竞争关键。

2023年初,发布战略时,我们做了根本性变化,把AI从隐藏战略,变成开放的阳谋战略。这样,才能吸引足够多人才。

OpenAI发挥了非常大作用,把全新的AI时代打开。我们对AI内心所有想法、所有期盼,不用再藏着,应该拿出来正面讲。

张小珺:你对AI感兴趣,可以追溯到什么时?

李想:追溯到这一次创业开始,我脑子里看到很重要的事:如何用全新技术,改变物理世界发生的一切?

我在做汽车之家,在线上,我们成了全球最大汽车网站。汽车之家有很多遗憾,比如我们做的汽车电商类业务,一直没有成功,我们想改造整个物理世界,包括一辆车从制造、仓储、库存、物流到体验。

我们会发现,除了在线上多花一份钱,并没有对物理世界产生有效改造。

我做理想汽车,很重要的一点是,必须借助最新技术,对物理世界进行改造。

张小珺:你是想做一家AI企业,还是想通过AI赋能电动车?

李想:怎么来讲,汽车是物理世界AI最大的应用,如果看清楚这一点,我们应该是一家AI企业。

团队总问我,我们Logo后边写理想还是理想汽车?我们讲理想汽车是为了方便跟外界沟通与宣传,Logo从来没把汽车加上去。

张小珺:你可以说,你要做的是一个AI技术驱动的电动车企业,或者一个拥有AI技术的自动驾驶企业,为什么一定要是AI企业,本质区别是什么?

李想:做汽车之家,有我一生中最大的遗憾,汽车之家是我第二次创业。

第一次创业,泡泡网赶上PC互联网时代,那时我不懂什么是创业,刚高中毕业,就开始做这么一个网站,错失很多好的机会。

做汽车之家,我非常看中汽车这样一个新兴行业。我们当时做过分析,中国1年只能卖200~300万辆车,到今天1年卖接近3,000万辆车。

但汽车之家发展成功一个重要因素是,我们率先做移动互联网应用与业务。我们做了几乎全世界最早Web网站、Windows Mobile版、iOS版、安卓版。

我们非常好抓住移动互联网窗口,很长一段时间,你看身边朋友,尤其男同胞,抱着汽车之家看车、买车,是他们生活重要的一部分。

2013年,汽车之家IPO后,到2015年我决定离开汽车之家,有一个非常大的遗憾。

2009年,汽车网站竞争就结束了,后面几年过得挺轻松的。

我还有更多能量,团队还有更多能量。我们在移动互联网时代,选了一个非常垂直的领域。你做得很好,某种程度,你可能为了一棵树,错过了一个森林,这是我最大的遗憾。

选择第三次创业,很重要一点是:我要选择一个森林,我要做那个森林里最大的。无论多么难,无论需要我经历什么样困难,我绝对不止做一棵树。

张小珺:你是觉得把它叫AI企业,是更大的故事、更大的梦想?

李想:不是更大的故事,如果你看我们到底在做什么,你就会相信。

我们1年100亿研发投入,接近一半投在AI。

我们是全世界第一个做基座模型的车企;端到端与VLM,从最开始论文,到技术研究,到最后研发与产品交付,也是全世界最早做出来的。

我们不仅在做智能驾驶,还有理想同学、智能商业、智能工业团队。

注:理想AI产品,包括2个C端产品,智能驾驶与理想同学;2个B端产品,智能商业与智能工业。

只是AI,如果是原来规则算法、知识图谱,大家觉着没什么希望。

手机上有Siri,使用比例非常低。

大家相信AI,但技术是错配的。它用了不是真正符合AI的方式,这都是进展。

我们可能吃到第8个包子,吃饱了,但前面每个包子都有价值。

正是一层一层递进,才出现今天AI相对繁荣的景象。

张小珺:我还是不能相信,你从创办理想第一天,就想好要做一家AI公司。你确定当时这么想吗?刚创业就觉得AI时代要来了?

李想:我觉得是一种感觉。

我们从最开始,也没有把它当成传统汽车做。为什么理想ONE只有一个车型?是我把它本身看成一个数据与软件的集成。

张小珺:乔布斯说如果硬件是产品大脑与肌肉,软件是灵魂,你表达的也是这个意思?

李想:是。

我最开始创业,投资人经常问我一个特别有意思的话题:凭什么是你?为什么你能做出来?那时我们还没有产品出来。

我当时讲了一个最重要的观点,我说:我会比传统汽车企业更懂怎么做互联网与大型软件,我会比互联网与大型软件公司更了解怎么制造一辆车。

张小珺:有人2023年问一些理想员工,你相信理想是家AI企业吗?他们都说不相信。

既然你都不能让你雇的人相信,怎么让更多人相信,怎么让大众相信?

李想:当技术变更的时,不相信是很正常的。

我们做增程时,如果你问我们员工,这辆车成功率有多少,销量有多少?

当时我们员工填最多的是,1个月能卖1,500辆;大部分员工,认为1个月只能卖几百辆。大家并没有体验过新技术,没有看到这个技术能带来的价值。

这可能真的是创业者与大部分人的很大不同:你会相信看着不是明白、不是清晰的事。

张小珺:AI对理想意味着什么?

李想:意味着未来的全部。

大家再不承认,我也不知道怎么形容了

张小珺:你第一次用ChatGPT是什么时?感受是怎么样的?

李想:发布时,我们就去用了。

怎么来形容,最大感觉是,AI应该有的样子是这样。

到今天为止,我跟身边很多人的判断不一样。我认为OpenAI是非常、非常了不起的公司,甚至它了不起来的程度,超过当年谷歌之于互联网了不起的程度。

张小珺:为什么这么说?OpenAI未来会长成什么样,会超越谷歌吗?

李想:我觉得基本是确定性的,我看一家公司,不会单独从技术看。

第一、我会看这家公司对行业标准的定义,很多时候,大家忽视这是最重要的,谷歌当年在搜索上定义了很多行业标准。

第二、我会看它研究工作做得怎么样。

第三、我会看它的技术研发工作做得怎么样。

第四、是产品化。

第五、是商业化能力。商业化能力分阶段,今天是不是它一定要获取多少收入,没那么重要。

OpenAI做了当年谷歌做的最重要的事,很多人忽视谷歌当年的成功,是源于谷歌前CEO 施密特Eric Schmidt加入后,在商业上的巨大成功,是谷歌当年拿下AOL首页。

百度当时很重要的成功,也是收购hao123,作为重要入口。

如果当时,美国超过50%的人,上网首页是谷歌,谷歌搜索是排他性竞争。

今天,OpenAI同样很厉害,拿下2个超级巨头:一个微软,一个苹果,这非常了不起。

这五个维度综合看,它是一个遥遥领先的AI企业。

张小珺:在你看来,OpenAI一定会成为下一个入口吗?

李想:我就拿数据看,OpenAI在这些AI的聊天产品里,如果看全球,基本占了80%份额。最新数据1个月有36亿访问量,离最近的是Gemini,应该是2亿~3亿。

如果大家再不承认,我也不知道该怎么形容。

张小珺:如果让你做OpenAI CEO,你会比Sam Altman做得更好吗?

李想:不会,我觉得Sam Altman做得非常成功。

张小珺:如果你是OpenAI CEO,你现在会做什么?

李想:最大一个挑战是,今天还是OpenAI定义的AGI L1阶段,聊天机器人;L2阶段,是他们最近在推广宣传的,包括12天直播,是推理者阶段。

大家相信2025年最重要的是,跑在头部的企业,能某种程度实现L3阶段,Agent智能体。

现在,OpenAI非常好讲明白,按照这个定义做了,聊天机器人最好的产品体验。

注:OpenAI定义了AI 5个阶段。

L1聊天机器人Chatbots:AI具备基本对话与交互能力,能与用户进行流畅对话。

L2推理者Reasoners:AI将能解决类似人类博士水平的复杂问题,展现强大推理与问题解决能力。

L3智能体Agents:AI能独立采取行动,不仅能思考,还可以在没有人类持续监督情况下执行任务。

L4创新者InnovaTors:AI能协助发明创造,推动科技进步,具备创造性与创新能力。

L5组织者Organizations:AI将能执行整个人类组织的工作,展现出高度自主性与策略性。

张小珺:是OpenAI定义的L1阶段。

李想:对。L2阶段不是普通人使用,Pro卖到200美元,要么To B用,要么是大C、专业用户用。

到L3 Agent阶段,才是真正iPhone4时刻。普通老百姓都能用,它能独立、持续完成任务,不用靠密集提示词的方式。这时产品应该是个什么交互,这是所有头部企业都应该认真思考的。

张小珺:Agent会在3年内实现吗?

李想:美国可能更早一些,中国能力足够的Agent,应该在3年之内实现。

基座模型是操作系统+语言

张小珺:我们来谈谈你们2款AI产品,理想同学,它是个人助手;一个是智能汽车。

理想同学以前是车机的个人助手,它现在要走出车门,进入手机变成APP,未来会上更多终端。

这意味着,你们电动车企业,要进入通用个人助手这场红海战役,要跟豆包、Kimi、ChatGPT竞争,是这样吗?

李想:如果我们是纯硬件公司,可以符合你说的定义。

苹果不是只卖Mac,才有后面可能性。这个可能性,不是iPhone出来后发生的,是在Mac变成透明壳那一刻就在发生。

华为不只是运营商,后面一切是它从运营商做到相对稳定阶段,就开始产生。

小米不只是手机企业,它有IoT,有自己生态,甚至也有汽车。

这些企业,不能以一个硬件来定义它到底是什么企业。硬件是它支柱业务,是起点。今天每一家企业,都应该是家AI企业。

如果我们相信AI,AI最关键是什么?

如果在智能手机时代,最重要的是操作系统、应用商店、云服务。

最开始大家做触屏手机,中国,我印象有非常多家触屏手机,甚至很多品牌也都1年卖几千万台。

但到了操作系统、应用商店、云服务竞争的智能手机时代,这些企业要有庞大的大型软件能力,很多时候硬件能力,供应商就能解决。

我们做硬件,是为了更好控制硬件体系、性能再高点点。

大型软件不一样,不是所有人能做操作系统,不是所有人能做大型云服务,这就变成更大挑战。

回到AI也一样,今天你能看到几百家电动车企业,是中国有非常完善供应链。

我问:这几百个企业,未来有哪些企业能做基座模型?

张小珺:你认为,基座模型是一个分水岭?

李想:是。

张小珺:现在谁做了?

李想:至少我们做了,至少我们一直在做基座模型,无论多么难,非常坚定。

我认为,基座模型是AI时代操作系统+编程语言,你就知道它有多么重要。

基座模型所构建出的AI超级产品,会是新一代入口,它会在所有设备之上,在所有服务之上。

张小珺:把理想同学+Mind GPT加起来,约等于Kimi,可以这么通俗理解?

李想:可以这么形容。

张小珺:理想同学从车机进入手机,这是战略级决定,还是你们只是想试试看?

李想:没那么复杂。

站得很远看,一个有效大模型产品,尤其你在掌握基座前提下,会在所有设备、所有服务之上,这是我相信的一点,否则它不是AI。它发展到智能体,能自主使用所有设备、服务。

站在近处看,我们很多用户、孩子,一上来接触的AI是理想同学。很自然,我为什么不把这个东西,也同样放在他们日常使用设备上。

很多用户的孩子,在使用完车内理想同学后,拿着手机也喊理想同学,这是真实需求场景。

我们可不可以先把100多万用户、家庭,这300~500万人,让他们用上非常好的,在车上、手机上、电脑上、后面可能出现在眼镜上,体验一致的AI产品,这是必须要做的。

张小珺:理想同学会存在收集用户数据、用户隐私的问题吗?

李想:不会。当你真正预训练、后训练,你会发现跟原来互联网不一样,我们并不需要这些东西。比如,预训练更多是从公开数据集收集。

如果未来让用户使用得更好,会建立记忆系统,记忆系统会把用户记忆转成Token。它既不是比特,也不是传统文字或声音记载,大家完全不用担心。

大家今天如果担心AI隐私问题,还是对AI技术本身不够了解。

张小珺:对话类个人助手,已经非常红海,你怎么看在这片红海市场中战争?

李想:今天是非常初期阶段,如果讲第一个明确阶段,还是人人可用的To C智能体出现,也是OpenAI定义的L3阶段,今天在尝试中。

张小珺:今天是尝试去拿那张船票?

李想:对。

今天大家做的所有事情,是为了拿AGI的L3与自动驾驶L4的门票。

L4是智能体

张小珺:在我脑子里,理想同学作为个人助手,与汽车智能驾驶,是两件事,这是2个产品,支持他们的是两种技术架构,为什么给我感觉,在你脑子里,它们是一件事?

李想:这2个领域都做,我们看到更有意思、让我们更坚定去做的机会。

今天我们做的理想同学与自动驾驶,按行业标准是分割开的,处于早期阶段:

我们在做的Mind GPT理想自研大模型,大家叫LLM、大语言模型,它叫语言智能。

我们在做的自动驾驶,李飞飞定义叫空间智能,我们内部叫行为智能。

只有你真正在这个领域大规模做,才知道这2个,有一天一定会连在一起。

如果一个人只有语言智能,他足够聪明,但不能行动。如果一个人只有行为智能与空间智能,他像一个普通工种。一个人什么呢?是这几个结合。

我们认为,基座模型到一定时刻,一定会变成VLA,Vision Language Action Model,一种结合视觉、语言、动作的多模态模型。

语言模型也要看三维世界,也要通过语言、认知理解三维世界。

三维世界不只有图片,或者用Diffusion、生成方式就可以,它并不能还原真实物理世界,需要向量。

自动驾驶也一样,它真正变得更强,走向L4,是它要有极强认知能力。

当这些东西发生变化,它能够有效理解这个世界,不只是端到端背后的压缩记忆,这是我们看到的一个变化。

我对团队一个要求:至少在中国范围内,未来几年,必须保证大语言模型的基座模型是行业前3。你需要什么样的训练算力,我们愿意投资。要真正跟头部企业PK,去竞争,把能力构建起来,不只是在汽车行业里比一比。

对我们最开始做的端到端+VLM智能驾驶的架构,包含下一代研究工作,我们如何在空间智能里,保证在中国是最领先、第一的地位,这非常之重要。

我相信这个时间点会非常相似,空间智能实现L4,语言智能实现Agent时,一个大概率是,这2个会变成一个模型。

张小珺:是VLA模型?

李想:是视觉Vision、语言Language、行动Action,它跟人一样,变成更大的模型能力。

L4是智能体,你必须很好理解物理世界。

张小珺:智能驾驶,能怎么帮助大语言模型?

李想:智能驾驶所获得的数据,可以为语言模型或者下一步基座模型,构建三维向量空间的能力。

举个例子,我们在VLM使用中,会遇到一些问题,今天VLM是从大语言模型基础上做出来的。

做VLM这些基座模型,它也会喂几亿、甚至几十亿张图片,这些图片是二维的,在三维向量空间里,比如我们做自动驾驶,它可以通过这个画面看到:哪里是公交车道,公交车道提示是什么,什么是潮汐车道;甚至能认出交警,这个交警在干什么;它并不知道具体位置。

是端到端的基座、与VLM基座,是2个不同基座,它俩只能互动,不能通过端到端确定位置。

这也是我们看到说:最终,它应该像人类一样,一套大脑系统,既能处理语言,也能处理图像,处理图像时,人是具备三维向量空间的能力,能调用自己行动。

接下来也能看到我们一些论文,我们如何用三维向量空间,包括用高斯球方式,给语言模型具备三维向量空间的能力。

张小珺:它最终会合并统一到Mind GPT基座模型上?

李想:到时是不是叫Mind GPT,不一定。

我们肯定会往语言模型放三维向量Token,现在已经开始尝试,做预训练。

终级产品想象是硅基家人

张小珺:很多人说你是超级产品经理,能不能从产品角度讲,随着AI能力,从L1到L5,按照OpenAI定义标准演进,你对产品是如何构想的?

今天我们看到的还是非常基础的对话APP,以后呢?

李想:产品是把用户需求、与你背后所有能力进行结合。

好的产品经理是,我对需求了解得足够清楚,我对能力了解清楚,2个交集越大,产品价值越高;交集越小,产品价值越低;或者浪费越多,内耗越多。

今天哪怕我在公司想推动AI,最重要的是,让大家对很多东西理解变容易。

对实现AGI到最终阶段,我经常用三种方式描述:

第一阶段、增强我的能力。

增强我的能力,意味什么?意味着它是我的一个辅助,最后决策权在我这。

我可以拿Midjourney画一幅画,最后还要拿Photoshop修改一下才能出版。

我可以拿理想同学生成一篇文章,这个文章不会直接发到公众号,还要进行文字整理。

包括L3智能驾驶,我们叫有监督智能驾驶,需要我在车上监督,我来进行最后兜底。

这里边核心是,第一个阶段能力还不够。

张小珺:在这个阶段,负责任的是人。

李想:对。

如果你能特别好使用AI这方面能力,它让我变得更方便、效率更高。

随着它能力提升,随着人类对它信任,到第二个阶段,是智能体所描述的阶段。

第二阶段、成为我的助手。

我只要给它发任务,甚至可以发连续任务,它可以独立完成,对结果承担责任。

比如,我可以跟一辆L4车讲,你要帮我接孩子,我不需要坐在车上,它可以到学校帮我接孩子,进行面部识别,打开门,让孩子上车,再完成下个任务,送孩子学游泳、学乐高。

它可以帮我做上周工作总结,发给我所有减一层管理者,这是第二个阶段。

这个阶段,比较好的状况是,它会变成大规模应用,是真正iPhone4阶段。

汽车企业,只有实现按自动驾驶行业标准的L4,才是真正的iPhone4阶段,今天还不是。

注:国际汽车工程师协会定义自动驾驶4个阶段:

L1 辅助驾驶:系统能持续执行车辆横向或纵向运动控制中一个方面,如自适应巡航控制、车道保持辅助。

L2部分自动驾驶:系统能控制车辆横向与纵向运动,驾驶员必须始终监控驾驶环境,准备接管。

L3自动驾驶:特定条件下,系统可完成所有驾驶操作,驾驶员需要在系统请求时接管。

L4高度自动驾:定义操作区域内,系统可完全独立操作,即使遇到复杂或紧急情况,无需人类介入。

张小珺:今天汽车企业是什么阶段?

李想:如果实现L3,更像黑莓阶段。方向盘在上边,就跟键盘在上边一个道理。

第三阶段,是我想的终极阶段。我们要创造移动的家,创造幸福的家,我在内部叫硅基家人。

我不需要再给它任何指示,不需要分配任务,它是家庭成员,甚至是家庭重要组织者。

它不但了解我,还了解我孩子,了解我身边朋友,甚至比我还了解。

它更多记录下的是事实,我很多时记,录的是一种感觉与一些被压缩的记忆。这时它会主动干很多事,可以自主帮我把家管理好。

我作为一个人,很重要的是记忆。我的记忆是我的模型,它也在不停训练,变得更强。

很重要的一点,我的记忆会被它得以延续,可能我肉体不存在,我的记忆会变成它的一部分。我后代想了解我,很容易,只要跟它聊,就像跟我聊,没区别。

张小珺:那你没有隐私了。

李想:我是它的一部分。

如果按照OpenAI定义,到AGI,它本身是组织者。它不是只有能力,必须有智慧,它会是人类优质智慧的汇集之河,不只是人类知识与能力的汇集之河。

张小珺:产品形态上,硅基家人,是你脑海中构想的最终产品?

李想:对。我最兴奋的是,我与我们团队,能在有生之年实现第三阶段,我希望是通过我们的手实现。

哪怕最终各种遗憾,没有通过我们手实现,我希望看到有最顶尖企业,把这个阶段在我们有生之年实现。

张小珺:如果你最终目的是硅基家人,它不适合叫理想同学,会改名吗?

李想:很快,大家能看到我们允许每个人创造自己的理想同学。

如果它不是家人阶段,不要强努着给它一个家人阶段的名字。

AI表达的是能力,不是功能

张小珺:这类对话类产品,已经高度同质化,你们优势是什么?

李想:今天不能讲同质化,真正大规模To C的关键节点,是在智能体实现阶段,今天大家都有机会。

作为理想汽车,分三个维度讲:

1、相比一般创业公司,我们有100万家庭用户的基础,有启动量。

2、大语言模型产品与基座方面,我们是跟随者,跟随要有目标。

我们从10名开外,先进入第5,再进入第3。这也是我们后边要设定目标,与最好、最优秀的选手,进行对比的有效工作方式,按照这样目标有效投入。

3、空间方面,包括端到端,今天大家听到各种各样做机器人、具身智能的公司,讲系统1、系统2,大家可以回头看一看这些论文,最早是我们自动驾驶研究团队做的。

在空间智能或行为智能方面,我们对自己要求是必须保持第一。

张小珺:你刚才说产品是要技术能力匹配产品需求,你今天是对产品需求认知更深,还是对技术能力认知更深?

李想:我觉得不太一样。

大模型到来以前阶段,我们通过编程、甚至规则算法做硬件,本质上我们提供的产品是功能,这个功能有体验。比如这是冰箱,它是功能,冰箱放在不同地方,体验是不一样的。

这时企业很重要的竞争是,你提供什么样功能,这个功能带来的体验,再加上品牌。

无论你是互联网产品,还是硬件产品,或者智能硬件产品,你提供软件功能,又提供硬件功能,这是这个时代的竞争。

功能比较好理解,功能最主要获取方式来自体验。

无论是你通过买不同产品获得体验,还是在供应商那看到新东西,或者自己研发,可以通过体验判断功能价值。只要你愿意做,获得功能与体验没那么难。

愿意做小白鼠很重要。

我们为什么率先出理想汽车iOS APP,是我从iPhone1开始没有短信,要通过贴东西才能用SIM卡。那时很多人嘲笑,李想你小白鼠,为什么要用这些东西?

可能大家不知道,我是中国第一辆雪佛兰Volt,这个通用增程电动车的使用者。很贵,那时40多万买了一辆车。大家会觉得我是小白鼠,小白鼠一个好处是,能获得优先选择权。

我会比所有没体验过Volt的人,更了解增程到底什么样,还有做的不成功的增程,为什么不成功。它的小电瓶与大电池,没有连接在一起。你只有体验,能获得这样一个认知。我说这是功能时代。

到了AI时代不一样,AI时代是能力的时代。

从AI开始,这些头部AI企业必须搞研究。研究工作不是技术本身,还包含比如它跟人类记忆的关系,这样才能对技术方向有效判断。

必须得搞研究,再搞技术研发,再产品化。

前2个步骤如果做不好,直接产品化,根本不行。

有点像月之暗面创始人、CEO杨植麟讲的那句话,屎上雕花。

张小珺:AI时代,企业竞争的维度变了?

李想:对,变了。

张小珺:不可能一家公司不做技术研究,只做产品?

李想:取决于你想成为什么样的AI公司。

如果你想做AI细分里边再细分的小应用,没问题。

如果你想做AI助手,想做基座模型,想做L4自动驾驶,就不一样。

你必须得搞技术研究工作,跑不掉。

张小珺:你怎么看杨植麟说的模型即应用,也就是好的产品是在模型能力提升过程中沿途下蛋,你认可他的这种产品观吗?

李想:认可。

大家最开始说:OpenAI做聊天工具,我们可以做搜索。你今天看,OpenAI在做搜索,OpenAI会进入一个个细分领域。

原来讲功能,今天是能力。能力有了,任何能力所能解决的问题,都能实现。

李想有理想吗?

张小珺:很多人认知你,觉得你是非常实用主义的人。

大家在追求做电车的时,你在做增程,为什么今天对AI技术这么激进,李想有理想吗?

李想:我觉得不是有理想、没理想的问题。

我第一次创业,泡泡网做的不成功,起了大早、赶了晚集。

我后来真正明白一点,是中国古人讲天时、地利、人和,非常之重要,这三个有清晰顺序。

排第一是天时,商业社会什么是天时,天时是技术,是我们对技术有效使用。

作为创业者,如果我做一辆燃油车,还做10挡变速箱,我仍然卖不到奔驰、宝马任何一个品牌在中国1/10的销量。

我如果做增程车,赋予非常好的软件体验与部分AI体验,我可以在很短时间追上奔驰、宝马、奥迪销量,甚至在可见的未来1~2年,超越他们,这是重要技术变革点。

人类跟我们相关最重要的技术变革:一是能源,二是信息。

天时、地利、人和,第一重要是技术,第二重要是地利,在哪创业。

你如果不在中国与美国,想做AI,太难了。

你不是主流语种,没有足够庞大市场,没有足够多人才与这方面投入,包括人才是否经历上一个时代能力的积淀。

第三才是人和,要面对什么样用户,构建什么样组织。

技术第一重要。进入汽车行业,很多人说,巨头们都厉害,几十年没有真正大厂出现,为什么觉得你有戏?

还是我说的,我比汽车厂商更知道怎么做大型软件,比互联网公司更了解汽车,做了10年汽车之家。

进入这行后,我们发现真的跟想的方向一致。

拿汽车行业举例,这是我相信的东西:时代演进方向BT—IT—DT—AI。

奔驰发明汽车,真正汽车行业进入老百姓家是福特开始。

福特跟其他作坊型汽车厂一个根本差异在于,建立流水线与生产线。它用了几分之一的价钱,可以让普通美国老百姓拥有福特T型车。

这时,它干了一件事,是把生产一辆车流程化。

我们内部把流程的简称叫BT,是流程,这是第一阶段。

后来丰田又把流程发挥更加极致,美国到20世纪70年代还成立流程协会,流程协会诞生了后边大量软件公司。

到第二个阶段,是IT出现,是软件,是以控制为目的的软件出现。

我们在建常州第一个工厂时,没有精力自己写工厂软件,我们当时选择是SAP、还是Oracle工厂软件?

当时我问顾问公司:SAP与Oracle有什么不同?他讲,SAP比较反人性,比较死,什么都不能改,好处是所有人不要指望从这边任何一个流程绕过去;Oracle,有比较好灵活定制的能力。

我做互联网出身,肯定觉得Oracle好。当时又问了一句:如果从汽车行业最佳实践看,是什么样?他说,至少在中国,大部分用Oracle,最后都切回SAP。

我当时就明白,这些软件能力,与我们互联网公司构建的软件能力不一样,最主要目的是控制。

包含银行上IT系统,包括制造体系、销售体系上软件系统,都是为了控制。

之前流程靠人来盯着,靠纸来记。

今天跑在软件里,汽车上万个零部件可以标准化生产出来,甚至汽车跑在路上的质量比手机还要好,是BT与IT发挥巨大作用。

第三阶段非常有意思,这个时代描述最好的是,从IT时代进入到DT时代,DT指Data Technology数据技术。

我们做互联网,做汽车之家,所有网站服务用户的软件是自己写的,所有面向客户的软件是自己写的,包括所有数据分析、流量分析的软件都是自己写的。

这是中国成规模的互联网公司必须要有的能力,每个月要服务上亿访问者。

我们当时写这些系统后,会发现跟IT有很大不同。

所有数据必须满足三个条件:

第一、它必须是面向一个客户提供闭环服务。传统公司喜欢叫端到端,互联网公司叫闭环。包括他从进入一个店,到把这个车买走,这是一个端到端。

第二、我要获得原子级数据,而不是控制点的数据。它能反映出所有起因、过程、结果,反映任何一个客户在这里发生业务的全貌。

第三、如果是面向一个用户,它是一个端到端或闭环,大概率会跨业务,甚至跨公司。

比如支付环节到腾讯或阿里。

第三个重要点是,要把财务放进去,获取用户过程是成本,变现过程是收入。只有把财务放进去,才能避免每个专业只看自己一亩三分地。他有看全貌能力,就有使用整体数据的能力。

数据产生以后,带来三个特别好的结果:

第一个结果是,我们最开始做理想汽车,很多人跟我们推荐一些老专家。

我们当时把专家招进来,我还是互联网思维说:你能不能把你知道的know how写出来,发现他写不出来。

这个模型在他脑子里,他写不出来,只有遇到问题,帮你诊断才能解决问题,当时不知道怎么使用老专家。

当我们有了DT以后,当我们写大型软件能获得完整数据,意味着什么?

只要是高成功率、低成本完成一个业务,它是个最佳实践,是藏在老专家脑子里。

哪怕我们遇到问题,这个问题怎么被有效解决,也是最佳实践,这些经验、知识,从老专家脑子里变到我们系统里,这是巨大收益。

这给我们带来非常大一个好处。我们常州第二个厂房,产能不够时,生产L7、L8这2个产品。我们这个工厂,从开始生产到产能爬满,只用了15天。我们团队有来自传统汽车厂商的人,他们说如果在原来企业,需要6~12个月,相当于我们可以把最佳实践有效复制。

这也是我们敢于开直营店原因。

开一家店很难,很多店,从0开始,要养很长时间。我们店里人员是集中来北京或常州培训,我们只要一个店选址没问题,它从开始营业到最后达到1个月超过100辆,大概是3~6个月。会比正常一家新店启动速度快得多,甚至比你找加盟速度还要快。

这是第一大好处:把所有最佳实践沉淀在数据系统里。

第二,它产生什么好处?

就跟我们原来做汽车之家一样,虽说我们了解用户,了解用户,不是跟用户聊,而是认真看用户访问行为,他为什么走,为什么来?

他从不同渠道来了以后,是什么轨迹?他最后出现问题走时,那是真因,我们怎么让他顺畅浏览下去?

比如他看一个帖子页面,10张图片就翻一页,翻着翻着没意思就走了,翻着太累。当我们把1个页面变成50张图1页,他就非常有耐心一直往下看。

我们用这种方式,一方面驱动我们怎么获取用户,让用户停留时间更长,让用户一直留存下来;另一方面驱动我们收入,甚至包括收入怎么定价,都是拿数据决定。

汽车之家,我们涨价,广告客户会抱怨,也没什么可说的。我们完全能通过数据评估,他一个店,我们到底给他带来多少收入、多少利润。

另一点,很多时候是对人的训练。

它比较像什么强化学习RL,Reinforcement Learning,它是给每个使用者一个有效反馈机制。

看我们销售团队,他们是1个月卖20~30辆车的王牌销售,还是卖10辆、卖几辆的?

影响因素排在最靠前的,是他对信息、数据、工具的使用,而不是她是不是美女,或者是内向、还是外向。

第三是最重要的一点,数据里的最佳实践,是AI后训练的全部。

很多基座模型,在解决一些通用能力很好,进入专业时发现,完全没有能力。这些数据不可能放在互联网公开,都是企业独有,是头部企业才懂得怎么获得。

本身你得是卖智能车最好的企业,才能做自动驾驶的训练,否则你过去连传感器都没有,这些数据都没获得。

同样,用户这些驾驶数据,我们肯定也按模型看。驾驶效率最高的,与安全性最高的进行权重,这3%的人,他们clips数据样本怎么放入模型里训练,就形成了端到端模型。

张小珺:听起来,预训练Scaling Law规模效应到达瓶颈,进入后训练Scaling Law,对你们是好事?

李想:是好事,到了物理世界,对我们也是好事。

张小珺:你没有回答我刚才问题,你觉得李想是实用主义的人吗?李想有理想吗?

李想:实现硅基家人那一刻,我真的相信,无比坚定,就连我都可以被它去延续,这算不算有理想?

张小珺:你信仰的是AGI硅基家人,不是AGI?

李想:任何技术一定要赋予一个意义,增程是技术,城市用电、长途发电,是它的意义,这是根本。

第二节、谈智能驾驶

3年我们能推出把方向盘摘掉的产品

张小珺:我们聊聊你们另一个产品智能驾驶,你现在开车百分之多少,会用辅助驾驶?

李想:大概80%。

张小珺:剩下20%,是你们技术不够?

李想:最主要是我赶时间。

张小珺:什么时候可以100%使用自动驾驶?

李想:我自己目标是3年,3年时间,我们能推出把方向盘摘掉的产品。

张小珺:什么时候,能看到理想第一个为自动驾驶L4定义的车?现在已经在定义了吗?

李想:给我3年时间,它需要技术与产品到位,需要环境与政策到位,需要消费者对AI信任到位。

张小珺:你既然说AI这么重要,在你创业之初,就已经决定要做,为什么你们开始智驾是同行里最晚的?

李想:我是连续创业者,最大好处是知道企业发展节奏。

从你没有钱,从0到1,先解决什么问题。

当你有了收入,从1到10要做什么,这是我跟新进入创业者一个根本性不同。

理想汽车早期融资能力最差,融的钱最少。那么多钱情况下,第一个步骤是想着如何把产品做好。我们获得市场认可,有了自己收入,也包含2020年与2021年分别在美国与中国香港IPO,有了更多资金。

2020年初开始,我们开始做技术平台化。类似智能驾驶平台,大家看到的AD Max、AD Pro,座舱平台SS,也开始做整车域控制器XCU,我们在研发有了很大进步。

过去传统供应商我们不再需要,我们自己成为这几个关键零部件、车内控制器的一级供应商。再往后,也包含我们做模型,做电机的碳化硅。

它是一个创业公司往上成长,在你资源有限与资源增长以后,分别投资什么的演进。

张小珺:听说你们之前被供应商欺负的很惨,他们铁了心觉得你们做不出来。

李想:我们经常发出一个邮件,尤其疫情期间,2周以后才有人回复。我们没办法,决定要自己做自动驾驶所有研发,从域控制器开始做。

我们相比特斯拉不缺胳膊少腿

张小珺:自动驾驶上,你们做了2个相对激进的决策:第一、是用只有一个模型的端到端,其他中国车企可能还在用2个模型;第二、你们是第一个取消角毫米波雷达的中国车企,走了以纯视觉为主的技术路线。这2个决策当时是怎么做的,是你拍的板吗?

李想:我经常跟团队说,我们相比特斯拉不缺胳膊少腿,为什么它能做的,你做不到?

我们为什么保留前面毫米波雷达、前面激光雷达?毫米波雷达与激光雷达与做端到端关系不大,端到端是纯视觉。包含我们交互,大家再看到我们下个大版本更新,可以看到端到端、VLM视觉语言模型怎么工作。

很多人不太理解,你为什么要保留激光雷达,是不是你技术不好?

不是,中国与美国不一样。如果你经常在中国夜路开车,你会看到,有尾灯坏了的大货车,甚至大货车直接停在主路,也有不标准的半夜道路施工。一个前面的激光雷达,是为了安全。

我们使用端到端,包括通过Transformer做BEV架构,至少今天摄像头在深夜没有光线下看到的距离只有100米出头,激光雷达在任何没有光线情况下可以看到200米,这就帮助我们实现130公里时速的AEB自动紧急制动系统。

我们是面向家庭的车,每个人生命安全非常重要。这是我们继续保留激光雷达根本原因所在,后面车型会持续保留,激光雷达相当于安全带,帮车主解决重大事故。

我相信如果马斯克在中国,在深夜,在不同高速开过车,他也会选择把前面一颗激光雷达保留下来。特斯拉对安全同样重视,只是他要在这个环境看到。

激光雷达与视觉的配合,安全上有2个作用:一方面,最容易出的事故是钻到大车底下,产生追尾。尤其光线不好,甚至没有光线情况下,如果可以做到,能减少90%以上重大伤亡事故。

甚至我们研发AES自动紧急避让,哪怕他超速,刹不住,我怎么躲避?包括AES的两段式,是第一次躲避以后,遇到问题,怎么做第二次躲避,都是为了让车辆变得足够安全。

我们想办法消除90%以上,甚至最终目标是消除所有重大伤亡事故。

刮蹭还会有,重大伤亡事故,我们尽可能解决掉。

另一方面,是对其他交通参与者的安全。他可能踩的是滑板车,骑的是单板车,也可能喝醉了坐在路上,更好的传感器对安全有巨大帮助。

张小珺:刚才说到那2个,你相对激进的决定,为什么其他中国车企没有马上这么做?

李想:可能跟我们有一些比较好的外脑有关,像王兴、陆奇博士,给我们带来很多启发。

比如,用规则算法,用解决corner case极端情况的方法,能不能解决自动驾驶?解决不了。

他不一定帮你解决,他会给你一些视角。

我说服理想汽车智能驾驶研发副总裁郎咸朋很重要的一点:你们经常解决1个corner case,又出现3个corner case,你是基于这个场景解决这个corner case,场景一变化,又出现新的corner case,你们一辈子都在解决corner case,解决不完。

一次战略会,陆奇博士给我们讲,你们应该思考一下人是怎么工作的,这对我们帮助很大。

我说服郎博,是拿我爱人举例。我爱人也是正常驾校学开车,拿到驾本。她最开始开车经常刮蹭,我给她买了一辆宝马X6,她开起来刮蹭,觉得车是不是太大,X6接近5米长。我又给她换了4米2、4米3的高尔夫GTI,还是刮蹭。你坐在车里说,你不要刮蹭、不要刮蹭,还是会蹭。她会蹭别的车,进小区会蹭门。

怎么解决?当时,我想了一个特别有意思的方式,我家有X6、X5M,我就说,你应该学一学宝马驾驶培训学校,学初级班就可以,一天时间。

宝马驾驶学校的初级班是什么,很重要的是解决你的能力问题,不是解决corner case。

一天下来只学两件事:你开车应该看哪里,教你怎么踩刹车。

我老婆后面基本跟刮蹭告别,开车开得非常之好。她只学了一天,学的是能力。

端到端最后体现出来的是能力,而不是去解决功能、解决corner case。

张小珺:在你看来,端到端是自动驾驶的终极手段吗?

李想:端到端只能解决L3,肯定解决不了L4。

张小珺:L4需要VLA?

李想:对,L4必须使用VLA。

端到端+VLM可以解决L3,比如实现500公里~1,000公里一次接管,让你在车上相对轻松。但它想实现L4,泛化能力远远不够。

L4实现,买车的人会更多

张小珺:你们会像马斯克一样做Robotaxi吗?

李想:我不想做,我们使命是创造移动的家,创造幸福的家。

移动的家终极是L4,幸福的家是硅基家人。

张小珺:会不会Robotaxi到来以后,就没人开车了?

李想:今天租房比买房便宜得多。你拿出存款利息,就可以租到很好的房子,钱都在你手里,但我们仍然买房。

我们为什么要买房、要构建家,我们需要高质量陪伴。我们需要为家人创造稳定、安全、舒适的环境。

车也这样,实现L4自动驾驶,家庭用车更便宜、成本更低。我相信,愿意拥有一辆车的人会更多。

可能5年、10年后,大家重新看,到底Robotaxi是未来主流,还是更多人拥有一辆自动驾驶的车,它使用率很高,能为家人、朋友享用?可能未来几年是分水岭。

我相信,当一个空间变得更好、效率更高、体验更好,我更应该拥有这个空间。

张小珺:你怎么看特斯拉与Waymo路线之争?做L4的派系,如Waymo会说,你们L2辅助驾驶做得越好,就离L4自动驾驶越远。

李想:L2等于规则算法,也有拿规则算法直接做L4的,但在限定场景。

L3实现,来自端到端。

很多过去做L4的公司,也一定在做端到端,在端到端上再做一些迭代与创新。

我相信真正具备广泛性、通用性、而不是特定区域的L4,一定是VLA。

我相信,Waymo、特斯拉最后也会变成VLA。

所有想通往L4的企业可能都是VLA,或者比VLA更好的方式。

大家不会拒绝这件事,就跟大家今天都用Transformer,都用大语言模型一样。

张小珺:这两类公司商业模式呢?

李想:特斯拉与我们比较好的一点是,没有达到L4之前,只要能力提升,就会带来卖车的商业优势。

比如我的MPI接管率,从50公里到500公里,如果别人只有200公里,我的车就会好卖很多;不是非得到L4那一刻,才产生商业模式。

AI领域,经济反馈模型对汽车企业比较友好。汽车本身在内卷,这个反馈方式挺友好,你能力的提升,会直接带来变现与竞争力。

Waymo做得很好,在努力商业化,在旧金山打车占比越来越高。都是一帮足够聪明的人,不用为他们担心。

我们100%会做机器人,但不是现在

张小珺:很多人在问,理想会做机器人吗,特别是人形机器人,既然你要创造硅基家人。

李想:概率是100%,节奏不是现在。

我们如果连L4级别自动驾驶汽车,都解决不了,怎么去解决更复杂的?

车是无接触机器人,包括道路提示、参与者都是标准化的,每个人都受交通规则训练,这已经是最简单的AI机器人。如果车没法实现,其他AI机器人非常有限。

张小珺:对机器人,你们会自己做,还是会投资?

李想:如果世界上有做得好的,我们会合作。如果没有,会自己做。

理想同学,可不可以在手机上使用?可以啊,手机厂商做得非常好,不需要我再去做手机。

理想同学,可不可以接电脑?那也很好,整个浏览器模式是标准化的,你可以把理想同学做成浏览器插件,让浏览器体验变得更好,都是公开的。

你可以在Chrome上做,可以在Safari上做。

别人做得很好,我们不会再做一个相同的硬件。

核心是,如果我们看到一个特别重要的事,没有人解决这个硬件,我们就必须得去做,好的硬件是软件的必要条件。

第三节、谈汽车之战

复盘Mega失利

张小珺:你说你从来不认为电动车是创业终点,现在电动车这场仗还没打赢。

李想:是的。

张小珺:你怎么看待Mega失利?

李想:我觉得分2个阶段,第一阶段是看到一些更表面或者眼前能解决的问题;后面,我们看到的是当时一些选择带来不可改变的东西。

先说一些小问题,比如我们错判Mega市场规模。

我们认为Mega可以在50万以上乘用车里去吃。

L9发挥了这样作用,既能抢轿车,又能抢MPV,还能抢SUV。

Mega出来,我们发现,这个判断有问题。

Mega太长了,有5米3,用户群相对窄一些。

我们抢了很多豪华MPV用户,普遍都是长期MPV使用者买Mega,非常满意。

并没有从太多其他轿车、SUV人群,抢到属于Mega的用户。

他们自己开的时,更愿意开SUV与轿车,这个尺寸停车更方便,倒不是造型。

这意味着我们只能在50万MPV里抢市场。50万以上MPV,1个月4,000辆,我们今天做到1,000辆,25%市场份额,可能还会再大。哪怕我们吃掉50%,也是1个月2,000辆市场份额。

请务必阅读免责声明与风险提示

来源:六合商业研选一点号

相关推荐