2024年的AI感想 2025年的猜想

360影视 2024-12-25 13:34 3

摘要:传统IT行业,就算传播节奏再快,产品技术发布也是有很强的规划和周期的。比如苹果一年一度的WWDC,下个月的CES(我大概率会参加一下)。

作者 | 高飞

编辑 | 周周

今天参加了新浪微博的AI“年度盘点”,其中涉及两个提问的讨论:

1、2024年,AI是否真的已经进入或者影响到了你的生活?

2、2025年,AI将给哪个行业带来颠覆性影响?

感觉这两个提问都蛮有意义的,这里浅浅地写些随想。

提问一:2024年,AI是否真的已经进入或者影响到了你的生活?

答案是肯定的。当然,用生活这个词可能不一定那么准确,说工作爱好会更准确。

我是科技媒体行业的,所以先谈AI对媒体传播行业的变化。

有句话叫“AI一天、人间一年”,这句话用在技术传播领域,一点都不夸张。

传统IT行业,就算传播节奏再快,产品技术发布也是有很强的规划和周期的。比如苹果一年一度的WWDC,下个月的CES(我大概率会参加一下)。

但AI时代,技术传播的玩法完全变了。时间上,每天都有技术发布;节奏上,相当不可预测。

拿OpenAI和谷歌Deepmind这对冤家来说:

2月份,国内春节,谷歌Gemini 1.5发布,本来是个大新闻,支持100万Token的上下文。但OpenAI的Sora横空出世,一下子夺走了前者的风头。回过头来看,这个“期货”足足等了一年才正式发布,所以抢头条的意味不能更明显;

5月份,谷歌I/O大会,核心内容是多模态,OpenAI又在前一天发布了GPT-4o助手,来了一个截胡。

终于,等到12月份OpenAI开发布会,谷歌在中途连发量子芯片Willow、Gemini 2.0等重量级产品,显然是“忍无可忍,无需再忍”。

谷歌这几场活动,至顶科技旗下的科技行者受邀做了专访,所以印象特别深刻。

当然,其实AI传播战争,并不止于这两家,其他模型公司发布产品,也往往是“X上一个推文,油管上一场播客结束战斗”。

如Anthropic的MCP,Meta的Llama新开源版本,Pika、Runway等公司的模型新特性,QWQ、Deepseek的开源模型更迭等,都如此。

*然后再用一点篇幅,说一下生活方面的变化。

从我个人来讲,AI带来的最大变化,就是对阅读的颠覆影响。

我比较爱读书的。在前模型时代,读书遇到的最大问题,是看到书中不理解或脑洞大开的片段,想找作者本人,或者相关专家交流而不得。

尤其是看到不理解的地方,更痛苦。

比如你看到作者说,“这个部分我就不展开了,懂的自然懂”,而你偏偏不懂,肯定“抓心挠肝”。

这就像搞数学的人,看到费马1637年在书的空白处写下:

关于此(问题),我确信发现了一种美妙的证法,可惜这儿的空白处太小,写不下。

后人已经为此苦恼了400年!

没有GPT的时候,有疑问我们只能去搜索或社区提问。但是,和我们有同类想法,又把心得发到网络上的人,少之又少。长尾效应?只有长尾,没有效应。

而现在,AI就是阅读最好的助手。

今年,我已经完全习惯了和AI一起读书看论文。由于大模型的通用能力,我读书的广度和深度也有很大变化,跨学科、高难度的书都会拿来挑战一下。

因此,当我两周前,看到Andrej Kaparthy发的一个推说:

“我最喜欢的 LLMs 应用之一是共同阅读书籍。我想提出问题或听到产生的讨论(NotebookLM 风格),同时根据周围的内容自动调节。如果亚马逊或其他公司能制造出一款能正常工作的 Kindle AI 阅读器,我想这将会是非常棒的。”

那一瞬间,我立刻感受到了什么叫做心有戚戚焉。

当然,当我们说读书的时候,其实是在说学习。

也正是感受到了AI对实际工作生活的影响,也促成了我们和一些给力的合作伙伴一起,在上个月,开成了国内首个面向提示工程的大会“PEC-提示工程峰会”,目的就是推动AI使用的普及和落地。

今年,也因为对这个主题的研究,有幸在西藏、济南、上海、北京等地,面向专家教授、C-Level朋友做了AI心得分享。

GPT、Claude、NotebookLM、Perplexity,以及谷歌刚发布的DeepResearch,已经是离不开的AI助手。

提问二:2025年,AI将给哪个行业带来颠覆性影响?

相比于讨论对个人生活兴趣的影响,对行业影响这个主题比较宏大。

千行百业之中,我们很难一一列举。

我试着给出一个相对底层的框架,供大家参考,叫做:“从哪里来,到哪里去”。

这句话借鉴了哲学三问——你是谁,从哪里来,要到哪里去。

具体解释一下:

先引用一个博文讲“你是谁,从哪里来”。

2023年6月10日的时候,OpenAI的一位研究员James Betker写了一篇非常重要的博客, 标题叫“The ‘it’ in AI models is the dataset.”,翻译过来是“AI模型中的它就是数据集“

他在博客中讲了这样一段话:

”在同一个数据集上训练足够长的时间,几乎每个模型在有足够权重和训练时间的情况下都会收敛到同一个点……这是一个令人惊讶的现象!这意味着模型行为不是由架构、超参数或优化器选择决定的。它是由数据集决定的,与其他无关。其他一切都只是一种手段,目的是高效地将计算结果用于逼近该数据集。“

这段话的核心意思是:数据集,才是模型的本质。

模型是谁?是数据的化身。模型从哪里来?从数据集中来。

再谈AI“到哪里去”,会影响什么行业。

其实,答案就呼之欲出了。

所有为当前模型提供主要“数据集”的行业,都会受到颠覆影响,比如”文章报道、代码、百科知识“等相关的。

因为,大模型已经学习了互联网上几乎所有的相关知识,并且将他们收敛为万亿级的参数。

某种程度上,大模型就是互联网知识的平替。

在AGI实现之前,“平替”就是AI对人类最大的冲击。

所以,如果一个行业的主要成果,都已经被上传到互联网上成为公开信息,那么这个行业就是最容易被颠覆的行业。

这就是我所说的AI会到“到哪里去”。

一个例子,首当其冲的就是编码

不久前,Menlo投资发布了一个企业AI应用调查报告,统计了生产环境中最受欢迎的AI场景,排名第一的就是“编码生成”,以51%的提及率,遥遥领先于排名第二的“客服机器人”(31%)。

为什么会这样?

因为编码是开源文化占主导的行业,很多重要贡献都是开源共享的。

有这样优秀的数据集,AI在这个场景的效果自然会好。

这让我想到西方希腊神话中著名的桥段“弑父情结”——新一代神明挑战并取代父辈的统治。典型例子包括克洛诺斯篡位其父乌拉诺斯,以及宙斯后来推翻克洛诺斯,成为奥林匹斯的主神。

刘慈欣写过一部小说《赡养上帝》,也有类似的寓意。

所以,AI逐渐取代人类做编码,某种程度就是这样一种弑父关系吧?

据说,谷歌的1/4的编码已经由AI完成,亚马逊AWS的CEO也说”人类编码消失指日可见“,这些话可能有夸张成分,但趋势是不可逆转的。

Transformer论文作者、Cohere创始人Aidan Gomez在接受播客采访时,也讲过一段话,大意是:所有创造了大模型的技术,都会逐次被大模型所取代。

但是,人类程序员会无事可做么?当然不是。

Andrej Kaparthy讲的另一段话我也很认同。对于技术工作,除了提示工程可以协助完成的编码,其实还有很多技术工作很重要,类似胶水。

这些胶水,既包括开发环境的配置,也包括和产品市场部门的需求对齐和协作沟通。

因此,提示工程师+胶水技能,就会打造未来新的技术人群:AI工程师,也是我们想报道和服务的人群。

在这个部分的结尾,说一下两个技术点:

*一个是伴随o1而来推理扩展,也就是测试时间计算。

显然,随着o3等模型的最终发布,强化学习和注意力机制的结合,让模型的推理能力进一步加强。

因此我认为,从2025年开始,模型将脱离复刻人类知识的旧阶段,进入运用已有知识、解决新问题、创造新知识的新阶段。

Google 旗下公司 DeepMind 的创始人戴密斯·哈萨比斯(Demis Hassabis)团队获得诺贝尔化学奖已经是一个例证。

所以,最近我经常在团队内部说:

1、以后,面对面、手握手的工作,才是AI一时难以取代的。

数十年来,白领至于蓝领的优势,也将发生逆转,直到人形机器人普及(这可能还要至少5年,但我们非常看好,限于篇幅不展开说了)。

2、谁更快拥抱AI,谁就越不用担心AI。

一个类比:

你面前有一个坏人,地上有一个斧子;坏人就是我们所面对的工作生活挑战,斧子就是AI;斧子固然是一种武器,但更是保护自己的工具。

*另一个知识点就是具身。

如果说测试时间计算是模型的纵深发展,那么世界模型的创新、物理数据的累积、具身智能的突破,则是模型的横向扩张。

以真实世界数据(当然也包括合成数据)的多模态,将在2025年进入爆发前的起飞期。

*最最后,再说一下常用的模型工具。

如果说人类有种族,我觉得模型也会有种族,因为我越来越发现,单一模型是很难解决全部工作问题的。

虽然数据让模型拥有大致相同的基因,但是在产品端,模型的表现是参差多态的。

不同尺寸、多种形态的模型,融合在业务工作流中,才是agent的正确打开方式。

我订阅了几乎所有主流前沿模型,包括Gemini 、GPT、Claude、Perplexity、Grok,它们都在Lmarena这个竞技场排行上,但功能已经出现分化。

于我而言:

GPT依然有更好的推理解释,也有我常用的GPTs应用;

Claude的创意写作和编码独步江湖,SVG绘图常常用于PPT创作;

Perplexity是核查信息的助手,写作引用必备;

Grok用于检索X上的信息和绘制真人图片(马斯克:什么是政治正确?);

Gemini的长上下文优势无可替代,再加上最近的Deep Research特性和AI studio、NotebookLM上的多模态也是各有千秋。

所以,我觉得在AI面前,人类不要站队,谁好用就用谁。

当然,我们更不能用“刻舟求剑”的思维看AI。2024年12月的AI,注定和25年1月份的AI不一样。AI有过三次寒冬,可能还会有第四次,但一定不是现在。

回顾人类所有颠覆性技术发明,它们创造的新工作岗位,远大于它们毁灭的工作岗位,并因此谱写新工业革命的欢歌;但另外一方面,这其中是被毁灭的“少数”,其实也是一种时代的悲歌。

AI是一种技术,但是它对社会的影响,远在技术之外。

前无古人,后无来者。

来源:至顶网

相关推荐