大模型走向破圈,这届春节AI味太浓了

360影视 2025-01-29 11:40 2

摘要:在一些不易察觉的场景中,AI正推动着社交维度的代际融合,典型的例子,不仅00后能借助AI花式拜年,使用实时AI美颜与背景替换技术生成祝福视频,连耄耋之年的老人也能通过简化界面实现“数字守岁”。

作者|鹿尧

过去两年,AI技术正以惊人的速度渗透至普通人的生活。

从2023年ChatGPT掀起全民对话热潮,到2024年AI绘图工具让小学生也能创作漫画,技术不再是极客的专属玩具,而是如水电气般融入日常。

在一些不易察觉的场景中,AI正推动着社交维度的代际融合,典型的例子,不仅00后能借助AI花式拜年,使用实时AI美颜与背景替换技术生成祝福视频,连耄耋之年的老人也能通过简化界面实现“数字守岁”。

在2025年的春节,一场由AI掀起的“数字年俗”在全中国引发狂欢。当“广场舞大妈舞到全世界”、“兵马俑用陕西方言送祝福”、“小学生自制AI文旅地图成为班级明星”成为春节社交平台的热梗,这场看似魔幻的狂欢背后,藏着中国AI技术的一次全民级落地实验。

百度用多模态AI技术重构了传统年味儿——从数字人拜年视频到超真实文旅地图,从方言搜索到智能体导游,从北上广来到县城乡村,广场舞大妈、10后小学生、方言老人都能成为AI时代的头号玩家,科技与烟火气碰撞出前所未有的热闹

这或许也揭示了2025年AI的关键命题:当最前沿的技术能够真正融入到最朴素的场景时,超级应用爆发的临界点已不再遥远。在这场竞赛中,谁能把技术变成人间烟火,谁就能真正把握AI时代的游戏规则。

01

最有AI味的一年

有三个现象火了

现象一:全球广场舞大妈“占领”地标,AI让拜年变成魔幻狂欢

“姐妹们快看!我在凯旋门前跳《最炫民族风》!”大年初一,山东济南的王阿姨在家族群里扔出一段视频:她身着红袄,带领一群数字分身“占领”法国凯旋门,背景音乐响彻戴高乐广场。

这是百度搜索“瞬移世界拜个年”的杰作——用户只需上传一段视频,选择巴黎铁塔、自由女神像等地标,AI就能自动生成在全球任意地点的超真实视频,连动作幅度都精准匹配广场舞的神曲节奏。

王阿姨的操作简单到“比发朋友圈还容易”,打开百度搜索“瞬移世界拜个年”,进入活动会场、点击入口打开“拜年视频创建页面”、跟着提示录制一段拜年视频,选择背景音乐和拜年背景,几十秒后视频就能自动生成。

这种零门槛造梦的玩法迅速风靡,甚至有年轻人戏称,今年春节,广场舞大妈才是真正的“元宇宙原住民”。

现象二:AI真人贺卡刷屏,脑洞设计碾压传统祝福

在北京某互联网公司工作的小李今年不打算回家,但怎么给亲朋好友拜年成了让他头疼的问题。不过他很快发现,通过百度“定制照片贺卡”功能,就能把自己P到月球表面贴春联、在白宫门口撒红包。

你只需要在百度App内搜索“AI拜年”,进入定制页面,上传自己想“玩”的照片,输入“在火星放鞭炮”“在故宫屋顶舞龙”等指令,加上祝福语,AI就能自动合成场景生成一张独一无二的新年贺卡,全程不到两分钟。

除此以外,如果想让AI开口祝福,那么就打开小程序“百度智能云曦灵数字人”,上传一张自己的清晰照片,让AI快速克隆出一个数字分身,生成流畅的口播祝福语视频,为亲朋好友表达祝福。

更绝的是“跨界混搭”,蒙娜丽莎手持春联、达芬奇用意大利腔中文祝福,这些历史名人拜年团视频在全网点赞破百万,评论区清一色“笑到劈叉”“AI把我缺失的幽默感补上了”。

现象三:方言智能体化身“赛博搭子”,10后小学生变身文旅达人

“跟着秦小俑,三天吃遍西安不重样。”陕西的10后小学生乐乐,通过百度文旅智能体“秦小俑”,用陕西方言问出“哪家肉夹馍肉最多汁”,AI不仅推荐了回民街老店,还附赠“避开游客高峰的秘籍”。

这个春节,34省的赛博导游彻底火了,天津的“baibai”用相声腔调讲解古文化街、湖南的“芙小兰”推荐辣到飙泪的臭豆腐摊、福建的“簪花花”带你寻找土楼最佳拍照角度……用户只需在百度搜索“AI旅游”,就能召唤本省智能体,用方言语音查询路线、预订门票甚至“一键打电话”给虚拟导游。

辽宁一位小学生更是借助百度文旅智能体自制“中国文旅地图”,引发全网数百万讨论。而不会普通话的老人也找到救星,河南陈大爷在儿子的指导下,在百度APP上直接用方言喊出“咋缴燃气费”,手机瞬间弹出操作视频,他感慨,“这比等儿子视频教我省心多了!”

从广场舞大妈到小学生,从一线白领到县城老人,百度AI用三大现象证明:技术可以既有“脑洞大开”的趣味,又有“接地气”的温度。这场狂欢最动人的地方在于,科技不再高高在上,而是成了每个人触手可及的年俗制造机

02

三大现象的背后是百度AI

诺贝尔经济学奖得主西蒙・约翰逊曾在其著作《权力与进步》里提到,任何社会、经济领域的真正进步不是自动实现的,而是在细节处行驶,其中关键在于,科技发展的方向要符合大多数人的利益,才可能出现一个全新、更具包容性的技术前景。

同样的逻辑,春节期间三大脑洞大开的玩法,表面上是AI拜年视频、魔幻贺卡、方言导游的热闹,其内核则传递出百度对AI落地关键命题的解答:如何让技术从少数人的玩具,变成多数人的工具?甚至是跨越地域与年龄的鸿沟实现技术普惠

就拿“广场舞大妈占领全球地标”来说,涉及到数字人技术和动作驱动算法,用户上传一张照片,AI通过大模型图像识别算法提取面部特征,结合百度海量人类动作数据库,生成与音乐节奏匹配的舞蹈视频。

百度曦灵数字人同样采用了照片数字人视频合成的技术,无论是自拍还是历史人物画像,大模型算法可以从照片中提取人脸的结构和特征,构建初始模型。

而为了让数字人更逼真,技术团队又做了两件事,一是“动作库”,他们收集了大量头部动作和面部数据,训练出一种动作驱动的算法模型,来学习人脸的变化规律;考虑光线、皮肤质感等影响,还会通过算法实时进行渲染和调整,这样一来,人脸动得更自然。

二是“唇音同步”,AI能根据语音内容自动调整数字人的口型,快速生成与音频完全同步的唇形动作,一改以往数字人在说话时常出现口型与语音脱节、生硬等情况,让视频表现更加真实流畅。

而AI真人贺卡刷屏的背后,是一场针对“AI幻觉”的精准手术。举个例子,当用户输入“梅西在白宫撒红包”时,传统文生图模型可能混淆人物特征或建筑结构,这其实是以往RAG(检索增强生成)技术的局限性:完全基于大语言模型的文生图系统,生成的图片经常“一眼假”,甚至不合逻辑。

今年年初,为了解决图像生成的幻觉问题,百度自研了iRAG(image based RAG)技术,给AI生图装上了防翻车指南。

形象地来说,iRAG的突破在于引入“事实校对”机制,比如同样是生成“梅西在白宫撒红包”,系统会先查资料再创作,先调用百度搜索中的亿级图片资源,定位“白宫门廊结构”“梅西面部特征”等关键信息,再让模型基于真实数据生成图像,而非凭空想象。

就体验感而言,基于iRAG特定对象生成的图像效果,达到无幻觉、超真实、无成本、立等可取。在CEO李彦宏看来,“AI必须学会尊重事实,而不仅是模仿风格。” 他曾现场展示过由文心大模型生成的某品牌汽车飞跃长城的图片,无论是车型、车标还是与长城背景的融合度都非常高。

今年春节AI的另一大看点,体现在百度在语音技术的突破上。当北上广白领已经用AI做PPT时,县城老人还在为“如何打字查公交”发愁。百度方言语音技术的破局逻辑很直接:让AI说人话,更要听懂“人间话”

34省方言智能体的实现,依赖两大核心技术:语音大数据挖掘与音色迁移

技术团队通过抓取海量方言对话,训练出能识别“塑料普通话”“混杂口音”的模型,连“中不中”、“得劲儿”都能精准解析;为了让AI不仅听得懂方言,还能说出方言,百度运用大数据驱动,将普通话与各种方言纳入统一建模框架之中,通过各种音色与方言的迁移学习,训练出能够合成多种方言的通用模型,让东北主播的声音也能轻松说出闽南语、粤语。

某种程度上,这种“技术俯身”的策略直击下沉市场痛点,正如一位用户在社交平台的感慨:“今年春节最让我感动的,不是AI多厉害,而是它终于不再装高冷,成了咱普通人的万能搭子。”

在李彦宏看来,AI普及的关键,是找到技术杠杆与民生痛点的支点,百度春节活动的成功,正是这一理念的具象化。技术普惠的本质不是“让农民学代码”,不追求“无所不能”,而要“无处不在”,这也是百度对AI落地的独特理解。

03

从蛇年春节看25年AI趋势

2025年蛇年春节,一场由AI驱动的“数字年俗革命”席卷全国,当AI环球盲盒拜年视频让普通人30秒变国际巨星、智能体导游用各地腔调讲解古文化街时,背后是百度多模态技术的集中释放:从文本生成到语音交互,从图像合成到视频驱动,AI不再满足于单一维度的表达,而是将文字、图片、声音、动作融合交响。

这种多模态能力的爆发,不仅改写内容生产领域的游戏规则,降低了内容创作的门槛与成本,行业数据显示,2025年AI多模态模型的训练数据中,非文本内容占比相比2023年明显跃升,图像、视频、语音的“数据三角”正成为厂商争夺的新战场。

比技术升级更具颠覆性的是用户群体的“下沉革命”。AI工具的使用者画像从“高知极客”扩展到了“小镇青年”“银发族”甚至“小学生”。百度方言语音搜索的日均调用量中,河南、四川等地下沉用户占比越发凸显,而文旅智能体在县域景区的使用率也在上升。

这种从都市到乡村的用户迁徙,揭示了AI产业的终极悖论:“最前沿的技术,往往藏在下沉市场最朴素的场景里。”百度用一场春节狂欢证明,AI革命的胜负手,不在实验室的算力竞赛,而在普通人的每一次点击。

李彦宏在2025年全员信中表示:大模型赋能的AI原生应用,正在各行各业各种场景迅速普及。虽然超级应用尚未出现,AI的实际渗透率已经不低。

春节的AI狂欢更像一场“超级应用”的预演。当百度文心智能体让用户一键创建方言导游、iRAG技术将品牌海报成本压至近乎为零、方言搜索日均服务不断上升时,AI已从“特定场景工具”进化为“万能搭子”。

伴随AI应用深度和场景的不断拓宽,大胆推测,超级应用可能在2025年率先在C端爆发,届时,这一年或许会被铭记为“AI平民化元年”,而百度已经站在潮头。

来源:新眸

相关推荐