AI周报| OpenAI最大“期货”Sora开放使用;谷歌发布量子芯片突破

摘要:当地时间12月9日,OpenAI宣布正式向用户开放AI视频生成模型Sora,此时距离OpenAI首次公开展示Sora已过去大约10个月。据介绍,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放Sora Turbo版本,这是一个生成速度更快的

OpenAI最大“期货”Sora开放使用

当地时间12月9日,OpenAI宣布正式向用户开放AI视频生成模型Sora,此时距离OpenAI首次公开展示Sora已过去大约10个月。据介绍,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放Sora Turbo版本,这是一个生成速度更快的版本。Sora展示的新功能包括用户可使用Remix工具,替换、删除或重新设计视频中的元素。此外,用户还可以找到最佳的帧并在此基础上扩展成一个场景(Re-cut),还可以在时间轴上编辑视频的独特序列(Storyboard)、使用Loop工具剪辑并要求Sora生成无缝衔接的重复视频、将两个视频合并为一个无缝衔接的视频(Blend)等。

点评:此次Sora提供的新功能更方便用户创建视频生成的工作流,让Sora在用户手中变得更加可控。值得注意的是,使用Sora并不便宜,目前只有ChatGPT Plus订阅用户和ChatGPT Pro订阅用户可以使用Sora,其中只有ChatGPT Pro订阅用户可以生成单个20秒的视频,ChatGPT Pro订阅费达到每月200美元。这么高的订阅费将很多ChatGPT用户放在门外,具体Sora的效果如何,还有待更多用户反馈。

谷歌发布量子芯片突破

12月10日,谷歌在官网发布了其量子计算最新进展,其最新研发的量子芯片Willow在不到5分钟内就完成了一个基准测试任务,而即使是如今最快的超级计算机,也需要花费“10的25次方”年的时间才能完成这项计算,这个数字远超宇宙年龄。谷歌表示,随着团队使用更多的量子位进行扩展,Willow可以成倍地减少错误,解决了该领域近 30 年来一直在研究的量子纠错的关键挑战,为实用的大规模量子计算机铺平了道路。

点评:谷歌最新的量子芯片是向大规模、纠错量子计算机迈出的一大步,谷歌量子人工智能创始人兼负责人哈特穆特·内文介绍,它的纠错能力和超越经典的计算能力使我们更接近一个可以提供商业应用的系统,从帮助发现新药,到设计更高效的电动汽车电池,再到加速核聚变和新能源替代的进展。许多这些未来改变游戏规则的应用程序在传统计算机上是不可行的,它们正等着用量子计算来解锁。

中央经济工作会议提“人工智能+”

中央经济工作会议于12月11日至12日在北京举行,会议确定了2025年的九大重点任务,其中第二点提到要开展“人工智能+”行动,培育未来产业。会议还表示,要以科技创新引领新质生产力发展,加强基础研究和关键核心技术攻关,超前布局重大科技项目,积极运用数字技术、绿色技术改造提升传统产业。

点评:近年来,人工智能行业发展受到各级政府的高度重视和国家产业政策的支持,国家陆续出台了多项政策,鼓励人工智能行业发展与创新,包括《关于支持建设新一代人工智能示范应用场景的通知》《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》等,在2024两会政府工作报告中,更是首提“人工智能+”概念。行业分析,在未来,AI在工业和教育等行业应用的机会比较广泛。

谷歌发布Gemini 2.0系列模型

12 月 11 日晚,谷歌正式发布其最新版大模型Gemini 2.0系列,谷歌表示这是他们迄今为止最强大的人工智能模型,“专为智能体时代设计”,并同时介绍了多个智能体应用(AI Agent),包括多模态对话助手Project Astra‌ 、完成复杂任务的智能体 Project Mariner、能够帮助开发者的编码智能体Jules等。谷歌CEO桑达尔·皮查伊(Sundar Pichai)在X上着重提到了智能体Project Astra,认为其“展示了通用 AI 助手的曙光”。皮查伊表示,“2025 年将是令人兴奋的一年。”帖子下则有评论表示,2025 年会是属于智能体的一年。

点评: 值得一提的是,临近2024年底,AI智能体频频被行业人士提及。所谓智能体,简单来说是能够感知环境,具有独立思考和行动能力的AI程序。传统AI通常是指令驱动的,需要人类用户输入指令才会执行相应的任务,AI智能体则有独立解决任务的能力。“随着越来越多的大厂布局AI Agent产品和生态,预计2025年将会成为AI Agent商用爆发的年度。”中信建投证券在月初表示。

全球首个AI程序员Devin全面开放,月费500美元

全球首个“AI程序员”Devin于12月11日全面开放,距离其初次亮相尚不到一年。其开发商Cognition Labs宣布,个人开发者和工程团队可以每月500美元获得完整访问权限,订阅还包括Slack集成、IDE扩展以及专业的技术支持。对于大型企业,公司提供定制的企业版解决方案。

点评:AI代替部分程序员的速度又加快了。据悉,Devin能够熟练运用多种编程语言、独立完成网站和应用程序的构建与部署,甚至可以自主发现并修复代码缺陷。官方表示,其已通过多家AI公司的实践性工程师面试,并成功在Upwork等自由职业平台上完成实际项目。

ChatGPT集成到苹果iOS、iPadOS和macOS系统

当地时间12月11日,OpenAI宣布,ChatGPT现已集成到苹果iOS、iPadOS和macOS中,允许用户直接在操作系统内访问ChatGPT的功能。当用户向Siri询问复杂问题时会触发ChatGPT,当Siri被问到苹果软件认为更适合ChatGPT来回答的问题时,系统会请求用户访问OpenAI服务的权限。苹果表示,这项集成使用了OpenAI的GPT-4o模型。苹果已在相关功能中内置了隐私保护功能,OpenAI不会存储用户发出的请求。

点评:根据苹果此前的计划,Apple Intelligence今年10月正式上线,从美国英语开始推出,还有一个版本针对英国、澳大利亚、加拿大、爱尔兰和新西兰进行了本地化,苹果会在明年4月增加更多语言。ChatGPT此次也加入了“苹果全家桶”。这些AI功能加入后在海外是否会拉动购机潮还需要观察。

亚马逊成立AGI实验室,瞄准数字世界“全能AI助手”

12月9日,亚马逊宣布在旧金山设立新的研发实验室——Amazon AGI SF Lab,这是该公司在人工智能领域的又一重大战略布局。这家实验室由Adept联合创始人David Luan亲自领导,其核心目标直指打造能在数字和物理世界中“采取行动”的AI智能体,并能处理跨越计算机、网络浏览器和代码解释器的复杂工作流程。

点评:据悉,实验室初期研究重点聚焦于几个关键方向:使AI智能体能执行真实世界行动、从人类反馈中学习、自主纠正以及推断人类意图。目前,AI智能体正成为科技行业的兵家必争之地。据Emergen Research预测,这一细分市场规模有望在年底前达到310亿美元。Capgemini的调查显示,82%的企业计划在三年内整合AI智能体技术,看中的正是其可能带来的效率提升。

ChatGPT宕机数小时后恢复

北京时间12月12日,OpenAI表示,ChatGPT和Sora无法访问后,公司正在努力修复中断问题,已经确定了问题所在,在努力推出修复方案。几个小时后,ChatGPT才恢复正常。此前OpenAI宣布正式向用户开放AI视频生成模型Sora。随后OpenAI CEO山姆·奥尔特曼(Sam Altman)表示,OpenAI严重低估了用户对Sora的需求,要让每个人都能访问Sora还需要一段时间。

点评:此次宕机的具体原因还未公布,不过,综合Sora向用户开放使用后该应用出现的延迟问题,宕机有可能是因为太多用户涌入OpenAI的服务器导致的。相比语言大模型,视频大模型生成需要更多算力,人们通常需要等待更久才能获得生成的视频,需要大量算力可能也是Sora目前只向付费用户开放使用的原因。

面壁智能获得新一轮数亿元融资

12月11日,面壁智能CEO李大海发出全员信,宣布公司完成新一轮数亿元融资,该轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投。本轮融资后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局。据悉,面壁智能发力端侧模型,自研了面壁“小钢炮”MiniCPM,MiniCPM系列模型自今年2月发布以来,累计下载突破300万。

点评:李大海认为,行业在2024年下半年形成共识,要向更高知识密度的小模型和端侧智能发展。在端侧智能方面,面壁智能在主流消费电子硬件和新兴硬件中融入端侧AI,同时布局端云协同的未来范式,与华为云、百度智能云等达成战略合作。

博通全财年AI收入增长了220%

当地时间周四,博通公布2024财年第四季度业绩。第四财季营收140.5亿美元,较去年同期增长51%,净利润为43.2亿美元,较上年同期增长23%。该季度包括人工智能芯片业务在内的半导体解决方案部门营收82.3亿美元,同比增长了12%。博通表示,生成型人工智能基础设施繁荣带来公司业务需求飙升。该财年公司的人工智能收入增长了220%,达到122亿美元。

点评:博通业绩受到AI需求驱动。人工智能收入的增长部分来自以太网网络部件,这些部件用于将数千个人工智能芯片连接在一起。此外,博通还透露,该公司正在与三家大型云客户开发定制人工智能芯片。不过,近日也有消息称苹果考虑在iPhone和旗下家居产品中用自研芯片替代博通的产品,这对博通而言并非好消息。

来源:第一财经一点号

相关推荐