摘要:当地时间周五,OpenAI在为期12个工作日的新品发布活动的最后一天展示了o1模型的下一代o3,并表示该模型有o3版本和精简版o3-mini。OpenAI会在1月底前正式推出o3 mini,并在之后推出完整版的o3。据OpenAI评估,o3在软件工程、编写代码
OpenAI展示新模型o3
当地时间周五,OpenAI在为期12个工作日的新品发布活动的最后一天展示了o1模型的下一代o3,并表示该模型有o3版本和精简版o3-mini。OpenAI会在1月底前正式推出o3 mini,并在之后推出完整版的o3。据OpenAI评估,o3在软件工程、编写代码、掌握人类博士级别科学知识能力等方面强于o1。在以100%为最高分的ARC-AGI评估中,o1系列得分在8%~32%之间,o3最低得分75.7%、最高得分87.5%。OpenAI表示,o3在ARC-AGI评估中获得破纪录的分数,o3在某些条件下可以接近实现通用人工智能。
点评:o3模型是o1模型路线的延续,注重大模型推理。o3模型的能力具体如何,还要等OpenAI正式发布和上线。从o3的ARC-AGI评估得分看,大模型距离实现AGI(通用人工智能)再进一步,就这种注重大模型推理部分的路线,有业内人士告诉记者,这种路线可以降低大模型的错误率,未来也有可能用于解决重大科学问题。
苹果国内AI合作方或生变
有消息称,苹果正在与腾讯和字节跳动商谈将两家公司的AI模型整合到在中国销售的iPhone中,但谈判仍处于早期阶段。就该消息的真实性,腾讯方面向记者表示:“不予置评”。目前字节跳动也暂无回应。此前早有传言称百度是苹果在国内的AI合作方,但不久前消息称双方在技术和隐私问题上存在分歧。
点评:苹果iPhone AI功能已在海外多地逐步推出,苹果或需尽快敲定国内的AI合作方。在几家潜在合作方中,字节跳动的模型豆包已与多家安卓厂商合作。目前多家大模型厂商已在推动智能体落地,手机被认为是智能体落地颇具潜力的一个场景。苹果国内AI合作方生变消息传出后,12月20日,港股百度集团股价跌2.56%,腾讯控股股价涨2.7%。
谷歌发布推理模型Gemini 2.0 Flash Thinking
12月20日凌晨,谷歌DeepMind首席科学家Jeff Dean宣布推出全新测试模型——Gemini 2.0 Flash Thinking。Dean通过一段视频展示了该模型如何解答物理问题,并提供解决方案。该模型可以通过可视化的方式展示整个思维链过程,可以持续输出推理过程,而不是直接给出答案。谷歌CEO桑达尔·皮查伊(Sundar Pichai)在社交平台上分享道,“这是我们到目前为止,经过最多仔细研究和设计推出的模型。”
点评:Gemini 2.0 Flash Thinking 发布后,网友们纷纷点赞,表示乐见其与 ChatGPT 和 Claude 等聊天机器人的竞争。 Gemini 2.0的一个显著特点是允许用户通过下拉菜单访问模型的逐步推理过程,这在OpenAI的o1和o1mini等竞争模型中并不具备。这种透明的推理方式使得用户能够清楚了解模型得出结论的过程,有效解决了AI被视为“黑箱”的问题。
Kimi发布视觉思考模型k1
12月16日,月之暗面kimi发布视觉思考模型k1。据介绍,k1模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。在数学、物理、化学等基础科学学科的基准能力测试中,初代k1模型的表现超过OpenAI o1、GPT-4o和Claude 3.4 Sonnet。
点评:视觉思考模型结合了图像理解和思考能力,可以直接输入图像信息而不需要进行一些额外的信息处理。在o1推出后,月之暗面等厂商也在跟进这一条长思维链推理的路线,对强化学习技术也更加重视。月之暗面在相关文章中便表示,AI大模型行业的技术范式正在发生变化,现在已经处于强化学习的新时代。
闪极发布AI眼镜:接入数十家大模型,售 999 元起
12 月 19 日晚,充储能创业企业闪极发布新款 AI 智能眼镜——闪极 AI“拍拍镜”,零售价 1499 元,共创版售价 999 元(春节前限量 5 万台)。目前,产品已在京东、天猫等各渠道的官方店铺开启预售,将于1 月15日左右发货。据悉,这款眼镜同时兼顾了相机、音箱、录音笔、智能助手等功能,并搭载AI记忆系统,有云盘、闪记、Agent Store、云端AI中心等部分。闪极表示已经或即将接入数十家头部的大模型厂商,包括文心一言、讯飞星火、字节豆包、通义千问、腾讯混元、Kimi、智谱、商汤、MiniMax等,也支持接入私有 Al 模型。
点评:对于眼镜背后AI模型的选择问题,闪极合伙人潘欣对记者表示,用不同的模型可以更好地各取所长。他同时提到,眼镜是最适合生成式AI落地的穿戴设备。眼镜是离人五官最近的穿戴设备,可以让AI见人所见、听人所听,给AI最需要的数据原料,同时,眼镜有700年历史,在人群中有广泛的接受度。
智谱完成新一轮30亿元融资
12月17日,国内大模型独角兽智谱完成新一轮30亿元融资,新战投和国资加入,老股东跟投。据了解,本轮融资将用于智谱GLM大模型系列的进一步研发,从回答问题到解决复杂推理、多模态任务,用于支撑行业生态发展。在公布融资消息的同时,智谱透露,MaaS (模型即服务)平台今年日均Tokens消耗量增长150 倍,2024年商业化收入增长超过 100% ,C端产品智谱清言则拥有超过2500万用户,年化收入(ARR)超千万级。
点评:这是智谱近期可查的第二轮融资。今年 9 月,中关村科学城公司宣布以投前200亿估值领投智谱,用于支持国产基座大模型的技术创新和生态发展。尽管今年国内一级市场格外冷清,但AI融资依旧轰轰烈烈,动辄数亿元的融资比比皆是,诞生了一批AI超级独角兽,智谱是目前估值最高的大模型公司之一。
AI视频初创公司爱诗科技获近3亿元A+轮融资
12月18日消息,AI视频模型初创企业爱诗科技近期正式完成A2-A4轮融资,总额近3亿元人民币。此前,A2轮融资由蚂蚁集团投资,近期A3、A4轮融资由北京市人工智能产业投资基金、国科投资及光源资本投资。据悉,本轮融资将主要用于提升技术研发能力、扩展算力资源以及建设人才团队,加速产品功能迭代与市场覆盖,持续推动AI视频生成技术的普惠。
点评: 公开资料显示,爱诗科技由字节跳动前视觉技术负责人王长虎创办于2023年4月,爱诗科技的核心AI视频生成产品为PixVerse,目前全球用户数超1200万,月活跃用户数近600万。目前,视频生成赛道仍有诸多技术难点,模型还无法完全理解物理规律,存在画面肢体消失、动作变形等问题。
智元机器人通用人形机器人商用量产
12月16日,智元机器人发布视频宣布,公司正式开启通用机器人量产。智元机器人联合创始人彭志辉表示:“两年时间磨一剑,从灵感到蓝图,从样机到量产,智元机器人终于跨越初创沟堑。”截至12月15日,智元通用人形机器人累计产量已有962台,年底计划产量将接近千台。
点评:人形机器人从研发到量产难度不小,其背后有供应链未完全成熟的原因。智元上海临港量产工厂具备体系化、标准化的机器人生产流水线,能规模化加工生产机器人。有人形机器人业内人士告诉记者,量产需要人形机器人研发团队具备工程能力,并能带动相应的供应链。
存储器厂商铠侠上市
存储器厂商铠侠(KIOXIA)12月18日在东京证券交易所上市。铠侠首次公开募资价格每股1455日元,对应公司估值为7840亿日元。12月18日开盘,铠侠初始价格则为每股1440日元,收盘涨超10%,收1601日元/股,市值8630亿日元,市值约合57亿美元。铠侠是日本年内最大的IPO案之一,但对比铠侠原定10月IPO计划时预估的1.5万亿日元市值,上市首日铠侠的市值还是低了不少。
点评:铠侠是目前主要的NAND Flash厂商之一,NAND Flash通常用于制成固态硬盘SSD等,用于手机、电脑、汽车、企业级存储等场景。在主要的市场参与者中,三星、SK海力士和美光同时是主要的DRAM厂商,由于DRAM中的HBM成为不少AI芯片的标配,DRAM行情更明显被AI所催化,相对而言铠侠更局限在NAND Flash领域。AI也对NAND Flash提出新需求,包括更大容量、更低功耗。此前铠侠相关负责人告诉记者,长期而言铠侠也将推动SSD增大容量、降低功耗。
来源:第一财经