Prada也要做AI眼镜了;Waymo和萝卜快跑都已跨越1000万单…

360影视 欧美动漫 2025-06-21 15:51 2

摘要:6月18日,有媒体称,MiniMax正考虑赴香港首次公开募股(IPO),目前仍处于初步筹备阶段。本周是MiniMax的新品发布周,6月17日,MiniMax发布其首个推理模型 MiniMax-M1 并宣布开源,接下来3天,它又陆续发布了视频生成模型 Hailu

Key Points

模型


MiniMax发布多款模型,计划赴港IPO;


OpenAI即将发布GPT-5,可能会放弃GPT-4o;


Midjourney推出首款图生视频模型V1;


Gemini 2.5发布更便宜的版本,输出价只有Pro版的4%;

应用


Wix 8000万美元收购Vibe Coding公司BASE44 ;


Prada也要与Meta合作开发AI眼镜;


Waymo要开进纽约曼哈顿;


萝卜快跑要进新加坡和马来西亚;


宇树科技完成C轮融资,估值超100亿元。

模型

6月18日,有媒体称,MiniMax正考虑赴香港首次公开募股(IPO),目前仍处于初步筹备阶段。本周是MiniMax的新品发布周,6月17日,MiniMax发布其首个推理模型 MiniMax-M1 并宣布开源,接下来3天,它又陆续发布了视频生成模型 Hailuo 02 、通用智能体 MiniMax Agent 以及视频制作智能体 Hailuo Video Agent 。其中,MiniMax Agent可自动生成文本材料、制作带音频的学习教程、制作网页小游戏、为手机设计投放在电商平台的广告界面;Hailuo Video Agent可以直接将创意转化为视频,例如,用户想记录两个人的恋爱生活,只需上传一张清晰的情侣合照,并用文字简单描述两个人的故事,即可生成自己喜欢的风格的恋爱纪录片。

MiniMax成立于2022年。2024年3月,MiniMax获6亿美元A轮融资,投后估值25亿美元,由阿里巴巴领投,此前融资的投资方包括腾讯等。

OpenAI即将发布GPT-5,可能会放弃GPT-4o

6月18日,OpenAI首席执行官Sam Altman在播客节目中透露,GPT-5预计将于今年夏天推出,但具体时间还不明确。

Altman称, 目前公司产品线较为混乱,希望通过GPT-5的发布,回到简单的产品更新序列(GPT-5、GPT-6),公司可能会放弃复杂的模型变体 ,比如GPT-4o等。Altman称,目前用户需要在主页切换不同的模型来完成不同任务,希望未来能通过在单个模型中集合推理和Agent等能力,不用切换模型就能完成各类不同任务。

今年年初,Altman在社交平台上表示,GPT-5将融合语音、Canvas、搜索、深度研究等功能。Altman还表示,OpenAI目前没有在生成的内容中引入广告,公司对广告保持警惕,因为这可能会摧毁用户对模型的信任。

Midjourney推出首款图生视频模型V1

6月19日,Midjourney宣布推出图生视频模型V1,可直接将图片转为视频,图像可以由用户上传,也可以由Midjourney生成。

V1单次可生成时长5秒的视频,用户可以通过点击「延长」来生成更长的视频,单次可延长4秒,最长可生成21秒的视频。Midjourney尚未公布视频模型价格,但称收费大约是图像生成的8倍。V1模型允许用户自定义生成视频的部分效果。用户可以选择「自动动画」设置,使图像随机移动;「手动设置」允许用户通过文字描述向视频中添加动画效果。用户还可以选择「低速运动」或「高速运动」模式,模仿相机和拍摄对象的移动幅度。

目前, 市面上很多AI图像和视频公司的目标是开发用于商业环境的更可控的模型,但Midjourney更关注创造力而非直接的商业应用。Midjourney称,公司的目标是构建能够实时模拟开放世界的模型 ,本次发布是该目标的一部分,未来还计划开发用于制作3D渲染的模型。

参考链接:

Gemini 2.5发布更便宜的版本,输出价只有Pro版的4%

6月17日,Google更新Gemini 2.5系列模型,在Pro和Flash版本的基础上发布Flash-Lite的预览版。

Google表示,Gemini 2.5 Pro适合编程和高复杂任务场景,2.5 Flash适合快速处理日常任务,而2.5 Flash-Lite适合「低成本海量作业」。2.5 Flash-Lite同样为推理模型,支持多模态输入和100万token上下文窗口,但「思考」功能默认处于关闭状态。

Flash-Lite是2.5 系列模型中性价比最高的,定价为0.1美元/百万输入token,0.4美元/百万输出token;性能最佳的Pro最贵且没有调整,价格为1.25美元/百万输入token,10美元/百万输出token。

此外,在Google最新发布的Gemini 2.5技术报告中,研究人员指出, Gemini 2.5 Pro在游戏测试中表现出了类似人类在压力下的「战或逃」反应。 例如在《宝可梦 蓝》游戏中,当控制的角色生命值接近零时,该模型会突然放弃既定策略,转而采取非理性行动,导致游戏表现急剧下降。

参考链接:

应用

Wix 8000万美元收购Vibe Coding公司BASE44

6月19日,以色列SaaS巨头Wix宣布以8000万美元收购本土AI初创公司BASE44,成为Vibe Coding领域首笔收购案。 Vibe Coding(氛围编程) 是由OpenAI原研究员、特斯拉AI负责人Andrej Karpathy于今年2月提出的新型编程范式,其核心在于开发者通过自然语言描述需求 ,由大模型自动生成代码,实现从「逐行编写」到「意图驱动」的转变。

BASE44去年12月由31岁的以色列程序员Maor Shlomo创立。团队共有9人,此前未接受任何外部融资。另外8名成员将从8000万美元中获得2500万美元,作为「留任」奖金。

Shlomo曾创办大数据公司Explorium,后把独立开发者作为副业。他在社交平台X和LinkedIn上全程记录了BASE44的创业过程,引发了广泛关注。BASE44是一个无代码/低代码平台,用户只需通过自然语言描述,即可创建功能完善的软件、网站和内部工具。Shlomo表示, 团队选择了Claude 4而非OpenAI的模型,因为采用后者的成本过高。BASE44上线3周后,用户数突破1万,6个月后达到25万。今年5月,公司单月净利润18.9万美元 ,验证了无编程能力者开发软件的可行性。

参考链接:

6月17日,有报道称,Meta将与奢侈品品牌Prada合作开发AI眼镜。有Meta前员工表示, Prada多款眼镜的镜框和镜腿的衔接部分都设计得较为厚重,这种设计有利于Meta在眼镜贴近太阳穴的部位塞进更多电子元器件。

在AI眼镜的开发路线上,Meta现阶段侧重硬件设计,认为AI眼镜产品要先想办法用有趣的特点讨得消费者欢心,之后再基于市场不断优化硬件功能。这种思路与Google显著不同,后者更专注眼镜软件层的研发,把硬件的内容都丢给了供应商。

2023年,Meta曾与意大利眼镜厂商Essilor Luxottica旗下子品牌Ray-Ban合作推出AI眼镜Ray-Ban Meta,价格在250美元至550美元,这款眼镜支持拍照、录像、通话、音乐播放、实时翻译等功能。 目前Ray-Ban Meta已售出超200万副,Meta希望到2026年年底其产量能达到1000万台以上。Meta当前还在为Ray-Ban策划高端AI眼镜型号「Hypernova」,定价1000美元以上。

与Prada合作的消息曝出的前一天,Meta还宣布为Essilor Luxottica旗下的另一子品牌Oakley开发AI眼镜,目标售价360美元。

参考链接:

6月18日,有报道称,Alphabet旗下的自动驾驶公司Waymo已向纽约市交通部申请许可,计划在曼哈顿地区开展自动驾驶车辆测试。由于目前纽约州的法律不允许车辆在无人驾驶的情况下行驶,Waymo在初期阶段并不会向公众开放完全的无人驾驶出租车服务。届时,经过培训的人类安全员将在驾驶座监督自动驾驶车辆的运行。Waymo还表示,它正在推动修改法律,希望纽约市能允许其出租车在曼哈顿自动驾驶,但司机座位上会有安全员。

5月24日, Waymo宣布已完成1000万次无人驾驶行程,覆盖奥斯汀、洛杉矶、旧金山和凤凰城等美国城市。从500万次翻倍到1000万次,Waymo仅用了5个月的时间 ,并且这些行程均为付费行程。

萝卜快跑计划进入新加坡和马来西亚

6月20日,有报道称,百度旗下自动驾驶出租车部门萝卜快跑计划最早于2025年年底将业务拓展至东南亚市场,重点覆盖新加坡和马来西亚。萝卜快跑目前正与当地潜在合作方接洽,商讨最适合两国市场的运营模式。百度CEO李彦宏曾表示, 萝卜快跑出海将推行轻资产策略,寻求与出行平台、本地出租车公司及第三方车队运营方合作,以加快项目落地与监管对接 。目前,新加坡已经允许自动驾驶车辆在公共道路上测试,并且推出了相关监管体系(比如由陆路交通管理局LTA主导安全标准),以推动自动驾驶企业在新加坡顺利落地。

根据萝卜快跑披露的数据, 截至2025年第一季度,萝卜快跑累计服务行程达1100万次 ,覆盖了国内包括北京、上海、深圳在内的13座城市以及迪拜和阿布扎比两座海外城市

来源:晚晚的星河日记一点号

相关推荐