摘要:I/O 大会展示了谷歌全系列产品发布内容,涵盖 Android、Chrome、Google 搜索、YouTube,当然还有谷歌AI聊天机器人 Gemini 的诸多新消息。
2025 年 Google I/O 大会于周二和周三在山景城的海岸线圆形剧场举行,这是谷歌年度规模最大的开发者大会。
I/O 大会展示了谷歌全系列产品发布内容,涵盖 Android、Chrome、Google 搜索、YouTube,当然还有谷歌AI聊天机器人 Gemini 的诸多新消息。
谷歌还举办了专门的 Android 更新活动 ——Android Show,宣布了查找丢失 Android 手机及其他物品的新方法、Advanced Protection 计划的新增设备级功能、防范诈骗和盗窃的安全工具,以及名为 Material 3 Expressive 的新设计语言。
以下是 Google I/O 2025 大会上宣布的所有内容:
据谷歌介绍,Gemini Ultra(目前仅限美国地区)为用户提供对谷歌人工智能应用和服务的 “最高级别访问权限”,每月定价 249.99 美元,包含谷歌的 Veo 3 视频生成器、新推出的 Flow 视频编辑应用,以及尚未上线的强大人工智能功能 Gemini 2.5 Pro Deep Think 模式。
AI Ultra 订阅用户还可在 Google 的 NotebookLM 平台和图像 remixing 应用 Whisk 中享受更高使用限额,同时获得 Chrome 浏览器中的 Gemini 聊天机器人访问权限、由 Project Mariner 技术支持的部分 “代理” 工具、YouTube Premium 会员,以及 Google 云端硬盘、Google 相册和 Gmail 共 30TB 的存储空间。
Deep Think 是谷歌旗舰模型 Gemini 2.5 Pro 的 “增强型” 推理模式,允许模型在回答问题前考虑多种答案,提升其在特定基准测试中的表现。
谷歌未详细说明 Deep Think 的工作原理,但它可能类似于 OpenAI 的 o1-pro 和即将推出的 o3-pro 模型,后者可能使用引擎搜索并综合特定问题的最佳解决方案。
Deep Think 已通过 Gemini API 向 “受信任测试人员” 开放。谷歌表示,在全面推出前需要额外时间进行安全评估。
谷歌称,Veo 3 可以生成音效、背景噪音甚至对话,以配合其生成的视频。谷歌表示,Veo 3 在生成视频的质量方面比其前身 Veo 2 有所提升。
从周二开始,订阅谷歌每月 249.99 美元 AI Ultra 计划的用户可在 Gemini 聊天机器人应用中使用 Veo 3,用户可以通过文本或图像进行提示。
据谷歌介绍,Imagen 4 速度很快,比 Imagen 3 更快,而且很快会变得更快。在不久的将来,谷歌计划推出一个比 Imagen 3 快 10 倍的 Imagen 4 变体。
谷歌称,Imagen 4 能够渲染织物、水滴和动物皮毛等 “精细细节”,可以处理写实和抽象风格,生成各种纵横比、最高 2K 分辨率的图像。
Veo 3 和 Imagen 4 都将用于支持 Flow,这是谷歌面向电影制作的人工智能视频工具。
IMAGEN 4 的Demo
谷歌宣布,Gemini 应用的月活跃用户已超过 400 万。
Gemini Live 的摄像头和屏幕共享功能将于本周在 iOS 和 Android 系统上向所有用户推出。该功能由 Project Astra 提供支持,用户可以与 Gemini 进行近乎实时的语音对话,同时将智能手机的摄像头或屏幕画面流式传输到人工智能模型。
谷歌表示,未来几周,Gemini Live 还将更深入地与其他应用集成:很快就能提供谷歌地图的导航指引、在谷歌日历中创建事件,以及使用谷歌任务制作待办事项列表。
谷歌称,正在更新 Deep Research(Gemini 的人工智能代理,用于生成全面的研究报告),允许用户上传自己的私人 PDF 和图像。
Stitch 是一款人工智能工具,通过生成必要的用户界面元素和代码,帮助用户设计网页和移动应用的前端。只需几句话甚至一张图片,Stitch 就能按提示创建应用用户界面,并为生成的设计提供 HTML 和 CSS 标记。
与其他一些类似的编码产品相比,Stitch 的功能略有限,但有相当多的自定义选项。
谷歌还扩大了 Jules 的使用范围,Jules 是一款旨在帮助开发者修复代码错误的人工智能代理工具,可帮助开发者理解复杂代码、在 GitHub 上创建拉取请求,并处理某些待办事项和编程任务。
Project Mariner 是谷歌的实验性人工智能代理,可浏览和使用网站。谷歌表示已对 Project Mariner 的工作方式进行了重大更新,允许该代理一次处理近 12 项任务,目前正在向用户推出。
Project Mariner 用户无需访问第三方网站,即可购买棒球比赛门票或在线购买杂货,只需与谷歌的人工智能代理聊天,它就会访问网站并代为执行操作。
谷歌的低延迟多模态人工智能体验 Project Astra 将为搜索、Gemini 人工智能应用和第三方开发者的产品提供一系列新体验。
Project Astra 源自谷歌 DeepMind,展示近乎实时的多模态人工智能能力。谷歌目前正与三星和 Warby Parker 等合作伙伴开发 Project Astra 眼镜,但尚未确定发布日期。
谷歌本周将向美国用户推出 AI 模式,这是一项实验性的谷歌搜索功能,允许用户通过人工智能界面提出复杂的多部分问题。
AI 模式将支持在体育和金融查询中使用复杂数据,并将为服装提供 “试穿” 选项。Search Live 将于今年夏末推出,用户可以根据手机摄像头实时拍摄的内容提出问题。
Gmail 是首个支持个性化上下文的应用。
Beam 结合软件和硬件(包括六摄像头阵列和定制光场显示器),使用户能够与他人交谈,就像他们在同一个会议室里一样。人工智能模型将来自不同角度、对准用户的摄像头拍摄的视频转换为 3D 渲染。
谷歌的 Beam 拥有 “近乎完美” 的毫米级头部跟踪和 60 帧 / 秒的视频流。与 Google Meet 配合使用时,Beam 提供人工智能驱动的实时语音翻译功能,保留原说话者的声音、语气和表情。
说到 Google Meet,谷歌宣布 Meet 将具备实时语音翻译功能。
谷歌将在 Chrome 中推出 Gemini,为用户提供新的人工智能浏览助手,帮助他们快速理解网页内容并完成任务。
Gemma 3n 是一款设计为在手机、笔记本电脑和平板电脑上 “流畅” 运行的模型,从周二开始提供预览;据谷歌介绍,它可以处理音频、文本、图像和视频。
该公司还宣布了一系列即将推出的 AI Workspace 功能,适用于 Gmail、Google Docs 和 Google Vids。最值得注意的是,Gmail 将获得个性化智能回复和新的收件箱清理功能,而 Vids 将获得创建和编辑内容的新方法。
NotebookLM 将推出视频概述功能,该公司还推出了 SynthID Detector,这是一个验证门户,使用谷歌的 SynthID 水印技术帮助识别人工智能生成的内容。为实验性音乐制作应用提供动力的人工智能模型 Lyria RealTime 现在可通过 API 访问。
Wear OS 6 为磁贴带来了统一的字体,使应用外观更简洁,Pixel 手表将获得动态主题功能,使应用颜色与表盘同步。
新设计参考平台的核心承诺是让开发者在应用中构建更好的自定义功能,并实现无缝过渡。该公司将向开发者发布设计指南和 Figma 设计文件。
谷歌正在为 Android 开发者加强 Play 商店的功能,提供处理订阅的新工具、主题页面(让用户深入了解特定兴趣)、音频样本(让用户预览应用内容),以及更顺畅的附加销售结账体验。
电影和电视节目 “主题浏览” 页面(目前仅限美国地区)将把用户与大量与节目和电影相关的应用连接起来。此外,开发者将获得专门的测试和发布页面,以及监控和改进应用发布的工具。使用谷歌服务的开发者现在还可以在出现严重问题时暂停应用的实时发布。
订阅管理工具也将通过多产品结账进行升级,开发者不久将能够在主订阅旁边提供订阅附加组件,所有内容都在一次支付中完成。
Android Studio 将集成新的人工智能功能,包括与 Gemini 2.5 Pro 模型发布同步的 “Journeys”(一种 “代理人工智能” 功能),以及能够处理更复杂开发流程的 “Agent Mode”。
Android Studio 还将获得新的人工智能功能,包括应用质量洞察面板中增强的 “崩溃洞察” 功能,该功能由 Gemini 提供支持,将分析应用的源代码以识别崩溃的潜在原因并提出修复建议。
更多免费AI功能 云片AI:https://y-p.cc/?f=tt
来源:AIGC研究社一点号