ChatGPT增加实时视频访问功能:可查看手机上看到的内容

摘要:OpenAI周四宣布, 正在推出在 ChatGPT 移动应用程序的高级语音模式下共享手机屏幕和手机实时视频的功能,这样用户就不必在聊天中上传照片或描述周围环境。

鞭牛士报道,12月13日消息,OpenAI周四宣布, 正在推出在 ChatGPT 移动应用程序的高级语音模式下共享手机屏幕和手机实时视频的功能,这样用户就不必在聊天中上传照片或描述周围环境。

屏幕和视频共享可以使语音聊天更高效、更有用,但它们也为 OpenAI 提供了更多访问用户潜在敏感个人信息的机会。

OpenAI 表示,通过点击聊天栏中的语音图标,可以在高级语音模式下实现屏幕和视频共享。

该功能于去年 5 月随GPT-4o发布而推出,但目前只有音频模式可用。现在用户可以使用手机摄像头与 ChatGPT 聊天,模型将看到您所看到的内容。

在直播中,首席产品官 Kevin Weil 和其他 OpenAI 团队成员演示了 ChatGPT 如何协助制作手冲咖啡。通过将摄像头对准动作,AVM 表明它理解了咖啡机的原理,并指导团队冲泡了咖啡。该团队还展示了 ChatGPT 如何通过理解手机上的一条公开消息来支持屏幕共享,Weil 戴着圣诞老人的胡须。

OpenAI 表示,这些功能将在大多数国家向 ChatGPT Plus 和 Pro 用户以及所有 ChatGPT Team 用户推出。

Enterprise 和 Edu 用户将于 1 月开始使用该功能。

OpenAI 表示,欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户将很快获得该功能。

此前,谷歌宣布了Astra 项目取得的进展。Astra 项目是一款实验性的人工智能助手,它使用安卓应用程序或原型眼镜来记录人类所看到的世界。

新款 Gemini 2.0 还可以处理视觉和音频输入,并具有更多代理功能,这意味着它可以代表用户执行多步骤任务。Gemini 2.0 的代理功能目前作为研究原型以三个不同名称存在:通用 AI 助手项目 Astra、特定 AI 任务项目 Mariner 和开发人员项目 Jules。

来源:鞭牛士Bianews一点号

相关推荐