微软推出Copilot Vision AI助手赋能网页浏览与决策

摘要：虽然该功能在今年10月就已首次宣布，但公司目前正面向部分Pro订阅用户进行预览。据微软介绍，这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision，并就屏幕上可见的内容与其进行交互。

微软Copilot正日益智能化，这家由萨蒂亚·纳德拉领导的公司刚刚宣布，其AI助手现已具备“视觉”功能，能够与用户一起浏览互联网。

虽然该功能在今年10月就已首次宣布，但公司目前正面向部分Pro订阅用户进行预览。据微软介绍，这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision，并就屏幕上可见的内容与其进行交互。

该功能仍处于开发的早期阶段，且相当受限，但一旦完全成熟，对微软的企业客户而言将可能是一个颠覆性的改变——它将在客户与微软生态系统中的产品(如OneDrive、Excel、SharePoint等)互动时，帮助他们进行分析和决策。

从长远来看，观察Copilot Vision如何与更加开放且功能强大的代理式产品(如Anthropic和Emergence AI的产品)相抗衡也将颇有趣味。这些产品允许开发者整合代理，以跨不同供应商的应用程序进行查看、推理和采取行动。

Copilot Vision能带来什么?

当用户打开一个网站时，他们可能有一个明确的目标，也可能没有，但是，当他们有目标时，比如为学术论文进行研究，执行所需任务的过程就包括浏览网站、阅读所有内容，然后做出决定(比如是否将网站内容作为论文的参考)，同样的道理也适用于其他日常网络任务，如购物。

通过全新的Copilot Vision体验，微软旨在简化整个流程。本质上，用户现在拥有了一个助手，它位于浏览器的底部，可以随时被调用以阅读网站内容，包括所有文本和图像，并帮助用户进行决策。

它能够立即扫描、分析并提供所有所需信息，同时考虑到用户的既定目标——就像另一双眼睛一样。

这一功能具有深远的好处——它可以极大地加速你的工作流程——同时考虑到代理正在阅读和评估你浏览的所有内容，它也具有重大影响，然而，微软已保证，一旦Vision会话关闭，用户共享的所有上下文和信息都将被删除。它还指出，网站数据不会被捕获/存储用于训练底层模型。

“简而言之，我们优先考虑版权、创作者以及我们用户的隐私和安全——并将它们置于首位。”Copilot团队在宣布该功能预览的博客文章中写道。

基于反馈进行扩展

目前，美国已报名参加早期访问Copilot Labs计划的部分Copilot Pro订阅用户将能够在其Edge浏览器中使用视觉功能。该功能为可选加入，这意味着用户不必担心AI一直在读取他们的屏幕。

此外，在这一阶段，该功能将仅适用于部分网站。微软表示，它将根据早期用户的反馈逐步改进该功能，并扩大对更多Pro用户和其他网站的支持。

从长远来看，该公司甚至可能将这些功能扩展到其生态系统中的其他产品，如OneDrive和Excel，从而让企业用户能够更轻松地工作和做出决策，然而，目前尚无官方确认。更不用说，鉴于此处所表明的谨慎态度，这可能需要一些时间才能实现。

微软推出Copilot Vision预览之际，正是竞争对手在代理式AI领域不断提高标准之时。Salesforce已在其Customer 360产品中推出了AgentForce，以实现跨销售、营销和服务等领域的工作流程自动化。

与此同时，Anthropic推出了“Computer Use”，允许开发者整合Claude以与计算机桌面环境进行交互，执行以前仅由人类工作者处理的任务，如打开应用程序、与界面互动和填写表单。

来源：小玉科技观

标签：微软 copilot copilotvision

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!