gui

浙大团队:AI实现GUI元素精准识别如侦探

这项研究解决的是一个听起来简单但实际非常复杂的问题:如何让AI助手准确理解用户的指令,并在复杂的图形界面中找到正确的操作目标。就像一位经验丰富的侦探需要在复杂的案发现场中找到关键线索一样,AI需要在充满各种图标、按钮和文本的屏幕上准确定位用户想要的元素。

浙大 图标 gui 侦探 aepo 2025-08-13 20:55  3

周末愉快,AI跟踪研报

2025 年 6 月 11 日至 12 日,火山引擎春季 FORCE 原动力大会在北京召开。此次大会隆重推出豆包大模型 1.6 和视频生成模型 Seedance 1.0 Pro,同时对 Agent 开发平台等 AI 云原生能力进行了升级。

模型 模态 豆包 gui seedance 2025-06-27 15:42  9

LLM的关键转折:LAM,究竟是什么?

操作 Windows 程序、自动对账发票、预订航班和酒店——这些只是新一代大型语言模型(LLMs)为 AI 智能体带来的众多可能性中的几个。研究人员将这一阶段的进化称为“大型行动模型(Large Action Models)”,简称 LAMs。

智能体 llm rpa gui lam 2025-06-25 14:40  9

字节跳动,低调开源!

Seed1.5-VL 支持多种分辨率的图像输入,并通过原生分辨率变换(native-resolution transform)确保最大限度保留图像细节。在视频处理方面,提出了一种动态帧分辨率采样策略(dynamic frame-resolution sampl

模态 开源 字节 gui pip 2025-05-22 11:04  10

账户突然被封?AI应用出海广告合规化揭秘,精准实现流量破圈

近一年来,AI产业的高速迭代席卷了整个互联网出海浪潮。进入2025年后,AI技术不断融入各个行业,成为了瞩目的新生力量,AI与产品生态的融合趋势已不可阻挡。不管是生成式内容还是情感陪伴,亦或是实用工具与娱乐体验,AI出海的落地转化都离不开政策合规的支持。特别是

应用 meta 广告 gui caroline 2025-05-17 05:51  10