谷歌推出新的人工智能和无障碍功能，适用于Android和Chrome

摘要：谷歌近日推出了针对Android和Chrome的新人工智能（AI）及无障碍功能，特别增强了TalkBack屏幕阅读器。用户现在可以通过Gemini询问图像内容和屏幕信息，提供更为详细的图像描述，尤其有助于盲人或低视力人士。此外，用户能够主动提问，获取关于图像和

谷歌近日推出了针对Android和Chrome的新人工智能（AI）及无障碍功能，特别增强了TalkBack屏幕阅读器。用户现在可以通过Gemini询问图像内容和屏幕信息，提供更为详细的图像描述，尤其有助于盲人或低视力人士。此外，用户能够主动提问，获取关于图像和应用内产品的具体信息。谷歌还更新了富有表现力的字幕工具，利用AI更好地转录口语并传达语调差异，帮助用户理解不同的语气表达。同时，Chrome中的PDF无障碍性得到了增强，光学字符识别（OCR）功能使得用户能够更轻松地与扫描文档互动，提升了依赖屏幕阅读器用户的使用体验。Chrome的Android版本还允许用户在不改变网页布局的情况下缩放文本，提供更灵活的浏览体验。

周四，谷歌宣布推出针对Android和Chrome的新人工智能（AI）及无障碍功能。本次更新的一个重要亮点是TalkBack的增强，这是Android的屏幕阅读器。用户现在可以询问Gemini有关图像内容和屏幕上显示内容的信息。此功能是在去年引入Gemini与TalkBack的结合基础上发展而来的，后者为盲人或低视力人士提供AI生成的图像描述，即使在没有替代文本（Alt text）的情况下也能如此。通过最新的更新，用户可以主动提问，并获得关于他们图像的有价值的信息。

例如，如果朋友给你发送了一张他们新吉他的照片，你可以请求描述并询问品牌和颜色等具体细节。此外，该功能现在还扩展到对整个手机屏幕进行描述和回答问题。这意味着在应用内购物时，用户可以向Gemini询问他们感兴趣的产品的材料，或者查看是否有可用的折扣。这种互动方式显著改善了用户的无障碍体验，使他们能够获得关于数字环境的宝贵见解。

除了这些功能外，谷歌还宣布对富有表现力的字幕进行了更新，这是Android的实时字幕工具，利用AI转录口语并传达其语调的细微差别。考虑到人们常常以不同的声调表达自己，谷歌在富有表现力的字幕中引入了新的持续时间功能。此增强功能将帮助用户区分体育播报员惊呼“太棒了”的声音与某人将“没有”拖长为“没——有”的表达。此外，更新还引入了针对不同动作的新声音标签，例如口哨声或清喉咙声。

此外，谷歌正在增强Chrome中的PDF无障碍性。此前，屏幕阅读器无法与桌面Chrome浏览器中的扫描PDF互动。随着光学字符识别（OCR）的引入，Chrome现在可以自动识别这些PDF，使用户能够像在其他网页上一样高亮、复制和搜索文本。这一改进显著提升了依赖屏幕阅读器的用户对扫描文档的可用性。此外，Chrome的Android版本中的页面缩放功能允许用户在不改变网页整体布局的情况下放大文本，提供了可定制的浏览体验。