OpenAI Whisper语音识别系统直接集成至VLC 即时字幕生成、自动翻译

360影视 2025-01-11 20:21 2

摘要:VLC Media Player将加入一系列以人工智能技术为基础的新功能,其中包括即时字幕生成及多语言字幕翻译,这些技术皆可在本地设备上完成,无需依赖云计算服务,令用户享有更高隐私保障。

VLC Media Player将加入一系列以人工智能技术为基础的新功能,其中包括即时字幕生成及多语言字幕翻译,这些技术皆可在本地设备上完成,无需依赖云计算服务,令用户享有更高隐私保障。

在美国拉斯维加斯举行的科技展览“CES 2025”中,VLC开发公司VideoLAN的代表Jean-Baptiste Kempf示范了这些崭新功能,展示如何利用声音即时生成字幕,并能将字幕翻译至超过100种语言。Kempf表示,所有功能皆可脱机运行,直接在用户的计算机上操作,避免数据外流至云计算服务。

这次更新将原本以插件形式提供的OpenAI Whisper语音识别系统,直接集成至VLC应用程序中。根据科技媒体The Verge的报道,Whisper系统此前已被用于声音转文本的应用,但这次的进一步集成,有助提升字幕生成与翻译功能的即时性与准确性。

PCMag则指出,过去VLC用户观看视频时,若无嵌入字幕,通常需要下载独立的 .srt文件,这样的过程有时颇为繁琐。而AI字幕生成功能将大大改善此限制,为用户提供更无缝的观影体验。

VideoLAN表示将于稍后的官方博客中披露更多细节,这些AI驱动的功能将如何进一步提升VLC作为免费开放源代码播放器的地位,令人拭目以待。

数据源:The Verge

来源:科技蜜谈

相关推荐