摘要:VLC媒体播放器正在开发实时AI字幕功能,该功能在2025年消费电子展上首次展示。此项技术允许VLC在用户设备上离线自动生成字幕,无需互联网连接,支持超过100种语言的实时翻译,并能同时显示两种语言。用户还可以将翻译保存为SRT文件。VideoLAN表示,该功
VLC媒体播放器正在开发实时AI字幕功能,该功能在2025年消费电子展上首次展示。此项技术允许VLC在用户设备上离线自动生成字幕,无需互联网连接,支持超过100种语言的实时翻译,并能同时显示两种语言。用户还可以将翻译保存为SRT文件。VideoLAN表示,该功能基于本地和开源的AI模型,增强了用户体验,尤其是对于观看本地电影和节目的人群。随着自动生成字幕在YouTube等平台上的普及,VLC的这一功能显得尤为重要,能够减少用户搜索字幕文件的麻烦。尽管底层技术尚未确定,但有猜测认为可能使用了OpenAI的Whisper。离线功能为用户提供了显著优势,避免了对云服务的依赖及相关费用。
实时AI字幕功能目前正在为VLC媒体播放器开发,VLC被广泛认为是一个流行的开源媒体播放器。负责VLC开发的非营利组织VideoLAN在2025年消费电子展(CES)上展示了自动字幕生成技术。今年,利用AI技术成为一大亮点,VideoLAN在上周的CES展位上分享了一段展示这一功能的短片。值得注意的是,这一新功能无需云服务或互联网连接,使得VLC能够直接在用户的设备上自动生成字幕。
这一基于AI的字幕生成功能支持离线使用,并为超过100种语言提供实时翻译支持。它能够同时翻译并显示两种语言,并允许用户将翻译保存为SRT文件。根据VideoLAN在X上的发布,“VLC的自动字幕生成和翻译基于本地和开源的AI模型,在您的设备上运行,离线工作并支持多种语言。”后续的帖子中包含了英国喜剧演员里基·杰维斯在2020年金球奖上表演的图像,展示了包括日语和法语在内的多种语言的实时字幕。
许多用户已经习惯在YouTube等平台上看到自动生成的字幕,社交媒体创作者经常使用AI字幕应用程序。领先的视频编辑软件也提供实时转录的插件或原生功能。在VLC中实施类似技术是合乎逻辑的,尤其是对于那些喜欢观看本地电影、电视节目和DVD的观众。虽然VLC提供内置的字幕下载工具,以减轻搜索SRT文件的麻烦,但字幕的可用性取决于是否有人以所需语言分享或创建它们。至于自动字幕功能背后的技术,有人猜测它可能利用了OpenAI的Whisper,这是一个领先的开源语音识别神经网络。无论底层模型如何,离线功能都是一项显著的优势,使用户能够避免云依赖和相关成本。
来源:老孙科技前沿