摘要:前段时间,看到有朋友在讨论一个文档,据说是OpenAI发布的一个《构建智能体的实用指南》,但因为自己的英语阅读能力有限,只能看个标题和目录,读到序言就比较吃力了……
前段时间,看到有朋友在讨论一个文档,据说是OpenAI发布的一个《构建智能体的实用指南》,但因为自己的英语阅读能力有限,只能看个标题和目录,读到序言就比较吃力了……
虽然自己的英语比较一般,但还是一直试图想多阅读一些英语类的资料来提升自己的视野,但通常都是面临许多的阻碍,比如:
当你碰到一个感兴趣YouTube视频时,只能打开默认的谷歌双语翻译,但他的翻译质量真的难以下咽……有时候碰到一些英语的行业报告或者外文文献时,通常都是一个词一个词的去查,效率低得让人抓狂。
不过据说现在的AI翻译还不错,但自己一直还没认真尝试过,这次借着想要搞懂OpenAI这个文档的目的,我尝试使用了一些AI工具,让我们来看看效果!
PDF翻译哪家强?
在“万事都可Deepseek”的时代,本着这个原则,我们来试试Deepseek的翻译功能吧,提示词:
“请你认真帮我翻译这篇报告的内容,同时帮我整理主要的内容观点和信息,并以可视化的方式来呈现”
来看看结果:
Deepseek对内容的翻译和观点整理做得有些简陋了,不过比较惊喜的是它直接帮我们生成了一个结构图和扇形图。大家如果经常会用到这样的可视化内容,可以多让Deepseek来用。
但对于我们主要的翻译任务来说,Deepseek做得不太好。接下来,我们来试一下谷歌的Gemini的效果:
Gemini对文章的大致内容做了比较细致的翻译和整理,看完就对文章的内容有了大致的概念了。
而且它还直接能帮我们生成文档!这个功能太棒了。可以直接下载下来,转发给其他朋友或者想进行二次处理就更方便了。
还让人惊艳的是,Gemini还支持直接在网页端进行文字格式的调整,字体大小、间距和文章语气都可以调整。
那我们来试下OpenAI自家产品gpt-4o的回答效果吧:
文字内容的确还是比较简略,不太能让我们知道整体内容的框架。
但总的来说,AI大模型不太适合直接翻译PDF文档。
在搜索过程中,我还了解到一款不错的AI翻译插件叫“沉浸式翻译”,可以直接对PDF文档进行页面翻译,同时翻译完成后就能够直接生成新的PDF文档,这个功能听起来太方便了,我们来试试效果:
大家可以搜索这个软件,然后把它添加为插件,就可以在右上方看到它了。
登录注册后,就可以开始使用,点开它在左下角就有一个PDF的翻译功能
然后我们可以选择“BableDOC”这个工具来进行翻译,据说这是他们团队自己研发的一个开源模型,能够更好地进行PDF翻译。
点击上传文件并翻译后,我们就可以把文档提交然后就可以等待翻译结果了,来看看效果:
哇!有点被惊艳到!可以说在整个文档的结构上是相当地还原了,翻译的质量比谷歌自带的翻译也是好太多了。(每个月有1000页的免费额度,是比较够用的。)
同时它也支持双语版和仅译文的版本,这对于大家的阅读就能够提供很多的方便。
然后,我又找到了另外的一个免费翻译PDF的工具DeepPDF,试了下效果:
但是这款工具的效果就比较一般了。
用AI翻译实现油管视频观看自由
既然AI翻译在PDF上已经有不错的表现,那我们就再试试其他的场景,接下来我们试试油管视频的字幕翻译。
作为全球最大的视频网站平台,Youtube(油管)汇聚了非常非常多优秀的内容生产者,所以我也一直以来希望能多在油管上接受优质的信息,因为我们很多时候看到的视频便是通过油管的二手信息。但之前受语言因素的影响,关注的大多数都是中文频道。
据说沉浸式翻译这个插件就能够支持通过AI模型来翻译字幕,我们来试试:
我们打开一则Sam Altman前端时间在TED的一场对谈视频。
然后点击右上角沉浸式翻译的插件,并选择好相应的翻译语言(它也会自动识别,可以不用手动调整),然后选择对应的翻译服务(除了免费的微软、谷歌翻译,也可以选择AI大模型来翻译字幕),点击“翻译”后整个网页就会出现中英双语。
然后我们在视频下方的小图标,选择“自动开启双语字幕”。
完成好以上的操作,视频就能够自动展示双语字幕了。
“沉浸式翻译”插件对字幕的识别进行过优化,能够更准确地进行长句子的识别与断句,这样可以更好地方便我们观看视频。
当我第一次设置好并成功后,我真的感觉我实现了看油管视频自由了!!
外文书籍阅读?轻松拿下!
接下来,我们再试试沉浸式翻译的另一个很棒的功能,那就是直接翻译外文电子书。
点开“沉浸式翻译”插件后,右下角有一个更多的按钮,点击后就可以选择“制作双语EPUB电子书”。
让我们来选一本书试试效果,我选择了文学大师卡尔维诺非常经典的一本书《Invisible Cities》,我在Goodreads网页翻到了它的简介,并用沉浸式翻译插件翻译了网页。
我们把这个书籍的Epub文件拖到沉浸式翻译的翻译页面里就会出现下面的页面。
在设置好相应的翻译服务、和翻译语言后,就可以开始直接翻译:
这本书有15万多个字符,我大概等待了2分多钟便翻译成功了。
翻译完成后还会有一个烟花效果,真的蛮贴心的!
让我们直接用微信读书来打开,看看翻译的效果:
目录、文字结构都完全没有问题!
真是太方便了,以后也能够实现外文电子书阅读自由了!
除了上面提及的PDF翻译、油管视频字幕、电子书翻译这些功能,沉浸式翻译还支持各大AI模型的API调用,可以自己选择自己更喜欢的模型来进行翻译。
它不仅有插件,还有客户端和小程序都可以使用。
写在最后
经过这一番体验和折腾,我最大的感受是:AI翻译工具,真的把获取全球信息的门槛,拉低了不止一点点!
它带来的好处,绝不仅仅是“方便查单词”、“能看懂大概意思”那么简单。更重要的是:
能够轻松打破信息壁垒: 不再局限于母语内容,可以随时随地去了解世界不同角落的声音、观点和知识。对抗信息茧房: 主动去接触不同来源、不同语言的信息,能让我们看到更全面、更多元的图景,避免被单一信息源“喂养”。提升学习和思考深度: 直接阅读一手资料、原版文献、观看原始访谈,能减少信息转译过程中的损耗和曲解,更接近事物的本来面貌。当然,AI翻译还远没到完美的程度,它依然会犯错,依然理解不了所有文化梗和复杂隐喻,也代替不了我们自己的独立思考和判断。但它就像给我们配了一副“万能眼镜”,让我们能透过语言的迷雾,看到一个更广阔、更真实的世界。
希望这篇测评能给你一些启发!
以下是本期提示词整理:
“请你帮我仔细翻译这篇报告的内容,同时帮我整理主要的内容观点和信息,并以可视化的方式来呈现”
来源:chooseAI