摘要:在科幻作品里,关于跨语言沟通的想象数不胜数。而在现实中,素有深圳小硅谷的南山,跑出了一家专注解决跨语言沟通问题的科技公司:时空壶。
想象过不同语言的人可以像母语一样自然交流,是一个什么场景吗?
期待过不再需要学习外语,就能和老外自由交流吗?
在科幻作品里,关于跨语言沟通的想象数不胜数。而在现实中,素有深圳小硅谷的南山,跑出了一家专注解决跨语言沟通问题的科技公司:时空壶。
不但上了新闻联播,还被深度报道了近4分钟!
“为什么你们能做到?”
“这个技术难在哪里?”
新闻联播称它为“外贸小公司”。时空壶这公司也的确小,就150多号人。可它凭着平均年龄只有28岁的研发团队,拿到了100多项全球专利认证。
产品远销全球170多个国家和地区,北美市场占率超40%,过去三年销量年均100%的增长,这成绩不可谓不亮眼。
今年海关总署还将他们的产品,列为2024年“中国制造升级”案例进行展示。
时空壶出圈的原因,说来也简单。懂AI,会翻译。
一个经典例子,直到现在,很多翻译设备,还是没搞懂“手冲”咖啡里的“手冲”。
像你想点杯咖啡,其他“实时翻译耳机”,说不定会让你“洗手”去。
(谷歌翻译都翻车了)
而时空壶与AI大模型进行深度融合,拥有联系前后文的能力,能帮你下单一杯“手冲咖啡”。
有人可能会觉得,这就是个翻译对错的小问题,别人修个bug就追上了。
其实,这能力的差距,中间隔着巨大技术鸿沟!
接入了大模型后的时空壶,不仅仅是拥有了联系上下文的能力。更为关键的本质,是时空壶的AI翻译从简单的“直译”进化为理解语境、把握情感的"意译"。
现在虽然市面上有很多“AI实时翻译耳机”,但你如果用过时空壶W4 Pro后,你会发现这完全是两个时代的产品。
时空壶专注跨语言沟通领域9年,先后推出了翻译耳机、AI同传耳机、AI同声传译器,在行业里开创了不少先河,并长期引领着行业发展。
在体验上,时空壶率先突破了双向同传技术,不仅成功实现了双人同传对话,如今更是将翻译延迟压缩到仅有3-5秒(作为直接对比,目前联合国级别的同声传译人员同传延迟大概在2秒左右)。
全球范围内,除了时空壶,仍然没有任何一家其它公司的翻译产品,能够实现这种听翻译、说母语同步进行的跨语言沟通产品。
甚至可以不夸张的说一句,时空壶已经成为中国AI出海企业的标杆。
从洗手,到手冲,到跨国恋爱
人类机翻花了71年
人类被机翻,已经折磨了70多年。
早在1954年,美国获得了一大批前苏联的资料,但苦于俄文翻译员不足。蓝色巨人IBM展示了一个基于6项语法规则的计算机翻译系统,可将60个简单的俄语断句直译为英语。
这可以说是人类历史上的第一次“机翻”。
那时候政府大力支持机器翻译,有乐观派宣称:“三年之后机器翻译一定非常成熟。”
可这一等,就是71年,但过程是美好的。
2025年,“机翻”已经能帮助人类跨国恋爱。
今年1月,时空壶创始人田力,约了一位用户吃饭。
他是拉斯维加斯曼达里湾酒店的调酒师,在哥伦比亚有个女朋友。
他们语言不通,有时她来美国找他,有时他去哥伦比亚。他们用的就是时空壶的产品在跨国恋爱。
时空壶让大家能直接交流,建立更好的人际关系。
从回合制到双向同传
隔着一座大山
人类最理想的跨语言对话是什么样的呢?
大概就是“全世界都在说中国话”的感觉吧。像呼吸般自然,你完全忽略了“翻译”的存在。
还要懂得察言观色。例如翻译“你流氓”,到底是情侣间的打情骂俏,还是严重指控。
要能翻译方言,也要还原出弄堂烟火气中的人情世故与时代嬗变。
就像自动驾驶技术,分L1到L5一样。时空壶和翻译领域的专家学者,一起研究搞了个AI实时翻译分级。
具体就像打怪升级。
L1,就是文本翻译。以前大家上学时用电子词典查单词,一个字一个字翻译,效率低,还容易出错。
L2,这一步最关键的升级,便是从文字升级成语音的交替翻译,就像玩回合制。比如你说完一句话,对方等翻译机延迟10秒左右听到到内容。两个人像打乒乓球,轮流说,轮流翻译。
市面上,很多所谓的“AI实时翻译耳机”牢牢的被锁死在这级。
L2升级到L3,大家卡在哪里呢?
你以为给耳机装上AI就是L3级别的“AI翻译耳机”吗?很多产品还缺关键的一步,那就是“听清”,很多都只能应付过去。
简单来说,两个人各带一个翻译耳机聊天时,你的声音常常会串台到对方的耳机上,加上环境杂音,耳机根本就听不清你在说什么。
很多厂商只能用取巧的土办法:回合制。一方说完,另一方才能说,中间还要再相隔一个10秒到数十秒的翻译时间。
用翻译软件,和国外交流过的朋友,最懂这体验有多糟糕!这天根本聊不下去。
原本1分钟就能聊完的事,因为语言不通,被迫用上手机翻译APP,时间就会膨胀成8-9分钟。
而现在,同样的内容,时空壶任意一款搭载双向同传技术的产品,可以轻松实现1分30秒甚至1分20秒。
时空壶的解决方案就特别优雅,三麦克风阵列+矢量降噪技术,就像给耳机装了个雷达。彻底突破L3级双向同传的壁垒。
通过声音到达麦克风的时间差和强度差,计算出你嘴巴的位置和距离。
哪怕你在广交会那种一堆人叽叽喳喳,喇叭声、人声混杂的地方,时空壶的耳机,也能像狙击枪一样只瞄准你一个人的声音,其他噪音全过滤掉。
戴这耳机跨国聊天,对话过程中随时可以插话,也可以同时说,并且翻译延迟只有3-5秒。
“这如同为声音世界装上了显微镜。”时空壶研发负责人石伟说,他们追求的终极目标是利用降噪技术,完全消除说话者以外的杂音、噪声。
除此之外,在L2与L3之间,另一个大家都意想不到的高墙便是——通信。
大家一开始的设想,是两个人各戴一只耳机来交流,但第一步就走不通了。
大家会用耳机分享音乐,但很少人会想着分享耳机一起通话。这对AI翻译耳机来说,就出现了个巨Bug!
标准的蓝牙耳机,走的都是单通道录音,根本没办法两只耳机分别录音。
在深圳这种全球硬件之都,都找不到解决方案,甚至找国外的高通,国内的海思等芯片大厂,都没好的答案。
所以被逼上绝路的时空壶,只能自己干。
2017年开始自研通信技术,死磕了4年,才在2021年,拿出了首款能双向同传翻译耳机W3。
于是,L2终于有了一条通向L3的桥梁。
来到L3,终于有点真人聊天的感觉。语音同声传译,两个人戴耳机聊天,你说完5秒内就能听到翻译,尽管依旧有延迟,但现在,你们可以做到随时插话,随时听懂,不用憋着等,一句话3秒左右的延迟秒,翻译基本不卡壳。
时空壶目前就是L3中段的水平。
而再进一步的L4:将是读心术级,从直译到意译的质变。不仅要翻译字面意思,还要能听说话的是生气,还是开玩笑。
L5:钢铁侠管家级,习惯甚至读懂弦外之音翻译。比如你皱眉说“我没事”,它会翻译成“他其实在生气”。
有了分级标准,大家终于能搞清,你花的钱,到底买了个怎样的产品。
L3碾压局
从10秒到3秒
为什么时空壶能碾压式的占领北美40%市场?
因为AI翻译耳机市场,已经成为一个依靠技术突破,制造爆款的行业。
时空壶恰好就在打一盘技术碾压局,L3碾压L2。
友商的翻译,说白了就语音识别→文本翻译→语音合成三步,每一步误差叠加,导致最终延迟放大,普遍延迟超过10秒!
而时空壶L3级的翻译,却能实现对话的听音、翻译、播音并行,将延迟控制在3-5秒以内!
大语言模型
毁灭了“双人同床”
时空壶CMO吴卫兵表示:“时空壶”海外销售额占比达70%,今年的订单已经排到将近6个月之后了。
2025年美国CES,时空壶公布了其开发出的业界首个AI同传翻译大模型Babel OS,那实际效果,是不是和销量体现的那样强呢?
基哥试了下经典的“双人同床”测试。
基哥普通话不准,把双人同传,说成双人同床。友商翻译自然齐齐翻车,还有翻译成双人同船的。
同样的测试,时空壶就可以结合你上下文,你刚说过“同声传译”,联系上下文,后面“双人同传”自然才是对的。
时空壶大模型对翻译内容自动进行纠错。
在听懂人话,弄懂人情世故上,这是时空壶的一小步,也是全行业迈向人工智能的一大步。
有人说“翻译是遗憾的艺术”,因为你永远不能完全理解一个民族的思想。
这其实就是个准确度问题,过去的产品,主要依赖逐字直译。聪明一点的可能会删掉各种重复用词,但遇到例如中文梗,这反而会弄巧成拙,弄出笑话。
“明明明明明白白喜欢他但他就是不说”。
一些友商会自作主张把重复的“明”过滤了再翻译。
而时空壶在大模型的加持下,能根据当下的文化背景,把好玩的中文梗翻译出来。
这其实是很实用的进步,大家聊天可以更随性的使用俚语,更具当地特色的表达。
时空壶将直译,进化为意译了。
当语言障碍消失,大家能更聚焦于思想碰撞本身,时空壶不是卖耳机,而是卖“互相理解”的可能性。
在无人区行走
在混沌中寻找出路
时空壶创始人田力的创业哲学:在混沌中寻找出路才是小公司的出路。
在无人区行走,就像发现新大陆一样有先发优势。前提是你没有“死在沙滩上”,而是真的登陆了。
而就算登陆了,田力也很坦率的表示:领先窗口期只有半年。
所以时空壶,现在转头又扎进了新的无人区。
海外旅游,语言不通是一大障碍,而在飞机地铁,又或者在小众景点时,网络糟糕就是雪上加霜。
手机翻译软件,依赖网络的翻译设备,往往陷入瘫痪,大家都会陷入交流焦虑。
而时空壶已经找到了解决的钥匙。
本地化AI推理,端侧模型势在必行。
目前最先进的翻译模型,参数规模动辄数十亿,上百亿,想要完全离线,直接在耳机或手持设备上部署大模型翻译,还非常困难。
但在最新升级的新T1手持翻译机上,大家已经可以感受到没有网络后的翻译体验。即便是在非洲草原无网环境下,翻译准确率也能达到95%,解决行业“最后一公里”难题。
而在此基础上,时空壶正研究如何用仅有过去1%参数量的模型,在终端设备上实现翻译体验。大概今年下半年会发布相关消息。
断网也强大的翻译智能体,终将覆盖更多的同传产品。
“技术因解决问题而生,解决问题只能一步一个脚印来,没有任何捷径。”田力说。
小结
根据中国翻译协会《人工智能与翻译报告》,AI翻译技术已从实验室走向大规模商用,广泛应用于跨境商贸、文化交流、教育医疗等领域。
而时空壶,是毫无疑问的领军者。
时空壶的创始人田力,常常问公司的新同事:“30年后翻译产品会变成什么样?”
有人说是脑机接口,如三体人用脑电波交流,有人说是《流浪地球》里吴京与俄罗斯人交流时各戴一个耳机。
实际是,郭帆导演真的用过时空壶的耳机,还调侃说:现在科幻电影不好拍,还没拍完,产品先做出来了。
现在,从华尔街的谈判桌到撒哈拉的游牧帐篷,从医学会议的精密术语到跨国恋爱的深夜私语,都有时空壶的身影,
时空壶有个会议室叫“巴别鱼”,来自《银河系漫游指南》。主角在宇宙飞船上听不懂外星人说话,塞了一只鱼在耳朵里,就能听懂外星人说话。
这或许正是科技最动人的模样:让每一种声音都被听懂,每一份意图都被尊重。
来源:奇偶工作室