「天玑 9400 芯片发布」「vivo X200 系列来袭」「OPPO Find X8 系列发布」「骁龙峰会」「骁龙 8 至尊版芯片发布」「小米 15 系列宣布首发搭载骁龙 8 至尊版」「华为举办原生鸿蒙之夜」……
自打进入这 10 月份以来,知乎、微博热搜就被各种数码新闻给霸榜了。
谁能想到,这个在普通人眼中约等于愉快黄金周的月份,在我们这个数码圈子里,却成了一个较往年同期忙碌程度可能要超出十倍,甚至数十倍的月份。
哦对了,苹果也是终于发布了 iPad mini 7,除了毫无亮点的常规升级,还给我们带来了一如既往的中文广告文案——「单手炫大招」。
虽然我知道这就是「Single-handedly awesome」的直译,但苹果就是翻出了一种「胸口碎大石」的土味感,没办法。
也不能全怪苹果。
归根结底,把英文翻译成中文,或者反向操作,且保持信达雅,是一件难事。
哪怕是英语成绩还行的我,在逛英文网站、查外网资料时,依然也会有看得贼慢的问题,特别是遇到一些和技术、市场或科研有关的专属名词时,把一个非原生词汇转换成自己能理解的原生词汇所需的时间会大大延长。
而对于普通大众来说,遇到不认识的单词,估计就得靠翻译软件了。
虽然说现在什么谷歌翻译/Deepl 都支持网页翻译、文档翻译,但要不就是不用点特殊手段连接不上,要不就是对上传文档的规格进行了严格的限制,图片多一点就翻译不过来了。
这就很烦。
还好,在大语言模型的飞速发展之下,此前鲜有进展的 AI 翻译赛道突然卷了起来,早已布局的科技大厂,以及刚刚下场的各路大模型初创企业,纷纷推出了自家的 AI 翻译产品。
就比如前些日子,我在冲浪时偶然看到了号称「AI 能力全面升级」的有道翻译,正好可以看看效果如何。
有道翻译,真有那么神?
作为一介科技编辑,查阅外网资料和双向翻译是我工作中的重要一环。
不过科技行业里术语繁多,特殊缩写也很多,不同领域有众多盲点,即使请专职的翻译,也很难短时间内给出最准确的说法,就更难指望常规翻译软件能起到什么作用了。
举个例子,这个月国内最爆的科技新闻——华为鸿蒙 Next 系统正式发布,怎么翻译给外国人呢?
老规矩,先上传统机器翻译。
咋说呢,翻译 1 号和翻译 2 号得出来的结果出奇地一致,两者都只会把整个专有名词拆分翻译,并把「鸿蒙」音译成「Hongmeng」。
但是用有道翻译的话,这「HarmonyOS NEXT」立刻就出来了。
这不就对了,中!
用其他数码行业的术语套进去,得出来的结果也是一样的,vivo 源操作系统和 OPPO 马里亚纳芯片,常用的翻译软件结果分别是「Vivo Source OS」和「OPPO Marina Chip」。
没错,「Source」确实是「源」,但用在这里 100%是不对的,至于「Marina」更是只能判断为错误的音译。
而用了有道翻译,「Vivo Origin OS」和「OPPO MariSilicon」立刻就出来了。
该说不说,在处理专业术语、缩写这块,有道翻译确实能更好地保留原意,也就不需要考虑用哪个术语进行表达更为准确规范的问题了。
嗯……我想想啊,术语翻译的问题是解决了,但如果我想向一个外国人介绍我们的鸿蒙 Next 系统,又应该如何准确表达呢?
我所提供的原文是这个:
老铁们,鸿蒙 NEXT 纯血更新来了,一个字“爽”,必须冲冲冲,虽然还有部分软件还在测试中,但是这是我们老中自己的系统,绝对值得等待,大家有什么问题可以问我哦!
即便是这样充满小红书味道和网络用语的原文,有道翻译依然很好地做到了「雅俗共赏」。用「Guys」快速和目标读者快速达成共鸣,而「You must go for it!」则很好地展现出了我的急切感,准确的术语翻译、简洁风趣的口语化表达,这样才能向海外的数码爱好者准确传达我们的意思。
翻译 1 号这边,尽管术语依然没有搞明白,而且还把「冲冲冲」整个翻译成「rush, rush, rush, rush」,起码整体语义还是通顺的。
相比之下,翻译 2 号不仅继续翻错术语,甚至把「老铁」翻译成「Old iron」,而且在表述上并不是很符合语义表达习惯。
特别是最后,能把「大家」翻译成「我们」,也算是充满了矛盾的哲学了。
我们加大难度,整点文档试试。
先看看翻译 1 号。
在排版格式上,翻译 1 号存在着常见的打乱布局问题,而且翻译后的文档字体大小不一,文字随意加粗,阅读起来真的有点费劲。
专有名词的翻译准确度同样存在问题,姑且不论把「multimodal architecture」翻译成「多模式架构」而非「多模态架构」这种术语错误,能把「Abstract」翻译成「抽象的」,就真的有点抽象了。
图片翻译倒是有,但是效果非常糟糕。
至于格式这块,更是只支持.docx、.pdf、.pptx、.xlsx,PDF 文件不得超过 300 页。
然后是翻译 2 号。
初看之下,翻译 2 号效果显然比一号好不少,字体大小正常,排版似乎也能做到一一对应。
但是往下看你就会发现,为了实现中文文档的排版效果,翻译 2 号经常会出现大面积空白文档,这使得对照查阅成为了一件几乎不可能的事情。
(翻译前后的第 3 页文档)
在翻译效果上,翻译 2 号还是要比 1 号强上不少的,至少没有那么多一眼就能看出来的问题。
再看格式支持,翻译 2 号支持.pdf、.docx、.xlsx、.pptx、.txt、.html、.xliff 等格式,在支持的文档类型上还是有所增加的。
我们看看有道翻译。
以往我要是翻译阅读一整篇长文/文档,总是会遇到文档大小/格式限制或是需要重复导入的问题,而且市面上的机器翻译经常会打乱排版格式,也无法实现图片一键翻译,严重影响阅读资料的连贯性。
但有道确实有点不一样,多大的 PDF 它也能顶,甚至可以批量上传。
什么格式、图片啥的全都保留,完全不影响你阅读。借助它,你可以实现双语对照翻译。就是一段英文一段译文,像英语辅导书那样,查资料时,看中文来提高阅读速度,遇到重点就刻意停下,看英语原文核查,体验那叫一个丝般顺滑。
啧啧,甚至连图表的翻译都非常到位,基本就没有错位的情况。
不仅如此,懒得全盘阅读的话,这玩意甚至还有 AI 阅读助手。
只要在侧边栏这里,输入我的需求,比如说我想知道这篇技术论文最终的核心结论是什么,…当当!
不仅给出了答案,甚至给出了这个结论对应的页码,这下老东西们真的要望尘莫及了。
如何实现,还得看“老大哥”
这一波体验下来,我倒是大概摸索明白了有道翻译的优势。
很显然,有道翻译在各种专有名词的翻译上,比起常用的机器翻译要准确不少,这个大家都能看到。
面对网络用语、口语表达和专有名词穿插的文段,有道翻译也能够更好地理解上下文和语言的复杂性,通过捕捉到更细微的语言特征和上下文信息,生成更加自然和流畅的翻译结果。
有了自然语义交互,甚至省去了长文阅读的烦恼。
好用吗?确实很好用,但是我想大伙的心里现在应该都处于和小标题高度一致的状态,更好奇这一切到底是怎么实现的。
而且重点来了,这么好用的功能,其他大模型产品不也能翻译吗?为什么一定要选择有道翻译呢?
虽然我在这块也是三脚猫功夫,但姑且还是就个人的理解来跟大伙探索一下。
我们熟悉的传统神经网络翻译,比如说大家都常用的谷歌翻译和 Deepl 啊,主要使用深度学习神经网络获取自然语言之间的映射关系,追求的是字里行间的精准对应,却缺乏了对文本背后情感和背景的捕捉。
而大模型翻译,通过在大规模数据集上进行预训练,已经学习到了许多有用的先验知识,如语言的语法规则、词的含义等。这些先验知识为模型在翻译任务上理解原文和生成更好的译文都提供了有力的支撑。
换言之,大模型接收到的并非原文,而是语义。
比方说有道翻译背后,就是有道自研的「子曰」教育大模型,这种垂类大模型能够在语义处理上主动进行语义理解与内容重构,而不是简单的文字转换,最终翻译的结果并不会受到原文格式的拘束,而且更加贴近目标语言的表达方式,也因此避免了各种哭笑不得的歧义。
众所周知,大语言模型需要通过深度学习和海量数据训练。有道深耕学习领域多年,翻译用户超 10 亿,有大量的数据沉淀,其训练出来的「子曰」大模型拥有着一个包含巨量文本参数的优势语料库,其中包括海量互联网数据、文学作品、科研资料等。
倚仗于子曰大模型的语料库,有道翻译近期上线的第四代翻译模型 LLM 翻译,可以更好地对专业术语和上下文信息进行捕捉,这极大提升了对语言的理解能力、并更好地支持篇章级翻译,这使得它们在翻译长句子和整篇文档时表现更好。
基于大模型自然语义交互的特征,我可以用自然语言对场景、术语、风格等提出各种定制化的需求,使它能够依据特定的环境及目标受众进行智能调整,更是能赋予其传统机器翻译所没有的文本生成/润色和问答系统。
在格式解析上,有道翻译还融合了视觉和语义特征进行排版分析,并针对论文中常见的表格、公式、图像等都做了增强,在翻译保留了丰富文本信息的同时,使得译文也保留原文相同的格式。
要我说,这种双语并列、优化排版的阅读体验,还真让文档翻译这个本来很复杂的事情轻松了不少。
别找了,这就是你要的生产力工具
实际体验下来,我对有道翻译的感受是欣喜的。
经过过去两年多的快速发展,如今生成式 AI 已然激发出众多能帮助我们能够跨越语言障碍,触及「外面的世界」的工具,它们不再仅限于「翻译」,而是以更敏捷的交互,在不同环境下跃过外语屏障