由人工智能驱动的新一代机器翻译工具每天处理数以万计的信息翻译任务。这些工具广泛应用于Google、Microsoft和Amazon等公司的专有机器学习翻译解决方案中。而Facebook则倾向于采用开源方法。那么,如何才能找到翻译软件、文档及自然语言内容的最佳方法呢?人工智能驱动的神经网络又在哪些方面发挥了重要作用?
专业语言服务机构Tomedes的数字营销负责人William Mamane长期以来一直对机器翻译持保留态度。“我们的公司已经成立了12年,服务了50000多名商业客户。我们始终认为人工翻译的价值不可替代,而且这个观点依然不变。不过,我们也见证了机器翻译质量的稳步提升。目前,尽管机器翻译还无法与顶尖的母语专家媲美,但在翻译服务价值链中仍占据重要地位。”
要追踪这种演变,我们需要回溯到机器翻译所依赖的人工智能起源。在基础层面,机器翻译通过算法将一种语言中的单词转换为另一种语言中的相应单词。然而,单纯依靠这种方法并不足以实现成功的翻译。无论是源语言还是目标语言,都需要全面理解整句话的意义。因此,我们可以将机器翻译看作是一种将源语言解码并在目标语言中重现其意义的过程。
解决这一挑战有多种途径。其中一种方法是利用统计数据为给定的短语选择最佳翻译。另一种方法则是运用结构化规则来确定最有可能的翻译。然而,在诸如小说或文学作品这样复杂的语言形式中,即使是最先进的机器翻译引擎,其翻译结果也常常显得不够自然。
对于某些特定领域,如天气预报、财务报告、政府协议、法律文件和体育赛事成绩等,机器翻译表现更为出色。因为这些领域的语言和表达方式相对固定,具有标准化的语言结构和格式。
如今,机器翻译已经广泛应用于日常生活中。即便如此,人类编辑和校对者的角色仍然不可或缺。他们需要识别专有名词、解决歧义问题,并解释惯用语。不过,与翻译本身相比,监督、编辑或审核的工作量较小,耗时也较少。
在线自动翻译始于1990年代,当时施乐公司的SYSTRAN和AltaVista公司的Babelfish是主要的参与者。两者都采用了统计方法和规则来翻译短文本。这两个系统的流行程度令人惊讶。1996年,AltaVista报告称,Babelfish每天收到了50万次请求。早在2012年,Google就已经处理了相当于百万本书的翻译任务。那是翻译技术革命之前的时期。更多关于早期机器翻译历史的信息可以在这里找到。
神经机器翻译(NMT)利用人工神经网络进行翻译。这是一种深度学习技术,它在翻译时会查看完整的句子,而不仅仅是单个单词。相比于传统的统计方法,神经网络占用的内存较少,运行速度更快。
深度学习或人工智能在翻译中的应用最早出现在1990年代的语音识别领域。第一篇关于在机器翻译中使用神经网络的科学论文发表于2014年,随后该领域取得了许多进展。
2015年,NMT系统首次出现在机器翻译竞赛OpenMT中。从那时起,几乎所有比赛都采用了NMT工具。最新的NMT方法采用了所谓的双向递归神经网络(RNN)。这些网络结合了编码器和解码器,前者为第二个RNN制定源语句,后者预测应以目标语言显示的单词。Google在其Google翻译中采用了这种方法。Microsoft也在其Microsoft Translator和Skype Translator中使用了RNN。Facebook则在广泛试验开源NMT,并从用户语言中学习。
Google翻译是Google开发的一款收费的多语言机器翻译服务,用于翻译文本。它提供了网页界面,适用于Android和iOS的移动应用程序,并且拥有API,可以帮助开发者构建阅读器扩展和软件应用。Google翻译支持100多种语言。截至2017年5月,它每天为超过5亿人提供服务。截至2018年,它每天处理的翻译量超过了1000亿个单词。
尽管Google翻译的准确性不如人工翻译,但它已经变得越来越精准。在2018年的一项研究中,谷歌邀请母语为每种语言的母语人士对Google翻译的翻译质量进行评分,评分范围从0到6分,平均得分为5.43分。不同语言的表现有所不同。例如,当英语作为目标语言且来源为欧洲语言时,Google翻译的效果最佳。
Microsoft Translator是一款面向多个消费者、开发者和企业的多语言机器翻译云服务。Translator Text API有一个付费层级,每月允许200万个字符的翻译。一旦超出免费额度,用户可以选择付费服务,每月可翻译数十亿字符。
通过Microsoft语音服务进行的语音翻译是根据源音频流的持续时间进行计费的。截至2019年8月,该服务支持65种语言系统和11种语音翻译系统,这些系统在各种应用程序中均支持实时对话功能。
Microsoft采用了新的实时翻译方法。对话的发起者可以获得一个代码,该代码允许每个参与者使用他们偏好的语言参与对话。
截至2017年,Facebook每天使用神经网络执行约45亿次自动翻译任务。它将其20亿多用户发布的帖子翻译成基于短语的机器翻译。Facebook选择了卷积神经网络(CNN),而非递归神经网络(RNN)。它希望通过这种方式使翻译后的文本更接近自然语言。
虽然RNN是线性和有序地处理信息,但CNN将信息视为一个层次结构。层次结构允许识别非线性数据关系。这种技术在机器视觉领域已经被证明非常有效。对于翻译而言,CNN能够更好地把握上下文。
Facebook的显著优势在于其多跳注意力机制,它模仿人类的翻译方式。通常,我们不会一次性将一个句子分解并翻译,而是多次返回并检查其含义。CNN模拟了这一过程,反复思考句子,并决定首先翻译什么内容。例如,“概览”可能以动词开头,而“名词”可能在一秒后出现。这有助于根据上下文理解文本关系,同时提高效率。Facebook的CNN翻译速度比Google使用的RNN快9倍。
此外,Facebook还具备一个巨大的优势。例如,它可以通过实时分析用户的语言来改进其翻译模型。这种CNN训练方法能够反映实际语言使用的真实句子。相比之下,Google则更多地依赖于从欧盟协议中获取的经验。当你在Facebook上发布内容时,你实际上是在帮助训练社交网络如何更准确地进行翻译。
翻译人员是否需要寻找新的工作?随着神经机器翻译的迅速发展,这个问题可能会被提出。然而,实际情况并非如此。Facebook、Microsoft和Google的翻译系统在生成接近人类理解的翻译方面表现良好。
NMT可以辅助翻译,而熟练的语言学家则可以在输入阶段完善翻译。总的来说,未来的翻译人员将更多地依赖人工智能,而不是反对它。