去年9月,谷歌推出了自主设计的神经机器翻译系统,利用深度学习让各种语言之间的翻译结果变得更加自然。

谷歌翻译十年前刚上线的时候,还只支持少数几种语言,而现在已经支持超过103种了。每天,谷歌翻译都要处理超过1400亿个单词

开发一个能翻译多种语言的计算机系统本就十分复杂,而谷歌的工程师则希望能明确,他们开发的系统有多能干。他们测试系统的方法是这样的:首先教会系统英语和日语之间的互译,然后教会系统英语和韩语之间的互译。这些都很稀松平常,但接下来发生的事则让我们大跌眼镜。

迷失在(人工智能)翻译中

研究者随即发现,神经机器翻译系统自主发现了一套“合理的”日语和韩语之间的互译逻辑,并且不用借助英语中转。这意味着机器已经建构起了一套概念体系,用于反映自己“学会”的各个语言之间的意思。

下图显示的是某一个句子翻译的视觉展现,表示的是同一个句子在英语、日语和韩语之间多向翻译的流向。

这一被称为“中间语”的研究还处于初级阶段,可能十分基础却高度复杂。从上图中我们可以看到,左边的(a)部分展现了翻译的整体构架。颜色相同的时句义相同的句子(而非语言相同)。(b)部分就是一组意群的集合,(c)部分则是将源语言分别上色的结果。

谷歌翻译团队解释说,“在同一个意群中,我们看到了来自三种不同语言、却表现同一个意思的句子。这意味着这一网络不只是单纯记忆了词组与词组之间的意思转换,而是自己对语义进行了某些分析。我们将其视为‘中间语’在这一系统中诞生的标志。”

简单来说,这一系统在没有人类指导的情况下,自行生成了某种中间媒介,以更好地理解人类语言。

作者:詹妮弗·莫里斯(Jennifer Morris,Formative Content。
以上内容仅代表作者个人观点。
本文由世界经济论坛原创,转载请注明来源并附上原文链接。
翻译:世界经济论坛博客翻译小组·钟源
世界经济论坛·达沃斯博客是一个独立且中立的平台,旨在集合各方观点讨论全球、区域及行业性重要话题。