谷歌的人工智能翻译机，竟然发明了一种新语言？

2017年2月13日

Jennifer Morris

Chief Executive Officer, Nature Conservancy

去年9月，谷歌推出了自主设计的神经机器翻译系统，利用深度学习让各种语言之间的翻译结果变得更加自然。

谷歌翻译十年前刚上线的时候，还只支持少数几种语言，而现在已经支持超过103种了。每天，谷歌翻译都要处理超过1400亿个单词。

开发一个能翻译多种语言的计算机系统本就十分复杂，而谷歌的工程师则希望能明确，他们开发的系统有多能干。他们测试系统的方法是这样的：首先教会系统英语和日语之间的互译，然后教会系统英语和韩语之间的互译。这些都很稀松平常，但接下来发生的事则让我们大跌眼镜。

迷失在（人工智能）翻译中

研究者随即发现，神经机器翻译系统自主发现了一套“合理的”日语和韩语之间的互译逻辑，并且不用借助英语中转。这意味着机器已经建构起了一套概念体系，用于反映自己“学会”的各个语言之间的意思。

下图显示的是某一个句子翻译的视觉展现，表示的是同一个句子在英语、日语和韩语之间多向翻译的流向。

这一被称为“中间语”的研究还处于初级阶段，可能十分基础却高度复杂。从上图中我们可以看到，左边的(a)部分展现了翻译的整体构架。颜色相同的时句义相同的句子（而非语言相同）。(b)部分就是一组意群的集合，(c)部分则是将源语言分别上色的结果。

谷歌翻译团队解释说，“在同一个意群中，我们看到了来自三种不同语言、却表现同一个意思的句子。这意味着这一网络不只是单纯记忆了词组与词组之间的意思转换，而是自己对语义进行了某些分析。我们将其视为‘中间语’在这一系统中诞生的标志。”

简单来说，这一系统在没有人类指导的情况下，自行生成了某种中间媒介，以更好地理解人类语言。

作者：詹妮弗·莫里斯（Jennifer Morris），Formative Content。
以上内容仅代表作者个人观点。
本文由世界经济论坛原创，转载请注明来源并附上原文链接。
翻译：世界经济论坛博客翻译小组·钟源
世界经济论坛·达沃斯博客是一个独立且中立的平台，旨在集合各方观点讨论全球、区域及行业性重要话题。