谷歌的人工智能翻译机,竟然发明了一种新语言?
去年9月,谷歌推出了自主设计的神经机器翻译系统,利用深度学习让各种语言之间的翻译结果变得更加自然。
谷歌翻译十年前刚上线的时候,还只支持少数几种语言,而现在已经支持超过103种了。每天,谷歌翻译都要处理超过1400亿个单词。
开发一个能翻译多种语言的计算机系统本就十分复杂,而谷歌的工程师则希望能明确,他们开发的系统有多能干。他们测试系统的方法是这样的:首先教会系统英语和日语之间的互译,然后教会系统英语和韩语之间的互译。这些都很稀松平常,但接下来发生的事则让我们大跌眼镜。
迷失在(人工智能)翻译中
研究者随即发现,神经机器翻译系统自主发现了一套“合理的”日语和韩语之间的互译逻辑,并且不用借助英语中转。这意味着机器已经建构起了一套概念体系,用于反映自己“学会”的各个语言之间的意思。
下图显示的是某一个句子翻译的视觉展现,表示的是同一个句子在英语、日语和韩语之间多向翻译的流向。
这一被称为“中间语”的研究还处于初级阶段,可能十分基础却高度复杂。从上图中我们可以看到,左边的(a)部分展现了翻译的整体构架。颜色相同的时句义相同的句子(而非语言相同)。(b)部分就是一组意群的集合,(c)部分则是将源语言分别上色的结果。
谷歌翻译团队解释说,“在同一个意群中,我们看到了来自三种不同语言、却表现同一个意思的句子。这意味着这一网络不只是单纯记忆了词组与词组之间的意思转换,而是自己对语义进行了某些分析。我们将其视为‘中间语’在这一系统中诞生的标志。”
简单来说,这一系统在没有人类指导的情况下,自行生成了某种中间媒介,以更好地理解人类语言。
作者:詹妮弗·莫里斯(Jennifer Morris),Formative Content。
以上内容仅代表作者个人观点。
本文由世界经济论坛原创,转载请注明来源并附上原文链接。
翻译:世界经济论坛博客翻译小组·钟源
世界经济论坛·达沃斯博客是一个独立且中立的平台,旨在集合各方观点讨论全球、区域及行业性重要话题。
不要错过关于此主题的更新
创建一个免费账户,在您的个性化内容合集中查看我们的最新出版物和分析。
许可和重新发布
世界经济论坛的文章可依照知识共享 署名-非商业性-非衍生品 4.0 国际公共许可协议 , 并根据我们的使用条款重新发布。
世界经济论坛是一个独立且中立的平台,以上内容仅代表作者个人观点。
实时追踪:
数字经济
分享:
每周 议程
每周为您呈现推动全球议程的紧要问题(英文)