人工智能目前仍无法取代人类翻译的三大原因

2018年10月22日

我们的影响力

世界经济论坛为 加速 Emerging Technologies 行动做了什么？

全局信息

探索和追踪解决之道人工智能与机器人正在影响经济、产业和全球问题

A hand holding a looking glass by a lake

众源式创新

现在加入，用我们的数字众源平台来实现大规模的影响力

实时追踪：

人工智能与机器人

我做同声传译有十年多，对这个职业感情颇深，但我承认这份工作并不耀眼。我们隐匿于会议室角落的同传箱里，低声翻译，化身全球经济活动中精通数国语言的局外人。

只是不要让机器人抢走译员的劳动功劳。为此，我们发出了自己的声音。

近日，上海一名口译员在社交媒体上对一场国际会议上“使用人工智能翻译”的误导性营销提出异议，随后，相关的不满和怨言演变成怒吼与咆哮。事实上，这个所谓的“AI翻译技术”只是将人类译员翻译的音频转录为文本。这一事实在中国社交媒体上疯狂传开。科大讯飞是中国领先的人工智能和自然语言处理公司之一，也正是此次对技术进行不当推广的始作俑者，结果引起了社会上的恍然大波。

公众的反应揭露了人们是多么理所当然地认为机器在翻译领域存在着优势。即时是在当今时代，口译工作仍然需要专业人员来从事，但这一事实似乎令人们着实感到震惊。

难道谷歌翻译没有在多年前就解决这个问题吗？Skype翻译也没有解决吗？市场上十几种宣称是下一个可穿戴的万能翻译工具也没有解决吗？

是的，他们都没有解决这一问题。

一直以来，人工智能在汽车驾驶、癌症诊断、罚球投篮和农作物产量预测方面的表现都优于人类（更不用说在国际象棋、围棋、扑克和《危险边缘》[Jeopardy]游戏节目中的表现了）。但是，当涉及到口笔译时，人类大脑仍然比地球上任何技术都要成熟得多。

为什么会这样呢？原因有三。

一. 语言具有主观性

通常来讲，人工智能更擅长处理基于客观现实的任务。无论是识别数据集中难懂的信号模式，还是在复杂的道路条件下进行导航，当机器的决策系统由明确的数学或物理规则管理时，它便能发挥最佳功效。

相较之下，自然语言是人类群体为了同他人交流而发明的主观产物。通常而言，语言会表现出类似规则的变化（例如语法和动词变化），但这些规则只是基于惯例而非客观现实总结而成，而且规则仍在不断发展和变化。

人类在识别肿瘤或判断信用风险方面或许已经失去了领先优势，但我们仍然拥有并且可能永远拥有对自然语言中“自然”的终极权威。这种权威反映在评估机器翻译算法的选择度量标准——双语评估替换（BLEU）中，根据候选翻译与专业人员产出结果的相似性对其进行评分。这一框架的发明者承认：“机器翻译越接近专业人工翻译，就越好。”

人类翻译不只是制定最高的翻译标准，反而它的存在本身就是这个标准。人类怎么翻就该怎么翻！

二. 大数据不懂幽默

所有译员都会告诉你，笑话、双关语和暗中影射（以及细致入微的文化背景）是最难克服的语言障碍。但是，我们的表达也会因为上述细节呈现出更好的质量。从口译员的角度来看，语音和肢体语言也直接体现了讲话者的意图，译员必须通过目标语言对其进行准确分析和传达。

对于人类而言，上述问题只是难以处理，但对于机器来说，目前则完全无法实现。

从基于统计和基于短语的机器翻译到基于神经网络这一转变已经显著提高了机器翻译的整体质量。但神经机器翻译甚至比之前的模型更依赖于大量的训练数据。由于最大的可用双语数据集源于政府文件和宗教文本的官方翻译，这些算法很少会接触到幽默表达、文字游戏和非语言表达。

最令人不安的是，神经机器翻译一方通常不承认其错误，而是会像一个准备不足的学童，试图以机器之名来逃避责任。当用户在谷歌翻译中输入无意义信息时，译文展示的竟是圣经预言，专家将这些错误归因于神经网络会优先选择流畅译文而非准确译文。

由于有的目标语言读者可能永远不会意识到问题的存在，并且可能将不实翻译的古怪性归因于源文本本身，这些“假阳性”问题相比那些拙劣、明显的错误更不易被人察觉。

三. 听好了，机器人

上述问题使得用机器翻译一段静态文本已经十分困难。要求计算机同声传译语音则会大大增加翻译过程的复杂性，其中最显著的问题便是自动语音识别程序。

诚然，目前的Siri、Alexa和其他同类产品似乎是非常称职的语音助手。但是，大部分机器人仅能在有限的环境和条件下对人类的指示做出回应：短期、基于命令且涉及受控环境中有限词汇的交互。另一方面，大多数现场会议和商务讨论中的发言都是自发、连续且高度依赖语境的，这些特点使得大多数自动语音识别程序的错误率激增。

引发滑稽和尴尬结果的例子比比皆是。今年早些时候，对冲基金大师雷·达利奥（Ray Dalio）在北京发表演讲，反思了自己年轻时作为一名交易员所进行的错误预测。

“多么傲慢啊！”他向人群喊道，“我怎能如此傲慢？”

实时字幕试图传递出他所使用的修辞手法。

字幕显示道：“怎么做？阿拉贡，我看着自己和我自己。”

该领域的最新发展前景可观，许多专家预测，自动语音识别软件的单词错误率将在不久的未来与人类抄写员的水平齐平。然而，并非所有单词的错译情况都是相同的。机器将“好的”听成“好滴”可能是一个无关紧要的错误，但将“半天”与“八天”混为一谈很可能就会造成大量混淆。即使机器在单词拼写方面的错误较少，但仍然比人类更有可能犯下歪曲说话内容含义这种语义错误。

不是人类，也暂且不是机器人

长期以来，人类一直乐意探索自己优于其他动物、其他生物以及机器这一近代产物的感知优势。这是一种无知的消遣，当然，也是一种不可避免的愚蠢消遣。

我并不怀疑计算机在未来某天将发展出与人类行为相似的自然语言沟通能力。我也不怀疑口笔译人员以及广告文字撰稿人、编辑、电台主持人和其他语言行业中的专业人士未来某天可能要跟机器人抢饭碗。

但那一天的到来比大多数人想象的还要远。一直以来，语言工作既涉及艺术也包含科学，使其对于人工智能的早期迭代具有惊人的抵御能力。

和许多其他行业一样，语言行业中的专业人士应该集中注意力于人工智能、自然语言处理等技术的使用，以提高劳动力的效率、质量和成本竞争力。计算机辅助翻译工具已经在文本翻译器中广泛使用，虽然许多人对此表示愤怒，但毫无疑问，同声传译可以从某些语音识别和翻译记忆技术的组合中受益。至少在可预见的未来里，这些工具将会补充而不是替代人类的输出。

只要同传箱中还有人类译员在翻译，我们就应该礼貌地给予他们应有的荣光。

作者：Jonathan Rechtman，Cadence Translate凯韵翻译联合创始人、首席翻译官

以上内容仅代表作者个人观点。

本文由世界经济论坛原创，转载请注明来源并附上原文链接。

责编：万鸿嘉

世界经济论坛是一个独立且中立的平台，旨在集合各方观点，讨论全球、区域及行业性重要话题。