如果你认为苹果最新发布的AirPods只是一个普通的耳机,或者它只是使人们从总是打结的耳机线中解放出来,那你便错了。除此之外有远比这件事更重大的意义——它是第四次工业革命的首个标志。在这场革命中,进行计算将会是我们自身和我们做的所有事的一种延伸方式。想象一下十年后的技术发展,那时我们可能不再使用体积这样大的耳机,而是将像计算机芯片那样大小的设备长期地嵌入耳内。

这是大规模采用人机交流新模式的开端。环境计算和隐形接口正在改变和定位我们与技术的关系。这是不仅是新事物的出现,而更是一场剧变。蓝牙耳机已经被大量使用,而Airpod的不同之处在于它与Siri——这个具备语音识别功能的人工智能助手相结合。

谷歌的Home、微软的Cortana、亚马逊的Echo和IBM的Watson Conversation等其他语音服务都在这一领域内,不同的是这些公司开始改进对用户体验的设计,从能够准确识别语音输入的硬件,到能够理解语音含义的人工智能云服务再到高质量、相关性的处理动作或者应答作为反馈。从语音命令到人工智能应答的过程中有许多易产生错误的地方,但这个过程链中的每一节都正在快速地进步着。

从一条语音指令到一个精准的应答中间需要很多的过程。
Image: Scott David

AirPod内配置了许多微型化的传感器,它们在你说话时会进行侦测,并用波束形成麦克风滤去噪声以上传清晰的声音信号到云,因此可以明确地收集到你发出的指令,在声音接口的使用中这是极为关键的第一步。此外苹果公司在人机关系中引入了一项新的触觉感官技术(或称为“haptic”技术)。之前我们早已使用过触觉方式与计算机进行交互,指向、点击和拖动等手势与个人计算机、图形化用户界面和鼠标的大量使用一起进入人们的生活。轻轻点击和滑动的手势引领了智能手机时代和我们生活中无处不在的计算。而新的“点击手势”则是在使用没有屏幕的隐形界面时发出的语音信息。

像亚马逊的Echo音响那样,放置在家中并根据语音指令进行无缝的云服务连接的设备是产品设计的艺术。最好的以人为核心的设计方案会清除一切对于使用的阻碍,并且会呈现一种自然、遍在而易于使用的感受。什么时候你的耳机可以完成这一系列的工作而你将基本不需要把手机从口袋里拿出来呢?

云端的自然语言处理是使用互相连接的机器学习设备的关键技术,也是许多大型技术公司开始应用的人工智能的一种形式,而这种技术的发展要归功于对于大量数据的分析和语言理解算法。这便解释了Facebook Messenger、微信、Telegram和Skype这些嵌入了对话界面的聊天机器人的产生,并且很快这个领域的阵容还会继续扩大。

通过和Echo音箱对话,你可以用Uber预约一辆出租车,安排取干洗衣物的时间,让Nest恒温器改变室内的温度,或者支付你的燃气账单。这些都是你之前可以坐在电脑前通过网页可以完成的事情,而现在你只需要一个语音命令。一切都更为人性化、更便捷,更贴近于“服务”的概念,也更加无所不在。对于亚马逊的Echo来说,这些与其他公司的服务进行协同工作的能力可以称为它具备的“技能”,而这个词具有很强的人工智能的意味。这项技术在加强商业联系方面有着很大的潜力,因此谷歌、Facebook、亚马逊、IBM和微软成立的“人工智能造福人类和社会联盟”也是大势所趋。协作是新的竞争方式。

在过去几年中,对于人工智能的重大投资支撑了商业和工业活动中快速发展的领域。IBM为Watson所在的部门投入了十亿美元,而Watson现在掌握的人机对话技术可以帮助其他企业在他们的产品和用户体验中建立自己的语音聊天界面。在2012年发布了语音助手“Siri”的苹果公司在2014年用神经网络来改善Siri使其声音更为自然,对信息的理解方式也更类似于人类的感觉和体验。

这一切的发展都将通向何处呢?首先会经历一个技术成熟周期,接下来会走向一个可以流畅无阻地感受了解你的偏好并且做出应答的环境。这是物联网构造的未来前景之一。AirPod并非是一个简单的耳机,而是一个在自有生态体系中进行着环境计算的新型设备。

作者:Scott David

本文由世界经济论坛博客原创,转载请注明来源并附上原文链接
翻译:世界经济论坛博客翻译小组徐嘉
以上内容仅代表作者个人观点。
世界经济论坛博客是一个独立且中立的平台,旨在集合各方观点讨论全球、区域及行业性重要话题。