语音是人机交互的新风口 | 回顾

经济学人集团 经济学人 2018-01-10


商论音频功能已上线!

下载/更新商论App,即刻享受原文朗读

请输入标题     bcdef

十年前,iPhone的触摸屏开启了人机交互的新篇章,引爆移动互联的巨大市场。如今,语音人机对话正在改变计算的形态乃至生活的方方面面。语音是一种自然的互动方式,甚至会彻底消除抽象的“用户界面”。没有了显示屏和键盘的电脑有潜力变得比人们今天所能想象的更有用、更强大和无处不在。欢迎回顾商论往期文章《现在,我们说上话了》。

请输入标题     abcdefg


会话式计算

现在,我们说上话了

语音技术让计算机不那么令人生畏,且更易接近


尽管看似简单,但通过提供一种自然的互动方式,语音有能力改变计算的形态。说到和计算机打交道,先是视窗、图标和菜单,之后是触摸屏,都因为比输入复杂的命令行更为直观而受到欢迎。但是能对计算机说话彻底消除了对“用户界面”这一抽象概念的需要。正如手机远不只是无线电话,汽车远不只是无马之车,没有了显示屏和键盘的电脑有潜力变得比人们今天所能想像的更有用、更强大且无处不在。


语音不会完全取代其他形式的输入和输出。和机器交流,有时打字仍然会比说话更方便。但是在人们与身边科技设备的互动中,语音必将占据越来越大的份额,无论是与告诉你还需要多久洗完衣物的洗衣机互动,还是和企业热线的虚拟助手交谈。不过,要充分发挥潜能,这项技术还需要更多突破,而且必须解决由它引出的棘手问题——在便利性和隐私之间权衡。


计算机语音识别系统已出现多年。但在以前它并不可靠,而且需要漫长的训练才能学会识别特定使用者的语音。如今计算机无需训练即能可靠识别几乎任何人的语音,这一新能力是“深度学习”力量的最新体现。正因为有了深度学习,现在的机器将语音转为文字的准确度才堪比人类。计算机在处理各种形式的自然语言时表现大幅提升。


尽管深度学习能让机器能更可靠地识别语音、说话也不那么生硬,但它们还是无法理解语言的意思。这是这项技术最棘手的地方,而且如果语音驱动的计算要真正蓬勃发展,就必须克服这一难关。要进行一段连贯的对话,计算机必须能够理解上下文,而不是仅仅对简单的一次性语音指令做出回应。


欢迎登录商论App免费回顾2017年四月刊《现在,我们说上话了》全文


*如需转载文章,请私信后台“转载”联系我们



互动有礼

欢迎在下方“写留言”参与评论

每周获赞最多的三位读者将获赠礼品


在iOS App Store或官网tegbr.com更新或下载最新版本

即刻体验音频播放新功能! 

现订阅全年《经济学人·商论》全新福利二选一



点击“阅读原文”,免费下载商论App

觉得不错,分享给更多人看到

经济学人 微信二维码

经济学人 微信二维码