对话3位语音交互专家:人机交互能否给人类一个更好的未来?

原创 2017年06月13日 10:51:11

伴随着去年三月AlphaGo与李世石人机大战的开始与落幕,人工智能受到了前所未有的关注与追捧。各类算法的研发与数据的积累,加之资本的不断投入以及用户需求的持续推动,促进人工智能行业的爆发。

技术发展的关键在于落地,“语音”作为目前人工智能领域落地最为成熟的技术,以准确率可达95%以上的识别水平,已经逐渐步入商业化阶段。而语音交互的实现主要取决于两点:语音识别及语义理解。

语音识别是指人与机器以语音对话方式,将人类的语音中的词汇内容转换为计算机可读输入。语音识别只是语音交互的初始阶段,语义的理解才是关键所在。语义理解是NLP(自然语言处理)技术的一个重要组成部分,而时下正火的NLP技术也是人工智能面临的最为困难的问题之一。

近日,IT耳朵采访到了目前专注于语音交互领域的三家创业企业人物:三角兽CTO亓超、思必驰NLP技术负责人樊帅、以及蓦然认知CEO戴帅湘(排名不分先后),了解国内目前的语音交互领域发展现状,以及这一行业未来发展的看法。

WechatIMG232

(从左至右依次为:三角兽CTO亓超、思必驰NLP技术负责人樊帅、蓦然认知CEO戴帅湘)

尚未出现绝对的领航者

技术上的突破无疑是分占市场的最佳切入点。“随着技术上的逐渐突破,语音识别已经发展的足够成熟,它只是人机交互过程中的最初阶段,因此不再具备一定的行业壁垒及竞争优势,而这股行业浪潮中,语义却是刚刚开始。”蓦然认知的戴帅湘说道。

语义的理解将人机交互推到一个新的发展阶段,大多企业都明白,语音的识别、大数据的整合以及算法模型的构建,是能够让机器“听得懂”的关键所在。甚至在人机交互过程中所面临的环境噪音、发音不准、语言歧义等问题,也都相应催生了新的技术算法。

timg

如此看来,虽然语义理解领域的技术门槛较高,但目前仍未出现绝对领航者,

 数据的积累都是从0到1的过程

 在这三次的专访中,我都问过他们关于“冬天能穿多少穿多少,夏天能穿多少穿多少”的玩笑问题。在与机器的交互过程中,我们所希望看到的,不仅局限于任务型的对轮对话,难免会有调戏的成分在里面。思必驰的樊帅表示“机器对于这类玩笑的回应,不仅基于规则的指定,还有数据的完善。”

而数据始终没有尽头,就像从0不断趋近于1的这个过程。从最初数据的匮乏、数据标注、建模的困难都是这个从0到1的过程里的技术难点所在,针对性的去做建模、分析、数据完善,只能达到可用状态,若要机器变的“聪明”,则需要一个从1到N的不断学习和优化的过程,计算能力的提升以及新算法的实现,才能使数据模型得到更好的释放。

timg

正如亓超所说,机器是喜欢数据的,用机器喜欢的方式去解决问题,似乎更加高效、公平。不论是哪个领域的人机交互,机器并非都要被动地去回答问题,而是能够主动的、有针对性的提出意见或建议,才是人机交互最自然的状态。

 关于未来市场的争夺

 和一些国外大公司有能力收购语音交互的整个生态链不同,国内的大多数企业在自主研发的同时,兼顾市场的争夺,看起来似乎曲折很多。目前,国内很多企业都十分统一的选择在车载、家居、可穿戴设备领域布局, 这场同行业之间的争相效仿与激烈竞争的结果,无非是将最初的创新格局彻底打破,抓住用户的使用痛点,寻找新的出路才是一个企业得以存活下去的资本。

timg

智能时代的重点之一是人机交互,而语音交互凭借自然的交互体验、较为集中的学习成本成为发展的首选方向。目前,国内有越来越多的语音交互创业公司正在慢慢崛起,这也意味着将会有更多的人在这片领域站稳脚跟。即便这种全新的交互方式还有很长的路要走,但在这浮躁的市场中多一份务实,语音交互产业所形成的趋势,也是值得我们期待和关注的。

微信扫码关注IT耳朵

文章标签:

恬静
IT耳朵记者,关注人工智能、VR/AR、物联网等方向。邮箱:zhaotianjing@iterduo.com
  • 1 Responses to “对话3位语音交互专家:人机交互能否给人类一个更好的未来?”

扫码分享此文章