语音技术服务商思必驰推出“对话管理”技术,帮助机器实现多轮次人机会话从而理解用户深层意图

新用户940482166·2013年09月16日 16:12
在通常的语音人机交互中,语言AI难以对用户的模糊表达作出理解。而思必驰的“对话管理”技术则允许机器与人展开多轮次交互,通过对上下文的理解和对用户行为习惯的学习了解用户的真实意图并提供个性化的解决方案。该技术的逻辑对话只能在一定的知识域内才能有效实现,这要求思必驰技术与合作方业务的深度耦合。

机器被设计来服务人,然而过去两百多年来似乎总是人在不断迎合机器,每一次进步似乎都试图让人从自然压迫中解放,但每一种技术的诞生又给人套上另外一副枷锁。举个例子,人类从自然语言的环境中成长起来,但在与电子设备交互时却要重新去学习一套指令语言,在我看来这多少都有点“反人性”的意味。

让机器理解自然语言,是包括Google苹果微软百度讯飞等企业以及beyond Verbal出门问问小i机器人这类创业公司都在试图解决的。理解自然语言,最基本的要求是要“听清”(语音识别)和“听懂”(语义解析)。但在思必驰团队看来,这两者在帮助机器解决复杂任务上还有所不足,因此推出了“对话管理”技术:基于一定的对话逻辑,允许人机进行多轮次的语音互动,从而让机器理解用户的深层意图并提供反馈。

以前,我如果告诉语音助手“在36氪旁边找一家便宜旅馆”,助手会抓取“36氪”“旅馆”等关键词进行检索并返回结果。但当我问出这句话时其实有两点潜在限定:

1)旅馆要足够便宜。
2)住宿一定涉及时间(但我没有主动表达)。

通常的语言AI不会对这两点模糊表达做出反应,而思必驰的"对话管理"则会做出进一步追问,比如“何时入住?“”住多久?”“附近1公里内最便宜(需要将便宜这个概念数学化)的旅馆每晚300元是否接受?”,通过对上下文的理解逐渐逼近用户真实想法,然后提供个性化的解决方案。思必驰在背后做的,其实是一套结构化的任务处理程序,对话过程则是在不断注入变量。

以往的语音交互模型需要满足两点假设:一是识别和解析模块无错,二是用户指令完整无歧义——这在日常会话场景下是比较少见的。再加上不同交互环节的错误率累乘效应(系统最终输出结果的准确率是不同环节准确率的乘积),交互越多错误率越高。而思必驰则希望依靠上下文理解和机器学习,让AI随着交互数据的积累而越发精准。

当然,思必驰的"对话管理"还远远做不到像《钢铁侠》中Jarvis般的智能,所有逻辑对话只能在一定的知识域(通用或专业资源库)内实现,这要求思必驰必须与合作应用深度耦合才能带来较好的使用体验。目前其合作伙伴有完美世界和同程旅游等,两者正在进行产品开发中,短期内还无法体验到人机对话的效果。思必驰另有一款语音智能机器人在内部开发中,预计本月可以出现。

来自苏州的思必驰是语音领域的后起之秀,团队于12年获得联想、启迪等三方联合投资,核心技术人员为剑桥语音专家。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

不是智能电视,是盒子。今天下午,快播联合未来电视(ICNTV)正式发布强调智能多屏互动的盒子——快播客厅电脑“小芳”,主打家庭娱乐;定价299元起,提供三个价位的不同配置,由京东独家发售。

2013-09-16

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业