亚马逊的研究人员分享了人工智能如何帮助Alexa回答后续问题


人类有一个容易的时间与上下文结转-通过几轮对话跟踪参考资料的能力(比如在“旧金山天气如何?”的后续行动中推断“那里”的含义)-但它超出了大多数聪明的演讲者和虚拟助手的会话能力 。不过,这一点人工智能(AI)是解决不了的,亚马逊的研究人员在今天的一篇博客文章中写到了他们在Alexa身上取得的进展 。
在与Alexa的典型聊天中,用户会在连续的问题中调用多个应用程序——用亚马逊的说法就是技能 。目前,Alexa根据其领域(技能类型)、意图(技能的功能)和插槽(技能作用的变量)分析每个查询的内容 。但是技能通常会重新使用诸如“城镇”和“城市”之类的插槽,这带来了一个明显的问题-如果用户询问方向并跟进一个关于餐厅位置的问题,Alexa如何知道在它的答案中要引用哪一条线?
古普塔和他的同事在论文中描述了一种解决方案“不平衡模式的上下文时隙结转”,一种自动学习将一种技能的时隙映射到另一种技能的神经网络 。调查结果将在9月即将在海得拉巴举行的Interspeech会议上提出 。
该系统由两部分组成,Gupta解释说:(1)从会话数据中产生
【亚马逊的研究人员分享了人工智能如何帮助Alexa回答后续问题】在编码阶段,用户和Alexa的“话语历史”被组合成一个向量,其输出传递给解码器 。借助一种机制,引导它专注于用户或Alexa的话语,解码器选择是否携带插槽 。
Gupta写道:“当系统使用时,我们在嵌入空间中使用邻近性来生成一个候选映射列表,该列表包含到目前为止在会话中遇到的每个时隙和当前调用的技能中可用的时隙 。” “然后,这些候选人中的每一个都被输入编码器,以及其他特性,如客户话语的最近历史、Alexa反应的最近历史以及客户最近话语的推断意图 。
古普塔和他的共同作者发现,与硬编码的插槽映射系统相比,神经网络在性能上提供了“轻微”的改进,并且“有明显的[更高的]召回率” 。
Gupta写道:“总的来说,根据F1评分,即召回率和准确率(衡量假阳性率)相结合,我们的系统的表现比基于规则的系统高出大约9% 。”
Gupta说,4月份宣布的Alexa的背景结转将“分阶段进行” 。
值得注意的是,谷歌在5月份的I/O开发人员会议上为谷歌助理推出了一个类似的功能:继续对话 。它在6月份来到了Google Home的发言人那里,允许用户询问后续问题,而不需要使用多重唤醒短语 。

    推荐阅读