亚马逊的Alexa、Nuance的混合和Facebook的Wit.ai都使用类似的系统来指定如何将文本命令转换为意图--即计算机能够理解的内容。我不知道这是什么“官方”名称,但我称之为“意图承认”。基本上是从“请将我的灯调到50%亮度”到lights.setBrightness(0.50)
的一种方法。
指定它们的方式是让开发人员提供与意图相关联的“示例语句”列表,并可选择地标记“实体”的位置(基本上是参数)。下面是Wit.ai的一个示例:
我的问题是:这些系统是如何工作的?因为它们都是非常相似的,所以我认为它们都使用了一些开创性的工作。有人知道这是什么吗?
有趣的是,亨迪使用了一个更像regexes的不同系统:["please"] . ("activate" | "enable" | "switch on" | "turn on") . [("the" | "my")] . ("lights" | "lighting") . ["please"]
。我认为这是集成到他们的语音识别系统的波束搜索,而Alexa,Wit.ai和Mix似乎有单独的语音->文本和文本->意图系统。
编辑:我找到了一个起点- 一种基于非正式语音命令的人机交互机制。它使用所谓的潜在语义分析来比较话语。我要读这篇文章。至少它给了我一个引证网络的起点。
编辑2: LSA本质上是比较每一段文字中使用的单词(单词袋)。我看不出它怎么能很好地适用于这个案子,因为它完全失去了语序。尽管也许词序对这类命令没有多大影响。
编辑3:隐主题马尔可夫模型看起来可能很有趣。
发布于 2016-10-04 19:26:12
虽然您没有直接回答您的问题,但您可能对自动化答疑领域感兴趣。要回答自然语言文本问题,首先必须理解这些问题,这与你的问题重叠。
Jurafsky和Manning课程是一个很好的资源。特别是关于语义和问题回答的部分可能有助于您寻找什么。随附的讲座视频可在youtube 这里上找到。
发布于 2017-01-06 09:20:27
这个职位有一种方法。基本上,他们使用一袋单词--他们把单词转换成稀疏向量,然后把它们加起来。
它似乎运行得很好,但一个主要的缺陷是答案与词序无关,所以除非您特殊处理,否则您不能进行“每磅多少公斤”之类的查询。
然而,我和Alexa一起做了短信,它对语序变化相当不敏感,所以也许他们确实使用了类似的东西。
https://datascience.stackexchange.com/questions/11043
复制相似问题