我想改进ibm的Watson助手的效果。因此,我想知道在Watson assistant的对话中确定对话的算法。这是一个支持向量机算法吗?欢迎发表论文。
发布于 2018-06-25 12:02:49
Watson Assistant提供了许多ML/NLP技术。所以这不仅仅是一个单一的算法。了解它们并不会帮助你提高你的结果。
我想改善ibm的Watson助手的效果。
有很多种方法。
代表性问题。
专注于从最终用户那里获得真正具有代表性的问题。不仅在他们使用的语言中,而且如果可能的话,从相同的媒介上,你计划使用WA on (例如。移动设备、Web、音频)。
这是降低准确性的第一个因素。制造意图可能意味着您建立了客户可能永远不会要求的意图(即使您认为他们会这样做)。其次,您将使用具有类似模式的语言/术语。这使得WA更难训练。
培训问题总数
可以用一个问题来训练意图,但为了获得最好的结果,10-20个示例问题。在意图接近的地方,就需要更多的例子。
测试
当前的流程是创建所谓的K折交叉验证(sample script)。如果你的问题具有代表性,那么结果应该给你一个准确的指标,表明它的表现有多好。
但是,有可能过度适应训练。所以你应该使用盲集。这是所有问题(随机样本)的10-20%。它们永远不应该被用来训练WA。然后在系统上运行它们。你的盲人+K折应该落在彼此的5%以内。
你可以查看K折的结果来解决问题,但盲集不应该。百叶窗也会变得陈旧。因此,尝试在2-3个训练周期后创建一个新的盲集。
终端用户测试。
无论您的系统训练得有多好,我可以向您保证,在最终用户面前会出现新的东西。因此,在将其投入生产之前,您应该计划让用户进行测试。
在让用户进行测试时,请确保他们了解已接受培训的一般领域。你可以通过用户故事做到这一点,但尽量不要让用户提出一个范围狭窄的问题。
示例:
https://stackoverflow.com/questions/51008122
复制相似问题