我目前正在做前10种类型的故障图。所以用户会输入错误是什么,例如。灯泡熔断了。因为它是“自由流”文本框,所以单词可能不一样。有没有让Alteryx明白一些词可能是一样的,让我找到前10种类型的错误。谢谢。
发布于 2017-12-20 05:22:24
你有几种方法。您可以使用联接类别中的模糊匹配工具来清理轻微的拼写错误。你可以在Youtube上找到Alteryx模糊匹配的例子。
还可以使用记录ID,后面跟着文本到列(根据空格拆分为行)来获取单个单词的列表。
在你想要做的事情中,我建议建立一个查找表。然后,您可以使用查找-替换工具从查找中追加类别,具体取决于找到的单词。
根据数据的清洁程度和每个类别有多大的不同,可以指导您了解您应该走多远。
https://stackoverflow.com/questions/47897551
复制相似问题