我在一个快速的ESP服务器上运行一个搜索应用程序。现在我在字符规范化方面遇到了这个问题。
我想要的是搜索“wurth”并在“würth”中找到匹配结果。
我尝试在esp/etc/tokenizer/tokenization.xml中配置以下内容
<normalizationlist name="German to Norwegian">
<normalization description="German u with diaeresis, to Norwegian u">
<input>x75</i
我目前是NLP的新手,需要指导我如何解决这个问题。
我目前正在做一个过滤技术,我需要给数据库中的数据打上正确或错误的标签。我得到了一个结构化的数据集,其中包含列和行。
但是,过滤条件是在一个文本文件中给出的。示例过滤文本文件可能如下所示:
Values in the column ID which are bigger than 99
Values in the column Cash which are smaller than 10000
Values in the column EndDate that are smaller than values in StartDate
Value