我有一个Azure搜索索引,里面有一堆文本条目。我观察到,如果索引包含像"AI's“这样的条目(使用Unicode撇号字符8217),则搜索单词”AI“将无法返回结果。索引应该处理标点符号-包括Unicode变体。搜索"John“应该返回一个带有”John‘s“的项目。请确认这是否是一个已知的bug,如果是,什么时候可以修复它。
当我搜索"AI“(撇号是Unicode字符8217)时,期望找到"AI's”。该项目不会像预期的那样返回。
发布于 2019-10-24 04:35:39
你能确认你在索引中使用的是哪种分析器吗?我们支持许多分析器,这些分析器会将您的搜索词和文档词分解为不同的标记。例如,如果你的内容是英文的,你可以使用en.microsoft分析器,它应该将你的"AI“术语分成两个标记->”AI“和"AI's”。
有关分析器的更多信息,请单击此处->
https://docs.microsoft.com/en-us/azure/search/search-analyzers和这里的https://docs.microsoft.com/en-us/azure/search/index-add-language-analyzers
https://stackoverflow.com/questions/58519231
复制相似问题