我是elasticsearch的新手,我正在尝试配置同义词,但是它并没有像预期的那样工作。
我有以下领域的数据:技术主管、模块领导、软件工程师、高级软件工程师
我想,如果我搜索tl,那么它应该返回“技术领导”或"tl“,但是它返回我的”技术领导“和”模块领导“,因为铅是在索引tme上标记的。
你能帮我解决这个问题与确切的设置。
我见过索引时间和搜索时间标记化,但无法理解。
synonyms.txt:
tl,TL =>技术领导 se,SE =>软件工程师 sse =>高级软件工程师
映射文件:
{
"settings": {
"index": {
"analysis": {
"analyzer": {
"synonym": {
"tokenizer": "whitespace",
"filter": [
"synonym"
]
}
},
"filter": {
"synonym": {
"type": "synonym",
"synonyms_path": "synonyms.txt"
}
}
}
}
},
"mappings": {
"tweet": {
"properties": {
"Domain": {
"type": "string",
"analyzer": "synonym"
},
"Designation": {
"analyzer": "synonym",
"type": "string"
},
"City": {
"type": "string",
"analyzer": "synonym"
}
}
}
}
}
发布于 2013-10-10 15:15:47
你的代币在这里是一样的,所以你把那部分放下了。您需要做的是确保您正在做“和”匹配,而不是一个或“,因为它似乎只是匹配的任何一个词,而不是所有。
看看你的代币:
localhost:9200/test/_analyze?analyzer=synonym&text=technical lead
localhost:9200/test/_analyze?analyzer=synonym&text=tl
和查询
{
"query": {
"match": {
"domain": {
"query": "tl",
"operator": "and"
}
}
}
}
通常,您希望您的搜索和索引分析器是相同的。然而,有许多先进的例子,这是不可取的。但是,在同义词的情况下,当打开展开时,通常不希望在其中一个中使用同义词。tl,技术牵头
但是,由于您使用的是=>类型的同义词,这并不重要,因为所有单词都将转换为右边的单词,而不是为逗号之间的每个单词创建一串标记。
https://stackoverflow.com/questions/19289488
复制相似问题