我需要使用Apache Lucene和Commons Digester构建一个基于XML的查询。
我的文档格式如下:
<doc>
<id>361492799</id>
<title>Dan1</title>
<description>We had another Flickr meetup in Rochester, the biggest that Ive been to. 12 people showed up.Da, he was to the right.</description>
<time&
当我们谈论倒排索引时,我们总是谈论索引非结构化文本文档。但是ElasticSearch中的文档是JSON格式的,它们是“键”-“值”对。所以我想知道JSON文档的倒排索引是什么样子的。换句话说,当我们像"select * from table where name = john“这样进行搜索时,ES做了什么?
我希望你能理解我想做什么。很难选择最好的单词,因为英语不是我的第一语言,我不相信自动翻译。我会尽我所能解释的。
我在考虑分析一篇长文。假设,例如,我有一个字符串划分为段落。
Lorem ipsum dolor坐好了,敬请光临。一种噬菌体。Lorem ipsum dolor坐好了,敬请光临。马提斯是一种发酵植物。
Duis mollis,est non,nisi erat porttitor ligula,eget lacinia odio sem nec elit。埃尼昂·欧·利奥·夸姆。[医]乳.在,我们会得到更多的。Lorem ipsum dolor坐好了,敬请光临。库拉比托人。梅塞纳们