Lucene SpanQueries会自动标记化吗，还是我必须自己对查询进行标记化？

文章/答案/技术大牛

发布

1回答

我正在使用标准分析器来存储信息，这些信息在特殊字符上进行标记，并删除诸如“the”之类的停用词。我的问题是： (1)如果我做了一个SpanQuery，我搜索了“最好的东西”，但是没有存储单词" the“，我需要编写代码来取出这个单词，所以我只搜索”最好的东西“，还是自动为我处理？(2)我是不是也要自己处理低成本的问题？

浏览 12提问于2017-03-16得票数 0

回答已采纳

1回答

NLP -在全文搜索中使用语义通配符的查询，可能是Lucene吗？

、、、、

假设我有一个大语料库(例如英语或任意语言)，我想对它执行一些语义搜索。例如，我有一个查询：我想开发一个能够有效处理这些查询的库我怀疑解析文本需要某种POS标记，但由于我不想

浏览 3提问于2012-11-25得票数 0

2回答

NLP -在全文搜索中使用语义通配符的查询，可能是Lucene吗？

、、、、

假设我有一个大语料库(例如英语或任意语言)，我想对它执行一些语义搜索。例如，我有一个查询：艺术 --一些文章的占位符(例如英文的a/ an )、sg、做某事 --一些用于NPs和VP (subjects和谓词)的占位符--我想开发一个能够有效地处理这些查询的库我怀疑解析文本需要某种POS标记

浏览 0提问于2012-11-25得票数 3

2回答

Lucene:单个术语中的多个单词

、

假设我有一个这样的文档textfield:name website stackoverflowStandardAnalyzer analyzer= new StandardAnalyzer(Version.LUCENE_42);Phra

浏览 0提问于2013-06-06得票数 0

回答已采纳

2回答

用于标记、云和搜索的最佳数据结构(如StackOverflow)？

、、、

我很想知道Stack Overflow的标记和搜索是如何架构的，因为它似乎运行得很好。在各种实体上存储标记(如何标准化？)搜索具有特定标记的项目，构建适用于特定搜索结果Entity_Tag的所有标记云，以显示搜索result?中每个项目的标记列表。也许以规范化的形式存储标记是有意义的，但对于#2、#4和#3的目的来说，它也是以空格分隔的字符串。

浏览 9提问于2008-10-24得票数 39

1回答

使用SVN进行配置文件版本控制的最佳实践

、、、、

我必须对一个由四个应用程序组成的项目进行版本化，每个应用程序都有自己的配置文件。此项目必须部署到多个客户，并通过修改配置文件为每个客户进行自定义。对不同客户的配置文件进行版本化的最佳实践是什么？每个客户的整个项目的分支或标记(每个客户都有自己修改的配置文件)还是项目的主干(最终带有分支和标记，由于其他原因而创建)和客户的配置文

浏览 3提问于2013-04-10得票数 2

回答已采纳

2回答

让lucene把一个领域中的所有术语作为一个单一的术语来处理。

在我的Lucene文档中，我有一个字段" company“，其中公司名称被标记。我需要对我的应用程序的某个部分进行标记化。但是对于这个查询，我需要能够在整个公司字段上创建一个PrefixQuery。示例：定期查询“胸罩”

浏览 4提问于2009-03-03得票数 0

回答已采纳

1回答

Lucene lemmatization

、

我正在使用Lucene对Java应用程序中的一些英文文本进行索引，我需要使用Lucene 4_1_0对它们进行列举化。我已经找到了词干分析(PorterStemFilter和SnowballFilter)，但这还不够。在词汇化之后，我想使用同义词库进行查询扩展，Lucene是否也包含同义词库？如果不可能，我将

浏览 1提问于2014-02-11得票数 2

3回答

Lucene索引:解释存储和索引模式

我想我还是不理解lucene索引选项。Store.Yes 我不知道什么是规范。如何存储标记化值？如果我将值"my“存储在"

浏览 3提问于2009-03-16得票数 45

回答已采纳

2回答

带空格的lucene通配符查询

、、

我有Lucene索引，其中有城市名称。假设我想搜索“新德里”。我有字符串'New Del‘，我想要传递给Lucene搜索器，我希望输出为’新德里‘。如果我生成类似Name:New Del*的查询，它会给我所有的城市，其中包含'New and Del‘。有没有什么方法可以创建带有空格的Lucene查询通配符查询?我参考并尝试了几个给出@ 的解决方

浏览 16提问于2015-12-30得票数 7

2回答

如何使用Zend Lucene查找相似/相关的文本？

、、、

假设我需要像stackoverflow一样搜索相关标题，然后在提交新闻之前添加问题或digg.com。有没有办法做这样的搜索？

浏览 0提问于2010-04-27得票数 1

回答已采纳

1回答

在Lucene搜索引擎中使用自建方法

、、、、

我正在寻找一个合适的搜索引擎，我可以在其中使用我自己的相似性度量和标记化方法。Lucene搜索引擎就是为这个目的而引入的一个很好的引擎，但我对此一无所知。我在网上搜索了新版本的Lucene搜索引擎的教程，但大多数页面都是几年前的。我的一些问题如下：是否有可能改变相似性度量、标记化和词干提取方法，并使用Lucene中的自建类？如果是，怎么做？，我们如何索引关键字搜

浏览 36提问于2018-06-03得票数 0

2回答

通过Java API实现的Alfresco搜索结果与Nodebrowser中的结果不同

、

我使用的是启用了Lucene的Alfresco 4.1。我有一个'myfoldertype‘类型的文件夹，名为'one，2’。名称的标记化(默认情况下)处于启用状态。我通过自己的Java支持的webscript在特定类型的文件夹上按名称进行搜索。);我</

浏览 1提问于2013-10-31得票数 1

1回答

Google like搜索字符串解析为sql

、、、、

假设我有一个带有postgres数据库的web应用程序。我想添加一个谷歌喜欢搜索字符串(abc+站点:xyz+ size>800 -pqrs)到它。因此，此字符串将生成用于从数据库返回结果的sql。我自己解析/标记用户查询并生成sql，或者使用lucene或postgresql中的tsearch2。还不确定哪种方法更好。但我倾向于lucene。如果我使用lucene，我可以在数据库中

浏览 0提问于2011-11-05得票数 0

回答已采纳

2回答

所有这些单词都具有

我在Lucene.This中索引了一个" description“字段，其中包含一本书的描述。如何使用BooleanQuery类在此字段上实现“所有这些单词”功能？

浏览 3提问于2009-01-10得票数 0

回答已采纳

1回答

Solr精确匹配字段升压

、

我有这样的要求:如果查询文本与特定的字段值(标题字段)完全匹配，则结果必须是第一个或至少是最小的。所以我需要用精确的匹配来提高结果。我的解决方案是将title创建为一个未标记化的字段，这样它将只精确匹配，并使用edismax查询来增强title。还有别的办法吗？如何对未标记化的字段进行索引？那么没有空格上的标记化吗？

浏览 2提问于2018-06-04得票数 0

2回答

Solr是否可以索引纯文本文件，而不需要我通过Tika运行它们？

、

我只是在Solr的研究阶段，但到目前为止，似乎要索引一个非结构化的文本文件，我必须使用Tika将其转换为XML？这是真的吗？我觉得奇怪的是，Lucene可以在不进行任何转换的情况下对任意文本进行标记化和索引，但是Solr需要这个额外的步骤来转换为XML。我想也许我只是错过了什么。我正在研究接近实时的全文搜索，每天搜索数百万个文件

浏览 0提问于2012-08-04得票数 2

回答已采纳

1回答

Lucene标准分析器按周期拆分

、

如何使Lucene的标准分析器在‘’查尔？例如，在查询"B“时，我需要返回"A.B.C”中的B作为结果。我需要用标准分析器处理数字的方式来处理数字，因此简单的分析器是不够的。如果我可以指定标准的Analyzer在‘’上标记化，那就太好了。char也是。如果我必须用这个小扩展来编写自己的记号赋予器，我该怎么做呢？谢谢，Nacha

浏览 4提问于2011-03-14得票数 7

回答已采纳

1回答

Elastic Search Analyzer和Facet

、

我正在为客户评估Elastic Search。我已经开始使用API，并成功地创建了索引并将文档添加到搜索中。使用Elastic Search的主要原因是它提供了facets功能。我在理解分析器、标记器和过滤器以及它们如何与方面相适应时遇到了困难。我希望能够使用关键字，日期，搜索词等作为我的方面。我该如何将Analyzer整合到我的搜索中，以及如何将其与facets结合使用？

浏览 0提问于2012-06-07得票数 5

回答已采纳

1回答

TermQuery不返回已知搜索词，但WildcardQuery返回

、、、

我希望对Lucene内部工作原理有足够洞察力的人能够给我指明正确的方向=)document.Add( new Field("Typenummer", "E5CEB501A244410EB1FFC4761F79E7B7", Field.Store.YES ,

浏览 0提问于2012-02-24得票数 7

回答已采纳

点击加载更多