是否有可能在Lucene排序过程中获得要比较的完整文档

java、lucene

我正在使用Lucene 5.5。我有一个自定义的FieldComparatorSource类，用于比较使用自定义TermValComparator的字段。这只能让我比较这一个字段。有没有一种方法可以定制分类器，它可以将整个文档进行比较以进行排序？

浏览 4提问于2019-10-10得票数 0

2回答

用Java中Lucene3.0频繁更新字段是否能够获得实时搜索结果？

java、search、full-text-search、lucene、near-real-time

考虑下列假设：在哪里可以找到Lucene3.0的几乎实时搜索的代码示例(简单但尽可能完整<

浏览 8提问于2010-01-09得票数 2

回答已采纳

1回答

获取特定字段中每一项的分数

lucene

我目前使用的是lucene 4.0上的快照版本(因为bm25)，我想知道是否有可能在给定的期限内获得分数。例如，在索引上，我为每个文档存储两个字段，即内容字段中的文档内容和作者字段中的作者。现在，当我检索文档时，我也会获取作者，但当我获取作者时，我会获得每个作者的分数(集合范围的分数)，这样我就可以对作者进行<

浏览 1提问于2012-03-08得票数 0

回答已采纳

1回答

Apache :排序编号和德国货币

java、apache、lucene

在Apache lucene中是否有一个选项可以正确地对数字和德国货币进行排序，这意味着，例如，应该将“Ue”解释为"Ue"，这意味着排序顺序是而不是：就像lucene的违约。排序数字，如也不像lucene的默认值：我怎样才能用这种方式解决这些条目呢？谢谢!

浏览 0提问于2018-11-22得票数 1

回答已采纳

1回答

lucene跳过列表是为了什么？

elasticsearch、lucene、skip-lists

我正在研究lucene/elasticsearch内部结构，特别是存储结构。当lucene获得查找"docID“的”术语“时，我发现它通过TermIndex->TermDictionary-> .doc (Version7.2).doc有每个术语的。.在投递列表中，有排序的文档In。我的问题是，他们为什么要跳过名单？lucene寻

浏览 1提问于2018-03-15得票数 0

回答已采纳

4回答

可以使用Lucene将每个实体排序为一组文档吗？

java、search、solr、lucene、search-engine

我正在进行一个项目，其中每个要排序的实体都是，不是单个文档，而是实际上一组文档。关联的计算是特定于这个问题的安静的东西，我已经有了一个工作代码。我刚刚开始使用 Lucene ，因此我不知道这个功

浏览 3提问于2012-08-21得票数 1

1回答

Lucene中跨文档共享的标记和属性

java、lucene

我的应用程序需要保存一个文件索引，其中文件是通过标记和属性知道的，建议使用Lucene (Java)文档模式，如下所示：attributes:以下是我的问题：如果我正确理解Lucene的索引方案，那么当在许多文档中将相同的长字符串作为字段进行索引时，与仅索引一次的索引相比，这并不能真正地扩展索引。对，是这样?如果创建单个术语对象，将其存储，然后将其添加到

浏览 2提问于2009-04-13得票数 2

回答已采纳

1回答

从加工文档中提取字段的唯一listo

c#、lucene、lucene.net

我对Lucene很陌生，所以也许我对它的工作方式有了一些了解。我用许多string字段索引了几十万个文档。例如，假设我们有5个字符串字段(命名为A、B、C、D、E)，而前3个字段被索引(A、B、C)，最后两个未索引，只包含在文档中(我指D，E)。是否有可能在没有扫描的情况下获得每个字段的唯一值(不同的)列表并对结果进行分组？我对此特别感兴趣，因为我对实际读取<e

浏览 3提问于2021-12-23得票数 0

回答已采纳

3回答

本地开发基于云的应用程序

lucene、couchdb、cloudant

但是，如何开发需要Cloudant的lucene搜索的应用程序功能呢？有没有办法在本地模仿它？

浏览 6提问于2014-11-10得票数 2

回答已采纳

1回答

我的Lucene索引中有超过1000万个文档，我需要在我的应用程序中实现适当的分页。每个文档都是大学考生的唯一记录。目前，我每页显示5条记录，并在前端为用户提供分页。现在举个例子，我的搜索查询的总命中率是1000万，当我点击最后一页时，我基本上会转到页码2000000(200万)。在后端，我将pageNumber*5作为maxSearch(int)传递给lucene搜索函数。这需要花费大量的时间来获

浏览 5提问于2017-03-10得票数 0

3回答

使用Lucene查询RDBMS数据库

database、lucene.net、lucene

我已经在文档中浏览了Lucene的Java版本，但到目前为止我还没有真正看到顶层的“这就是它的工作方式”的信息(我知道我需要RTFM，我只是看不到树木的木头)。这很好，所以现在我要检查以下假设：I.e.如果我想通过sku、描述、类别名称等搜索Product，但我也想在搜索结果中显示它们所属的Custo

浏览 2提问于2011-01-17得票数 4

回答已采纳

1回答

按集合字段分组solr搜索结果的解决方法

search、solr、lucene

我得到了3个或更多的不同类别，我只需要一个文件与最高的得分为每个类别。换句话说，我需要按类别字段对结果进行分组，每个组必须按照分数desc进行排序，而每个组必须限定为1。例如，对于got a，b，c类别结果，必须包含3个文档。with id == 5 for a categorydocument with id == 5 for c category 是否可以使用单请求创建solr查询以获得这样的</em

浏览 4提问于2019-10-11得票数 0

回答已采纳

2回答

Lucene.NET -包含“和”的搜索短语

lucene.net

寻找关于处理符号和Lucene查询中的单词" and“的建议。我的测试查询是(包括引号)：理想情况下，我希望使用QueryParser在测试和文档阅读过程中，我发现使用StandardAnalyzer并不能满足我的需要。对于前两个查询，QueryParser.Parse将它

浏览 3提问于2009-09-15得票数 2

回答已采纳

1回答

全文查询结果按分数排列不正确

c#、full-text-search、ravendb、lucene.net

我有一个RavenDB数据库，其中有几个文档，如下所示：{ public, Lucene.Net"); }假设我有三个文档，其中接下来，我有一个要查询的搜索词列表

浏览 3提问于2013-10-08得票数 2

回答已采纳

1回答

在lucene中递归地确定相似度

java、lucene、similarity、recursive-query、tf-idf

我收藏了多种语言的书籍。我需要根据它们的相似性将每本书的各个部分相互链接起来。我需要链接书籍到类似的书，章节到类似的章节和子章到相似的子章。最好，相似性度量还会考虑下一个最高级别的相似性，所以当我想要比较两个章节时，它会首先检查这两个章节所属的书籍彼此有多相似，并将其作为基线。有没有办法告诉lucene，索引中的文档遵循分层结构，其中书籍由章节组成，章节由子章组成(这是要存储的实际文档</e

浏览 0提问于2014-12-01得票数 0

2回答

写入Lucene.Net索引时内存使用量持续增长

optimization、nlp、lucene.net、information-retrieval

在谷歌搜索Lucene.Net用法之后，我打开了这个讨论，我没有发现任何真正有用的东西。问题很简单:我在构建和更新Lucene.Net索引时遇到了问题。为了使lucene.Net适用于我的数据，我从本教程开始：此外，我注意到，要处理10

浏览 0提问于2012-08-24得票数 3

回答已采纳

1回答

：比较和对比Lucene和Search

java、google-app-engine、lucene、google-search-api

但是，由于Search不能进行部分或拼写错误的匹配(以及其他事情)，因此我试图根据这里的响应建议切换到 (即Lucene )。有人能解决以下问题吗？我该去哪里看我的L

浏览 1提问于2015-03-27得票数 1

7回答

用于文本分析的算法或库，特别是:占主导地位的单词、跨文本的短语和文本集合

algorithm、text、nlp、analysis、lexical-analysis

我正在做一个项目，在这个项目中，我需要分析一页文本和一页文本的集合，以确定主导单词。我想知道是否有库(最好是c#或java)可以帮我处理繁重的工作。如果没有，是否有算法或倍数可以实现我下面的目标。我想做的是类似于从你在网络上找到的url或rss feed构建的word cloud，除了我不想要可视化。它们一直被用于分析总统候选人的演讲，以了解主题或使用最多的词是什么。复杂的是，我需

浏览 0提问于2008-10-20得票数 21

2回答

满GC期间的线程转储

java、jvm

我想知道是否有可能在一个完整的GC中获得一个线程转储。将其与日志进行比较，缩小可能触发它的请求或操作。我只是想知道是否可以在完全GC期间获得一个线程转储。

浏览 2提问于2016-07-04得票数 0

回答已采纳

2回答

搜索软件/服务器的替代方案，用于检索所有匹配文档的ID

solr、elasticsearch、lucene、sphinx

我正在尝试弄清楚如何根据关键字匹配来过滤非常大的文档集。 (term1 NEAR term2 NEAR term3) AND NOT "A phrase" AND @fieldXYZ "wildcards%aswell*" 结果不需要以任何方式进行评分、排序或排名。据我所

浏览 1提问于2015-01-16得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用Java中Lucene3.0频繁更新字段是否能够获得实时搜索结果？

获取特定字段中每一项的分数

Apache :排序编号和德国货币

lucene跳过列表是为了什么？

可以使用Lucene将每个实体排序为一组文档吗？

Lucene中跨文档共享的标记和属性

从加工文档中提取字段的唯一listo

本地开发基于云的应用程序

如何在Lucene中的数百万条记录中实现正确的分页

使用Lucene查询RDBMS数据库

按集合字段分组solr搜索结果的解决方法

Lucene.NET -包含“和”的搜索短语

全文查询结果按分数排列不正确

在lucene中递归地确定相似度

写入Lucene.Net索引时内存使用量持续增长

：比较和对比Lucene和Search

用于文本分析的算法或库，特别是:占主导地位的单词、跨文本的短语和文本集合

满GC期间的线程转储

搜索软件/服务器的替代方案，用于检索所有匹配文档的ID

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐