腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
是否
有
可能在
Lucene
排序
过程中
获得
要
比较
的
完整
文档
java
、
lucene
我正在使用
Lucene
5.5。 我
有
一个自定义
的
FieldComparatorSource类,用于
比较
使用自定义TermValComparator
的
字段。这只能让我
比较
这一个字段。有没有一种方法可以定制分类器,它可以将整个
文档
进行
比较
以进行
排序
?
浏览 4
提问于2019-10-10
得票数 0
2
回答
用Java中
Lucene
3.0频繁更新字段
是否
能够
获得
实时搜索结果?
java
、
search
、
full-text-search
、
lucene
、
near-real-time
考虑下列假设: 在哪里可以找到
Lucene
3.0
的
几乎实时搜索
的
代码示例(简单但尽可能
完整<
浏览 8
提问于2010-01-09
得票数 2
回答已采纳
1
回答
获取特定字段中每一项
的
分数
lucene
我目前使用
的
是
lucene
4.0上
的
快照版本(因为bm25),我想知道
是否
有
可能在
给定
的
期限内
获得
分数。例如,在索引上,我为每个
文档
存储两个字段,即内容字段中
的
文档
内容和作者字段中
的
作者。现在,当我检索
文档
时,我也会获取作者,但当我获取作者时,我会
获得
每个作者
的
分数(集合范围
的
分数),这样我就可以对作者进行<
浏览 1
提问于2012-03-08
得票数 0
回答已采纳
1
回答
Apache :
排序
编号和德国货币
java
、
apache
、
lucene
在Apache
lucene
中
是否
有
一个选项可以正确地对数字和德国货币进行
排序
,这意味着,例如,应该将“Ue”解释为"Ue",这意味着
排序
顺序是而不是:就像
lucene
的
违约。
排序
数字,如也不像
lucene
的
默认值:我怎样才能用这种方式解决这些条目呢? 谢谢!
浏览 0
提问于2018-11-22
得票数 1
回答已采纳
1
回答
lucene
跳过列表是为了什么?
elasticsearch
、
lucene
、
skip-lists
我正在研究
lucene
/elasticsearch内部结构,特别是存储结构。当
lucene
获得
查找"docID“
的
”术语“时,我发现它通过TermIndex->TermDictionary-> .doc (Version7.2).doc
有
每个术语
的
。.在投递列表中,
有
排序
的
文档
In。 我
的
问题是,他们为什么
要
跳过名单?
lucene
寻
浏览 1
提问于2018-03-15
得票数 0
回答已采纳
4
回答
可以使用
Lucene
将每个实体
排序
为一组
文档
吗?
java
、
search
、
solr
、
lucene
、
search-engine
我正在进行一个项目,其中每个
要
排序
的
实体都是,不是单个
文档
,而是实际上一组
文档
。关联
的
计算是特定于这个问题
的
安静
的
东西,我已经
有
了一个工作代码。 我刚刚开始使用
Lucene
,因此我不知道这个功
浏览 3
提问于2012-08-21
得票数 1
1
回答
Lucene
中跨
文档
共享
的
标记和属性
java
、
lucene
我
的
应用程序需要保存一个文件索引,其中文件是通过标记和属性知道
的
,建议使用
Lucene
(Java)
文档
模式,如下所示:attributes:以下是我
的
问题: 如果我正确理解
Lucene
的
索引方案,那么当在许多
文档
中将相同
的
长字符串作为字段进行索引时,与仅索引一次
的
索引相比,这并不能真正地扩展索引。对,是这样?如果创建单个术语对象,将其存储,然后将其添加到
浏览 2
提问于2009-04-13
得票数 2
回答已采纳
1
回答
从加工
文档
中提取字段
的
唯一listo
c#
、
lucene
、
lucene.net
我对
Lucene
很陌生,所以也许我对它
的
工作方式
有
了一些了解。 我用许多string字段索引了几十万个
文档
。例如,假设我们
有
5个字符串字段(命名为A、B、C、D、E),而前3个字段被索引(A、B、C),最后两个未索引,只包含在
文档
中(我指D,E)。
是否
有
可能在
没有扫描
的
情况下
获得
每个字段
的
唯一值(不同
的
)列表并对结果进行分组?我对此特别感兴趣,因为我对实际读取<e
浏览 3
提问于2021-12-23
得票数 0
回答已采纳
3
回答
本地开发基于云
的
应用程序
lucene
、
couchdb
、
cloudant
但是,如何开发需要Cloudant
的
lucene
搜索
的
应用程序功能呢?有没有办法在本地模仿它?
浏览 6
提问于2014-11-10
得票数 2
回答已采纳
1
回答
如何在
Lucene
中
的
数百万条记录中实现正确
的
分页
java
、
pagination
、
lucene
我
的
Lucene
索引中有超过1000万个
文档
,我需要在我
的
应用程序中实现适当
的
分页。每个
文档
都是大学考生
的
唯一记录。目前,我每页显示5条记录,并在前端为用户提供分页。现在举个例子,我
的
搜索查询
的
总命中率是1000万,当我点击最后一页时,我基本上会转到页码2000000(200万)。在后端,我将pageNumber*5作为maxSearch(int)传递给
lucene
搜索函数。这需要花费大量
的
时间来获
浏览 5
提问于2017-03-10
得票数 0
3
回答
使用
Lucene
查询RDBMS数据库
database
、
lucene.net
、
lucene
我已经在
文档
中浏览了
Lucene
的
Java版本,但到目前为止我还没有真正看到顶层
的
“这就是它
的
工作方式”
的
信息(我知道我需要RTFM,我只是看不到树木
的
木头)。这很好,所以现在我
要
检查以下假设:I.e.如果我想通过sku、描述、类别名称等搜索Product,但我也想在搜索结果中显示它们所属
的
Custo
浏览 2
提问于2011-01-17
得票数 4
回答已采纳
1
回答
按集合字段分组solr搜索结果
的
解决方法
search
、
solr
、
lucene
我得到了3个或更多
的
不同类别,我只需要一个文件与最高
的
得分为每个类别。换句话说,我需要按类别字段对结果进行分组,每个组必须按照分数desc进行
排序
,而每个组必须限定为1。例如,对于got a,b,c类别结果,必须包含3个
文档
。with id == 5 for a categorydocument with id == 5 for c category
是否
可以使用单请求创建solr查询以
获得
这样
的</em
浏览 4
提问于2019-10-11
得票数 0
回答已采纳
2
回答
Lucene
.NET -包含“和”
的
搜索短语
lucene.net
寻找关于处理符号和
Lucene
查询中
的
单词" and“
的
建议。我
的
测试查询是(包括引号):理想情况下,我希望使用QueryParser在测试和
文档
阅读
过程中
,我发现使用StandardAnalyzer并不能满足我
的
需要。对于前两个查询,QueryParser.Parse将它
浏览 3
提问于2009-09-15
得票数 2
回答已采纳
1
回答
全文查询结果按分数排列不正确
c#
、
full-text-search
、
ravendb
、
lucene.net
我
有
一个RavenDB数据库,其中有几个
文档
,如下所示:{ public,
Lucene
.Net"); }假设我
有
三个
文档
,其中接下来,我
有
一个
要
查询
的
搜索词列表
浏览 3
提问于2013-10-08
得票数 2
回答已采纳
1
回答
在
lucene
中递归地确定相似度
java
、
lucene
、
similarity
、
recursive-query
、
tf-idf
我收藏了多种语言
的
书籍。我需要根据它们
的
相似性将每本书
的
各个部分相互链接起来。我需要链接书籍到类似的书,章节到类似的章节和子章到相似的子章。最好,相似性度量还会考虑下一个最高级别的相似性,所以当我想要
比较
两个章节时,它会首先检查这两个章节所属
的
书籍彼此
有
多相似,并将其作为基线。有没有办法告诉
lucene
,索引中
的
文档
遵循分层结构,其中书籍由章节组成,章节由子章组成(这是
要
存储
的
实际
文档</e
浏览 0
提问于2014-12-01
得票数 0
2
回答
写入
Lucene
.Net索引时内存使用量持续增长
optimization
、
nlp
、
lucene.net
、
information-retrieval
在谷歌搜索
Lucene
.Net用法之后,我打开了这个讨论,我没有发现任何真正有用
的
东西。问题很简单:我在构建和更新
Lucene
.Net索引时遇到了问题。为了使
lucene
.Net适用于我
的
数据,我从本教程开始:此外,我注意到,
要
处理10
浏览 0
提问于2012-08-24
得票数 3
回答已采纳
1
回答
:
比较
和对比
Lucene
和Search
java
、
google-app-engine
、
lucene
、
google-search-api
但是,由于Search不能进行部分或拼写错误
的
匹配(以及其他事情),因此我试图根据这里
的
响应建议切换到 (即
Lucene
)。有人能解决以下问题吗? 我该去哪里看我
的
L
浏览 1
提问于2015-03-27
得票数 1
7
回答
用于文本分析
的
算法或库,特别是:占主导地位
的
单词、跨文本
的
短语和文本集合
algorithm
、
text
、
nlp
、
analysis
、
lexical-analysis
我正在做一个项目,在这个项目中,我需要分析一页文本和一页文本
的
集合,以确定主导单词。我想知道
是否
有
库(最好是c#或java)可以帮我处理繁重
的
工作。如果没有,
是否
有
算法或倍数可以实现我下面的目标。我想做
的
是类似于从你在网络上找到
的
url或rss feed构建
的
word cloud,除了我不想要可视化。它们一直被用于分析总统候选人
的
演讲,以了解主题或使用最多
的
词是什么。复杂
的
是,我需
浏览 0
提问于2008-10-20
得票数 21
2
回答
满GC期间
的
线程转储
java
、
jvm
我想知道
是否
有
可能在
一个
完整
的
GC中
获得
一个线程转储。 将其与日志进行
比较
,缩小可能触发它
的
请求或操作。我只是想知道
是否
可以在完全GC期间
获得
一个线程转储。
浏览 2
提问于2016-07-04
得票数 0
回答已采纳
2
回答
搜索软件/服务器
的
替代方案,用于检索所有匹配
文档
的
ID
solr
、
elasticsearch
、
lucene
、
sphinx
我正在尝试弄清楚如何根据关键字匹配来过滤非常大
的
文档
集。 (term1 NEAR term2 NEAR term3) AND NOT "A phrase" AND @fieldXYZ "wildcards%aswell*" 结果不需要以任何方式进行评分、
排序
或排名。据我所
浏览 1
提问于2015-01-16
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Lucene构建个人搜索引擎解析
Lucene 中的 Stored Fields 存储优化
爱奇艺逗芽表情搜索分析与实践
深度解析 Lucene 轻量级全文索引实现原理
Lucene全文检索的基本原理
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券