腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
4
回答
快速
内存
倒排
索引
indexing
、
lucene
、
lucene.net
、
information-retrieval
我正在寻找一个通用
倒排
索引
的
快速
内存
实现。我所需要的就是为几百万个实体存储具有权重的特征,并使用
倒排
索引
通过各种距离函数来计算实体之间的相似度。谢谢。
浏览 0
提问于2011-07-07
得票数 6
2
回答
弹性搜索如何保持
索引
elasticsearch
它是否使用
倒排
索引
,它是如何在
内存
中表示的?它是如何存储在磁盘上的?它是如何从磁盘加载到
内存
的?它如何如此
快速
地合并
索引
(我的意思是在搜索时,它如何如此
快速
地合并两个列表)?
浏览 4
提问于2014-02-26
得票数 3
回答已采纳
1
回答
实时搜
索引
擎的算法是什么?
c++
、
c
、
algorithm
、
full-text-search
、
inverted-index
倒排
索引
的设计目的是为了
快速
搜索,但不是那么容易更新。据我所知,增量
索引
用于更新
倒排
索引
数据。 那么实时搜索的算法或主要概念是什么,它们是如何做到的呢?
浏览 1
提问于2012-03-30
得票数 3
回答已采纳
7
回答
应用程序的
内存
搜索
索引
占用了太多的
内存
-有什么建议吗?
c#
、
optimization
、
search
、
memory
、
search-engine
在我们的桌面应用程序中,我们使用实现了一个简单的搜
索引
擎。 不幸的是,我们的一些用户的数据集可能会变得非常大,例如,在创建
倒排
索引
之前,需要占用大约1 1GB的
内存
。
倒排
索引
本身占用大量
内存
,几乎与
索引
的数据一样多(另有1 1GB的RAM)。显然,这会产生
内存
不足错误的问题,因为达到了32位Windows的限制,每个应用程序只能使用2 2GB的
内存
,或者使用规格较低的计算机的用户难以满足
内存
需求。我
浏览 2
提问于2008-10-21
得票数 6
回答已采纳
6
回答
存储
倒排
索引
python
、
information-retrieval
、
inverted-index
我已经使用Hadoop/Python创建了一个完整的
倒排
索引
。Hadoop将
索引
输出为(word,documentlist)对,并将其写入文件。为了
快速
访问,我使用上面的文件创建了一个字典(哈希表)。我的问题是,我如何在磁盘上存储这样的
索引
,同时又具有
快速
的访问时间。目前,我正在使用python pickle模块存储字典并从中加载,但它会立即将整个
索引
放入
内存
(或者是这样吗?)。请建议一种存储和搜索
索引
的有效方法。 我的字典
浏览 3
提问于2010-09-11
得票数 5
回答已采纳
1
回答
Lucene的
倒排
索引
是否存储在
内存
中?
solr
、
lucene
、
inverted-index
Lucene创建了一个
倒排
索引
。该
索引
存储在文件系统的多个文件中,如文档- 中所述 我很好奇在搜索时这是如何工作的。
倒排
索引
是否会被加载并保存在
内存
中,这样它就不需要访问文件系统。如果没有,有没有办法把它保存在
内存
中,这样我的搜索速度就会快很多。
浏览 3
提问于2014-11-05
得票数 0
1
回答
在分布式环境下建立
倒排
索引
elasticsearch
、
hbase
、
information-retrieval
如果必须从头开始构建分布式
倒排
索引
,您会使用哪些工具/库/平台?elasticseach (我需要带日期约束的部分TF )只做了我需要的部分,并考虑使用hbase构建
倒排
索引
,但想知道是否有更合理的选择(我不会全部放入
内存
,最初将研究缓存)。
浏览 0
提问于2014-01-29
得票数 0
3
回答
正向指数和倒指数为什么?
solr
、
elasticsearch
、
lucene
、
inverted-index
、
forward-indexing
我读到了
倒排
索引
(被Solr、弹性搜索等文本搜
索引
擎使用)和我所理解的(如果我们以"Person“为例):John -> PersonId(1), PersonId(2),为什么我们有前瞻性(或常规数据库
索引
)呢?或者换句话说,在什么情况下,常规
索引
是有用的?请解释一下。谢谢。
浏览 6
提问于2015-08-01
得票数 14
1
回答
数据库中存储整数和位集的数组
python
、
database
、
arrays
我正在构建一个小型图像搜
索引
擎,它使用的图像描述符既是二进制数又是整数值(numpy)数组,这两个都是“键”,这应该是
倒排
文件式方法的基础。该值只是图像名称/标识符的来源。我正在寻找一种具有python接口的数据库/缓存解决方案,它可以让我
快速
搜索这些键,而不用担心
内存
和磁盘管理。
浏览 1
提问于2011-08-28
得票数 0
1
回答
文档的Elasticsearch
索引
如何成为
倒排
索引
?
elasticsearch
我知道您可以创建一个
索引
,向其中添加文档,然后使用REST API列出所有这些文档。我知道什么是
倒排
索引
。但是如何将文档列表转换为
倒排
索引
呢?这两个都被称为“
索引
”,但是这是相同的
索引
,但是映射了吗?或者是一个完全不同的
索引
(所以创建
倒排
索引
需要两个
索引
)?如果是这样,我是否要用不同的名称单独创建它?
浏览 3
提问于2019-07-09
得票数 0
3
回答
默认情况下,在文本字段上禁用字段。设置fielddata=true
ruby-on-rails
、
elasticsearch
、
searchkick
在fielddata=true上设置foo_name,以便通过取消
倒排
索引
来加载
内存
中的现场数据。但请注意,这可以使用大量
内存
。在fielddata=true上设置foo_name,以便通过取消
倒排
索引
来加载
内存
中的现场数据。但请注意,这可以使用重要
内存
。在fielddata=true上设置foo_name,以便通过取消
倒排
索引
来加载
内存
中的现场数据。但请注意,这可以使用重要
内存
。
浏览 4
提问于2017-02-10
得票数 3
1
回答
B树指数还是
倒排
指数?
indexing
、
binary-tree
、
inverted-index
以下是我对两者的理解
倒排
索引
:-通常用于全文搜索。那么,b/w树指数和
倒排
指数有什么区别呢?在我看来,它们是一样的
浏览 0
提问于2017-11-28
得票数 6
1
回答
除了弹性搜索中的
倒排
索引
外,
内存
中装载了什么,这使得搜索速度如此之快?
elasticsearch
、
elastic-stack
、
elasticsearch-5
所有的jsons都在
内存
中,还是只有
倒排
的
索引
和映射将在
内存
中24*7?
浏览 1
提问于2018-12-05
得票数 0
2
回答
为什么Lucene在
倒排
索引
时使用数组而不是哈希表?
arrays
、
indexing
、
lucene
、
hashmap
、
hashtable
我当时正在看阿德里安·格兰德的,他指出的一点是,Lucene使用排序数组来表示字典中
倒排
索引
的一部分。使用排序数组而不是哈希表(“经典”
倒排
索引
数据结构)背后的理由是什么?哈希表提供O(1)插入和访问,在我看来,这对
快速
处理查询和合并
索引
段有很大帮助。我认为哈希表的唯一缺点是
内存
占用更大(这确实是一个问题)和较少的缓存友好性(尽管像查询排序数组这样的操作需要二进制搜索,这就像缓存不友好一样)。 那怎么回事?
浏览 3
提问于2017-07-21
得票数 6
回答已采纳
2
回答
lucene如何在
倒排
索引
中使用跳过列表?
lucene
、
inverted-index
、
skip-lists
在一些博客和lucene网站上,我知道lucene在
倒排
索引
中使用数据结构“跳过列表”。但我对此有些困惑。 1:一般情况下,跳表可以在
内存
中使用,但
倒排
索引
存储在磁盘中。那么lucene如何在
索引
上进行搜索时使用它呢?只是在磁盘上扫描还是加载到
内存
?
浏览 2
提问于2012-12-03
得票数 4
回答已采纳
1
回答
构建
倒排
索引
表的复杂性
string
、
performance
、
algorithm
、
optimization
、
inverted-index
,m)创建一个
倒排
索引
。我的
倒排
索引
还有一些特殊之处:A中的字母表是按顺序排列的,如果在
倒排
索引
中a_i包含了一个字符串(比如S_2),那么a_j (j=i+1,i+2,...简而言之,每个字符串在
倒排
列表中只出现一次。我的问题是如何以
快速
有效的方式建立这样的列表?任何时间复杂度都是有界的?那么我的
倒排
列表应该是:b: S2 (since S1 has appeared previously, so we
浏览 3
提问于2012-09-06
得票数 0
回答已采纳
2
回答
散列
索引
与
倒排
索引
full-text-search
、
relational-database
、
hashtable
、
inverted-index
据我所知,散列/
倒排
索引
将值/单词分别映射到记录/文档。然而,散列
索引
中的插入复杂度较低(因为它会在溢出的情况下添加一个新的存储桶),但
倒排
索引
中的插入复杂度更高(因为维护文档ID的排序列表)。
浏览 3
提问于2015-04-04
得票数 2
1
回答
在ElasticSearch中存储嵌套数据
elasticsearch
我有以下数据模型:标题子-包含更多主题如有任何建议,我们将不胜感激
浏览 3
提问于2015-08-05
得票数 0
1
回答
使用Lucene
索引
作为Hadoop的输入
lucene
、
hadoop
我正在考虑使用Map-Reduce,因为
内存
中的解决方案已经被证明是非常昂贵的。我认为可以工作的作业序列要求我从
倒排
索引
开始,然后有一个作为输入的映射作业,然后计算相似度。我并不特别想经历构建我自己的
倒排
索引
的痛苦-我想使用一个似乎很容易生成的Lucene
索引
。但是,我真的不清楚如何使用Lucene
索引
并生成Hadoop中的Map可以使用的对。
浏览 2
提问于2011-06-17
得票数 3
1
回答
图形表示-链表的链表
c
、
data-structures
、
graph
、
adjacency-list
我正在用C语言为一个简单的搜
索引
擎实现一个
倒排
索引
,并打算使用邻接表。但是,我发现使用邻接表的一个缺点是,如果您不知道
倒排
索引
中将有多少个单词,则必须假设
索引
中有任意数量的单词(数组元素)才能创建邻接表。这可能会导致使用过多的
内存
。我在想,这个问题的一个解决方案是创建一个链表的链表来表示我的
倒排
索引
。我还没有见过链表的链表图形表示的许多示例,所以我假设它不是常用的或常规的表示。我想知道使用链表的链表来表示图形是否合适?
浏览 14
提问于2018-07-26
得票数 4
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券