首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >对于RediSearch,创建一个索引还是多个索引更好?

对于RediSearch,创建一个索引还是多个索引更好?
EN

Stack Overflow用户
提问于 2019-01-31 07:07:10
回答 1查看 1.3K关注 0票数 3

Am在多租户应用程序中使用RediSearch构建索引,该应用程序获得:

  • 15万租户
  • 每个租户平均有3,500名客户。
  • 每个客户都有10个字段将被添加到索引中。
  • 所有的字段都是TextFields

问题是,在这种情况下,最佳实践(性能、内存/存储、灵活性)是什么?

我应该创建一个带有customer_index字段的tenant_code,以帮助识别哪些数据属于哪个租户,还是应该创建特定于租户的索引?

根据我目前的经验和理解,特定于租户的索引意味着许多索引,但是它们中的数据更少,而且它也给了我为特定租户删除和重新创建索引的灵活性?

在Python中,代码如下所示:

单客户索引

代码语言:javascript
运行
复制
client = Client(`customer_index`)
client.create_index(
            [
                TextField('tenant_code'), TextField('last_name'), TextField('first_name'),
                TextField('other_name'), 
            ]
        )   

租户特定客户索引

代码语言:javascript
运行
复制
client = Client(`tenant_code_customer_index`)
client.create_index(
            [
                TextField('last_name'), TextField('first_name'), TextField('other_name'), 
            ]
        )
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-01-31 15:48:45

因为每个租户只有3500个客户(相对较少),所以最好使用更大的索引来节省内存。由于记录太少,每个索引的资源开销可能会超过索引本身的大小。这还将增加redis本身中的键数,因为为每个索引项创建一个新的Redis键。因此,如果在每个DB中有~2000个唯一的术语,您将得到300米的Redis键(2k *150 k)。相反,使用单一索引只剩下2k键。

就性能而言,也不应该有任何差别,因为租户代码本身就是一个倒排的索引,所以搜索不太可能需要在较大索引中筛选更多的记录。

为了删除,您可以简单地收集与标准匹配的ID列表,例如"FT.SEARCH idx @tenant:yourcode“,并对每个记录分别调用FT.DEL。我假设这不是每5秒执行一次的操作,所以你应该在那里。

请注意,现在使用150 k索引可能是不可能的,因为为每个索引创建了一个专用索引线程(尽管在未来的版本中可以使用在单个线程上执行索引的选项)。

票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54455099

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档