Am在多租户应用程序中使用RediSearch构建索引,该应用程序获得:
TextFields。问题是,在这种情况下,最佳实践(性能、内存/存储、灵活性)是什么?
我应该创建一个带有customer_index字段的tenant_code,以帮助识别哪些数据属于哪个租户,还是应该创建特定于租户的索引?
根据我目前的经验和理解,特定于租户的索引意味着许多索引,但是它们中的数据更少,而且它也给了我为特定租户删除和重新创建索引的灵活性?
在Python中,代码如下所示:
单客户索引
client = Client(`customer_index`)
client.create_index(
[
TextField('tenant_code'), TextField('last_name'), TextField('first_name'),
TextField('other_name'),
]
) 租户特定客户索引
client = Client(`tenant_code_customer_index`)
client.create_index(
[
TextField('last_name'), TextField('first_name'), TextField('other_name'),
]
)发布于 2019-01-31 15:48:45
因为每个租户只有3500个客户(相对较少),所以最好使用更大的索引来节省内存。由于记录太少,每个索引的资源开销可能会超过索引本身的大小。这还将增加redis本身中的键数,因为为每个索引项创建一个新的Redis键。因此,如果在每个DB中有~2000个唯一的术语,您将得到300米的Redis键(2k *150 k)。相反,使用单一索引只剩下2k键。
就性能而言,也不应该有任何差别,因为租户代码本身就是一个倒排的索引,所以搜索不太可能需要在较大索引中筛选更多的记录。
为了删除,您可以简单地收集与标准匹配的ID列表,例如"FT.SEARCH idx @tenant:yourcode“,并对每个记录分别调用FT.DEL。我假设这不是每5秒执行一次的操作,所以你应该在那里。
请注意,现在使用150 k索引可能是不可能的,因为为每个索引创建了一个专用索引线程(尽管在未来的版本中可以使用在单个线程上执行索引的选项)。
https://stackoverflow.com/questions/54455099
复制相似问题