我在mongodb中有一个很大的集合(大约270万个文档),并且有很多重复的文档。我尝试在集合上运行ensureIndex({id:1}, {unique:true, dropDups:true})。在决定使用too many dups on index build with dropDups=true之前,Mongo对它进行了一段时间的研究。
如何添加索引并去掉重复项?或者反过来,删除一些dup的最好方法是什么,以便mongo可以成功地构建索引?
对于奖励积分,为什么可以删除的dups数量有限制?
我有一个有700 K属性的大型数据库。但有些是重复的所以我现在想“清理”所有这些东西..。
我期待着将1+节点替换为1+其他节点,并链接该节点可能存在的所有关系。
所以我想做这样的事情:
MATCH (p:Property) WHERE p.uid IN ['A6271DFB-F0FD-0DF1-6F22-67F7D3164AE6']
WITH p AS sources
MATCH (p2:Property) WHERE p2.uid IN ['51A26A14-74FB-BCFC-FE5C-661A43A9377C','8DCD063C-965D-CC