前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MongoDB 在集群模式下Count也真实数据量不一致

MongoDB 在集群模式下Count也真实数据量不一致

作者头像
俺也想起舞
发布2020-11-24 11:22:50
1.3K0
发布2020-11-24 11:22:50
举报

1. 背景

在同步Clickhouse数据时,发现MongoDB数据量与Clickhouse数据量不一致,经同事提醒,可能是分片MongoDB集群Count不一致导致吗,于是Google查询相关资料

2.相关信息

通过查看官网发现中有解释这种现象的解释

官方文档解释了这种现象的原因以及解决方法: 不准确的原因

  • 操作的是分片的集合(前提)
  • shard 分片正在做块迁移,导致有重复数据出现
  • 存在孤立文档(因为不正常关机、块迁移失败等原因导致)

解决方法 使用聚合 aggregate 的方式查询 count 数量,shell 命令如下:

代码语言:javascript
复制
db.collection.aggregate(
   [
      { $group: { _id: null, count: { $sum: 1 } } }
   ]
)

java 代码 所以在 Java 中也可以采用聚合的方式获取 count 结果,使用聚合 aggregate 的方式可以准确的获取 sharding 后的集合的 count 结果。

代码语言:javascript
复制
DBObject groupFields = new BasicDBObject("\_id", null);
groupFields.put("count", new BasicDBObject("$sum", 1));
BasicDBObject group = new BasicDBObject("$group", groupFields);

List<BasicDBObject> aggreList = new ArrayList<BasicDBObject>();
aggreList.add(group);
AggregateIterable<Document> output = collection.aggregate(aggreList);

for (Document dbObject : output)
{
      System.out.println("Aggregates count = "+ dbObject);
}

参考

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 背景
  • 2.相关信息
  • 参考
相关产品与服务
云数据库 MongoDB
腾讯云数据库 MongoDB(TencentDB for MongoDB)是腾讯云基于全球广受欢迎的 MongoDB 打造的高性能 NoSQL 数据库,100%完全兼容 MongoDB 协议,支持跨文档事务,提供稳定丰富的监控管理,弹性可扩展、自动容灾,适用于文档型数据库场景,您无需自建灾备体系及控制管理系统。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档