数据高效分片 - 腾讯云开发者社区

要实现高效备份，建议的分片大小是多少？运营团队的一个家伙提到，他们有3个分片，350 to的数据，需要12.5个小时才能备份！如果允许的最大数据丢失时间为5分钟，是否可以在MongoDB中每5分钟执行一次事务备份？有什么工具可用于执行事务备份？

浏览 1提问于2014-09-04得票数 0

1回答

用$nin分片键实现mongodb分片

、、

我是分片的新手，我想问你是否可以用分片的关键字来分片一个集合，这将与$nin查询一起使用。.), lastName: "Chalaris", ....如果我的分片键是角色

浏览 15提问于2020-05-16得票数 0

1回答

我有一个相对较大的数据集，它是非常异构的。在模型的训练过程中，我已经使用了shuffle my dataset，如文档示例: (但无法将其全部混洗，因为它会占用太多内存)，我还将我的数据集分成多个小碎片，每个碎片大小相等。然而，我有理由认为这种“近似”的混洗是不够的，我还认为馈送已经混洗的数据将提高训练速度。所以现在我的问题是:在我将我的数据集分成Tfrecords分片后，是否有可能高效地编写随机获取2个分片的代码，加载它们，对它们进行混洗，然后重写2个分片</

浏览 2提问于2020-12-08得票数 1

2回答

django mysql数据库连接池

、、

我有多个mysql数据库(物理和逻辑)。使用支持多数据库的django 1.3。我想用django的mysql为多个mysql数据库设置数据库连接池，这样我就可以有高效的分片了。

浏览 1提问于2011-12-20得票数 2

回答已采纳

4回答

数据库分片策略

、、

对于一个正在建设中的在线市场产品，我有一个需要实现数据库分片解决方案的情况。我刚开始使用分片，在阅读了这个论坛上的帖子后，我觉得使用业务实体的基于目录的分片策略将是合适的。但我仍然不清楚这种分片解决方案所采用的反规范化和数据同步的最佳实践。将有3个核心实体，供应商，客户和订单。我计划基于供应商id对数据库进行分片，因为订单数据的大部分处理将由供应商管理员执行。这将确保供应商的订单是从单个数据库实例中获取的，从而消除了

浏览 22提问于2009-11-29得票数 5

回答已采纳

1回答

如何设计mongo db模型和不同集合的查询？

、、

我有三个集合，如何才能创建这样一个模型:如果我想找到一个用户的auto_mobile_reference_no，其调整id为："ABA123“，我该怎么做呢？ //Company collection "company_id" : "NUV123", "admin" : true, "claim_adjustor_id" : "ABA12

浏览 12提问于2019-03-13得票数 1

1回答

将大集合拆分成小集合？

、

现在我知道MongoDB在这方面没有问题，但是我真的不知道如何设计一个可以轻松处理非常大的数据集的模式。因此，我将给出这个问题的概要。我们面临的问题是索引变得相当大。目前，我们与大约8个小客户进行了测试设置，目前总数据集的大小约为

浏览 2提问于2012-08-31得票数 2

回答已采纳

2回答

MongoDB集群和100,000个上限集合

、

MongoDB集群如何跨节点分发封顶的集合以实现负载均衡？我计划使用一个基于MongoDB的内容管理系统的每个帖子的评论封顶集合。假设我们有100,000个帖子，因此有100,000个上限集合来存储每个帖子的评论。这些设置了上限的集合是否会均匀分布在群集之间，以实现读写可伸缩性？假设我们有5台机器。当我们创建新的集合时，我需要在不同的机器/节点上创建它们，并在添加新机器时重新分发它们。

浏览 2提问于2011-11-01得票数 1

回答已采纳

2回答

Java中的ConcurrentHashMap和哈希表

、、

对于线程化应用程序，哪个更高效？

浏览 0提问于2012-09-29得票数 85

回答已采纳

2回答

按日期分区？

我们正在尝试使用BigQuery来分析我们的软件应用程序生成的用户数据。有时我们可能会对整个数据集运行查询(现在大约需要2个月，而且还在不断增长)，但是典型的查询只会跨越一天、一周或一个月。我们发现，随着我们的表的增长，我们的单日查询变得越来越昂贵(正如我们所期望的那样，给定BigQuery架构) 什么是更有效地查询数据子集的最佳方法？我能想到的一种方法是按天(或周、月等)将数据“分区”到不

浏览 0提问于2012-09-15得票数 6

回答已采纳

1回答

MYSQL -基于组id或用户id进行分片

、

我没有面对这个问题，但我总是会想到..当然，这只是在复制数据之后，使用memcached和分区...order by date_added desc 在这种情况下，如果行有数十亿行，并且需要对哪个键进行分片，那么在不影响上述两个查询性能的情况下，使用哪个键呢？如果我的分片键是user_id，对于组，我必须访问多个数据库才能获得所需的结果(通过更改应用程序逻辑)。如果它是在group_id上为用户配置文件，我必须去多个数据库，以获得所需的结果。

浏览 1提问于2012-10-10得票数 0

回答已采纳

1回答

mongodb中的复制分片

、、、、

嘿，我有一个带有3个分片的mongodb设置，每个分片有3个在3个物理servers.The上运行的副本。分片是基于范围上的类别id的，所以数据在分片中是均匀的。我每周在数据库中获得的数据是巨大的，我只查询当前或前两天的大部分数据。因此，我尝试配置一个没有副本的分片到当前设置，以便新的分片将包含5天之前的旧数据，而当前设置中的3个分片的旧数据将仅包含最近5天的<e

浏览 0提问于2013-09-03得票数 0

3回答

MongoDB容量规划

、、

我有一个Oracle数据库，每天大约有700万条记录，我想切换到MongoDB。(~300)我希望有一个HA设置:) 提前感谢！

浏览 5提问于2012-07-17得票数 1

1回答

集成Neo4J和Terracotta？

、、、

有没有人尝试过甚至考虑过使用terracotta解决方案(即ehcache)来运行/存储Neo4J？有什么想法/建议吗？

浏览 0提问于2011-05-14得票数 4

2回答

不同索引上的ElasticSearch父/子

此外，我的理论是你不能这样做，因为这会导致人类总是在不同的分片上作为归属(不同的索引，不同的分片)。我们从文档中了解到，人类id用于将孩子(在索引时)路由到与人类相同的分片。这是为了提高效率(在内存连接、往返等方面)。但这不可能发生，因为我们讨论的是完全不同的分片。问题#1:有人知道_parent是否可以跨索引指定吗？

浏览 2提问于2013-08-14得票数 20

1回答

在64位mongodb中，当每个分片有不同的数据时，AutomaticFailover是如何工作的？

我正在处理自动分片，我曾经问过分片A中的数据是否会在分片B中可用，.They已经回答说分片A中的数据将不会在分片B中可用，.In这种情况下，自动故障转移是如何工作的？例如，我有3个分片，其中一个分片出现故障，那么我们可以从其他分片访问数据，对吧？如果每个分片中的数据是不同的，那么我们如何访问data?...Anyone可以解释this..Plz..

浏览 4提问于2011-02-02得票数 1

回答已采纳

1回答

MongoDB集群中的“分组”数据

、、、

例如，假设我有一个MongoDB数据库，该数据库存储了许多学校、一些教师和这些学校的学生。我没有把每所学校都放在数据库里，而是有一个学校、教师和学生的集合，显然，在学生和教师的文件中，我对学校藏书下的各自学校有一些参考。然而，是否有一种方法可以在逻辑上或物理上对数据进行分组，例如教师和学生的文档被分组在各自的学校文档中。，我认为与小型数据库相比，这种方式不会高效和快速。编辑： MongoDB文档声明，如果您使用的是MongoDB Atlas (我是这样的)，那么分片和其

浏览 0提问于2019-07-28得票数 0

2回答

爬虫存储系统所需的建议

、、、

所以我需要一个高效的分布式数据库来存储我抓取的数据。有没有人能给我推荐一个符合条件的db？

浏览 0提问于2011-03-20得票数 1

2回答

Redis数据库存储限制和HA

、

我想为我的应用程序使用redis服务器，它有一个大型数据库。所以我想知道redis服务器如何存储大数据？它与大型数据库兼容吗?我听说redis是内存中的数据库

浏览 2提问于2013-04-23得票数 1

3回答

在MySQL中查询分片数据

、、

我正在处理MySQL数据库中的大量数据，我想使用分片来向外扩展。我理解分片的原理，我甚至知道我想如何分片我的数据。当我查找数据库分片时，我找不到任何关于如何实际管理和查询分片数据库的全面示例。具体地说，假设我将数据拆分为多个表/数据库(分片)，那么查询该数据的最佳方式是什么？我不认为有一种方法可以让mysql智能地知道使用哪个

浏览 3提问于2011-06-05得票数 13

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用于高效备份的Mongo分片大小

用$nin分片键实现mongodb分片

如何在将TFrecords文件馈送到模型之前对其进行混洗

django mysql数据库连接池

数据库分片策略

如何设计mongo db模型和不同集合的查询？

将大集合拆分成小集合？

MongoDB集群和100,000个上限集合

Java中的ConcurrentHashMap和哈希表

按日期分区？

MYSQL -基于组id或用户id进行分片

mongodb中的复制分片

MongoDB容量规划

集成Neo4J和Terracotta？

不同索引上的ElasticSearch父/子

在64位mongodb中，当每个分片有不同的数据时，AutomaticFailover是如何工作的？

MongoDB集群中的“分组”数据

爬虫存储系统所需的建议

Redis数据库存储限制和HA

在MySQL中查询分片数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐