MongoDB计数唯一属性_Mongodb获取唯一值计数_Sqlite属性唯一计数 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Python | Python交互之mongoDB交互详解

本篇为mongodb篇，包含实例演示，mongodb高级查询，mongodb聚合管道，python交互等内容。

03

[MongoDB]MongoDB的ObjectId组成

一、ObjectId的组成首先通过终端命令行，向mongodb的collection中插入一条不带“_id”的记录。然后，通过查询刚插入的数据，发现自动生成了一个objectId “5e4fa350b636f733a15d6f62”这个24位的字符串，虽然看起来很长，也很难理解，但实际上它是由一组十六进制的字符构成，每个字节两位的十六进制数字，总共用了12字节的存储空间。相比MYSQL int类型的4个字节，MongoDB确实多出了很多字节。不过按照现在的存储设备，多出来的字节应该不会成为什么瓶颈。不过MongoDB的这种设计，体现着空间换时间的思想。 ObjectId的官方规范 1)Time 时间戳。将刚才生成的objectid的前4位进行提取“5e4fa350”，然后按照十六进制转为十进制，变为“1582277456”，这个数字就是一个时间戳。通过时间戳的转换，就成了易看清的时间格式2020-02-21 17:30:56， 2)Machine 机器。接下来的三个十六进制就是“b636f7”，这三个是所在主机的唯一标识符，一般是机器主机名的散列值，这样就确保了不同主机生成不同的机器hash值，确保在分布式中不造成冲突，这也就是在同一台机器生成的objectId中间的字符串都是一模一样的原因。 3)PID 进程ID。上面的Machine是为了确保在不同机器产生的objectId不冲突，而pid就是为了在同一台机器不同的mongodb进程产生了objectId不冲突，接下来的“af71”两位就是产生objectId的进程标识符。 4)INC 自增计数器。前面的九个字节是保证了一秒内不同机器不同进程生成objectId不冲突，这后面的三个字节“5d6f62”是一个自动增加的计数器，用来确保在同一秒内产生的objectId也不会发现冲突，允许256的3次方等于16777216条记录的唯一性。总的来看，objectId的前4个十六进制字符是时间戳，记录了文档创建的时间；接下来3个十六进制字符代表了所在主机的唯一标识符，确定了不同主机间产生不同的objectId；后2个是进程id，决定了在同一台机器下，不同mongodb进程产生不同的objectId；最后通过3个是自增计数器，确保同一秒内产生objectId的唯一性。ObjectId的这个主键生成策略，很好地解决了在分布式环境下高并发情况主键唯一性问题，值得学习借鉴

01

您找到你想要的搜索结果了吗？

是的

没有找到

你不得不知的几个互联网ID生成器方案

服务化、分布式已成为当下系统开发的首选，高并发操作在数据存储时，需要一套id生成器服务，来保证分布式情况下全局唯一性，以确保系统的订单创建、交易支付等场景下数据的唯一性，否则将造成不可估量的损失。

02

Mysql：小主键，大问题

本篇讲解 Mysql 的「主键」问题，从「为什么」的角度来了解 Mysql 主键相关的知识，并拓展到主键的生成方案问题。再也不怕被问到 Mysql 时只知道 CRUD 了。

01

最佳实践| 一文读懂《MongoDB 使用规范及最佳实践》原理

点击下方公众号关注并分享获取 MongoDB 最新资讯本文福利 · 分享有奖为了感谢本公众号读者的支持，将本文章转发到朋友圈集赞满10个，就可获得社区定制马克杯套盒1份！社区根据发送截图时间先后的前 10 名用户进行发放（每个 ID 仅参与一次哦~) 扫描文末二维码或添加小助手微信小芒果（ID：mongoingcom）凭截图领取~ 注：活动截至时间：9 月 9 日18：00 ---- 一、MongoDB 使用规范与限制 MongoDB 灵活文档的优势灵活库/集合命名及字段增减同一字段可存储不

05

从根上理解MongoDB的ObjectId生成原理！

我们都知道，在分布式系统中，分布式 ID 有很多特殊的要求，其中之二就是要求各个 ID 必须全局唯一，且 ID 能够趋势递增。那么 MongoDB 作为一个分布式 NoSQL 数据库，它的 ObjectID 是一段字符串，是 UUID 吗？不同机器生产的 ID 会相同吗？这段字符串排序没有纯数字主键好排吧？等等，带着这样的疑问，我们一起来看看 Mongo 的 ObjectID 到底有何神秘之处！

02

MongoDB 索引详解

索引能够提高数据库的查询效率，没有索引的话，查询会进行全表扫描（scan every document in a collection）,严重降低了查询效率。默认情况下，Mongo在一个集合（collection）创建时，自动地对集合的_id创建了唯一索引。

02

MongoDB运维与开发(二)

今天的内容接着昨天的来看，昨天我们说了MongoDB的部署、数据存储方式以及简单的用户创建，今天我们来看MongoDB的其他一些特点

02

深入浅出mongodb(一)

在大数据的驱使下，我们要实现数据持久化存储，数据共享，数据集中管理数据库是不二之选，小编在这里要阐述的是 mongodb 数据库，mongodb[1]是一个基于分布式文件存储的开源数据库系统，将数据存储为一个文档，数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档，数组及文档数组,操作起来比较简单和容易。

01

分布式系统中生成全局ID的总结与思考

世间万物，都有自己唯一的标识，比如人，每个人都有自己的指纹（白夜追凶给我科普的，同卵双胞胎DNA一样，但指纹不一样）。又如中国人，每个中国人有自己的身份证。对于计算机，很多时候，也需要为每一份数据生成唯一的标识。在这里，数据的概念是非常宽泛的，比如数据量记录、文件、消息，而唯一的标识我们称之为id。自增ID 使用过mysql的同学应该都知道，经常用自增id（auto increment）作为主键，这是一个为long的整数类型，每插入一条记录，该值就会增加1，这样每条记录都有了唯一的id。自增id应该是使

08

如何在分布式场景下生成全局唯一 ID ？

在分布式系统中，有一些场景需要使用全局唯一 ID ，可以和业务场景有关，比如支付流水号，也可以和业务场景无关，比如分库分表后需要有一个全局唯一 ID，或者用作事务版本号、分布式链路追踪等等，好的全局唯一 ID 需要具备这些特点：

03

MongoDB基础之BSON数据类型

MongoDB的文档类似于JSON，JSON是一种简单的额表示数据的方式，仅包含6种数据类型，分别是：null、布尔、数字、字符串、数组和对象。

03

使用 Spring Data Repositories（上）

原标题：Spring认证|使用 Spring Data Repositories（上）

01

MongoDB基础之BSON数据类型

MongoDB的文档类似于JSON，JSON是一种简单的表示数据的方式，仅包含6种数据类型，分别是：null、布尔、数字、字符串、数组和对象。

01

如何使用MongoDB+Springboot实现分布式ID?

一、背景如何实现分布式id，搜索相关的资料，一般会给出这几种方案：使用数据库自增Id 使用reids的incr命令使用UUID Twitter的snowflake算法利用zookeeper生成

05

MongoDB

MongoDB 是由 C++语言编写的，是一个基于分布式文件存储的开源数据库系统。在高负载的情况下，添加更多的节点，可以保证服务器性能。

02

Spring认证中国教育管理中心-Spring Data MongoDB教程七

原标题：Spring认证中国教育管理中心-Spring Data MongoDB教程七(内容来源：Spring中国教育管理中心）

03

Python3.7+Django2.0.4配合Mongodb打造高性能高扩展标签云存储方案

可以注意到，标签和文章的对应关系还是简单的一对多，如果做成比较灵活的多对多还需要增加一张关系表，这样就是四张表了。

02

爬虫（105）pymongo, 这一篇文章够了，值得收藏

学了那么多的爬虫库，怎么能没有数据库这个东东呢？在开发过程中，数据是必不可少的，数据库也是应运而生了，数据和数据库这两个兄弟是缺一不可的

02

印度担忧Aadhar计划 Mongo DB跟着引争议

1.受棱镜门影响，各界对Aadhar的质疑从是否将威胁人民隐私与安全，转而聚焦在 Aadhar 搜集、储存以及处理资料的方法，以及美国新创公司 MongoDB 在计划中扮演的角色。 2.MongoDB 为 NoSQL 数据库，该公司去年获独立非营利机构 In-Q-Tel 资助，而众人担忧的重点在于 In-Q-Tel 为美国 CIA 与其他情资单位支持的机构。 3.印度众家媒体皆引述政党与政治运动份子的观点，质疑由 Infosys 共同创办人 Nandan Nilekani 所领导的 Aadhar 如何

05

Spring认证中国教育管理中心-Spring Data MongoDB教程六

原标题：Spring认证中国教育管理中心-Spring Data MongoDB教程六(内容来源：Spring中国教育管理中心）

02

Spring认证中国教育管理中心-Spring Data Neo4j教程四

原标题：Spring认证中国教育管理中心-Spring Data Neo4j教程四（Spring中国教育管理中心）

02

python必掌握库：pymongo库的心你懂吗？

工欲善其事必先利其器，用pymongo库之前，大家需首先对MongoDB数据库的增删改查操作有一些基础方法的了解。

01

基于分布式系统的7种唯一ID实现方案，值得收藏

系统唯一ID是我们在设计一个系统的时候常常会遇见的问题，也常常为这个问题而纠结。生成ID的方法有很多，适应不同的场景、需求以及性能要求。所以有些比较复杂的系统会有多个ID生成的策略。

03

[置顶] SQL Server数据库高级进阶之分布式唯一ID生成实战演练

一、背景需求当我们需要在多个数据库间进行数据的复制自动增长型字段可能造成数据合并时的主键冲突。设想一个数据库中的Order表向另一个库中的Order表复制数据库时，OrderID到底该不该自动增长呢？数据库自增长ID和无序的UUID方案的不足之处： 1）、采用数据库自增序列：数据迁移合并等比较麻烦。 2)、UUID随机数：采用无意义字符串，没有排序UUID使用字符串形式存储，数据量大时查询效率比较低。（主要是索引查询销量不是最高的）如果非要使用非自主增长列作为主键的话(分布式系统分库分表中)

03

SQL Server数据库高级进阶之分布式唯一ID生成实战演练

一、背景需求当我们需要在多个数据库间进行数据的复制自动增长型字段可能造成数据合并时的主键冲突。设想一个数据库中的Order表向另一个库中的Order表复制数据库时，OrderID到底该不该自动增长呢？数据库自增长ID和无序的UUID方案的不足之处： 1）、采用数据库自增序列：数据迁移合并等比较麻烦。 2)、UUID随机数：采用无意义字符串，没有排序UUID使用字符串形式存储，数据量大时查询效率比较低。（主要是索引查询销量不是最高的）如果非要使用非自主增长列作为主键的话(分布式系统分库分表中)

02

Java面试通关要点汇总集核心篇

Java面试通关要点汇总集之核心篇参考答案核心篇数据存储 MySQL 索引使用的注意事项 1.索引不会包含有NULL的列只要列中包含有NULL值，都将不会被包含在索引中，复合索引中只要有一列含有NULL值，那么这一列对于此符合索引就是无效的。 2.使用短索引对串列进行索引，如果可以就应该指定一个前缀长度。例如，如果有一个char（255）的列，如果在前10个或20个字符内，多数值是唯一的，那么就不要对整个列进行索引。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。 3.索引列排序

04

Spring认证中国教育管理中心-Spring Data Couchbase教程四

原标题：Spring认证中国教育管理中心-Spring Data Couchbase教程四（Spring中国教育管理中心）

03

MongoDB-_id字段的含义介绍

MongoDB中的主键无需明确指定，每一条记录被添加到集合之后, MongoDB都会自动添加主键，MongoDB中文档主键的名称叫做 _id，是一个ObjectId类型的数据，格式如下：

02

mongodb_学习笔记

参考文章-https://www.cnblogs.com/melonjiang/p/6536876.html

02

程序员的50大MongoDB面试问题及答案

journaling会激活额外的内存映射文件。这将进一步抑制32位版本上的数据库大小。因此，现在journaling在32位系统上默认是禁用的。

02

分布式唯一ID极简教程

一，题记所有的业务系统，都有生成ID的需求，如订单id，商品id，文章ID等。这个ID会是数据库中的唯一主键，在它上面会建立聚集索引！ ID生成的核心需求有两点：全局唯一趋势有序二，为什么要全局唯一？著名的例子就是身份证号码，身份证号码确实是对人唯一的，然而一个人是可以办理多个身份证的，例如你身份证丢了，又重新补办了一张，号码不变。问题来了，因为系统是按照身份证号码做唯一主键的。此时，如果身份证是被盗的情况下，你是没有办法在系统里面注销的，因为新旧2个身份证的“主键”都是身份证号码。也就是说，

07

Spring Data JPA 参考文档一

原标题：Spring认证|Spring Data JPA 参考文档一(内容来源：Spring中国教育管理中心）

01

史上最详细的MongoDB操作命令大全

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。它支持的数据结构非常松散，是类似json的bson格式，因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。

04

MongoDB简析

Ⅰ、JSON就是一个字符串，通过Json可以标识不同语言的对象，并且该字符串可以转换为不同语言中的对象；

04

mongodb11天之屠龙宝刀（三）基本操作：增删改查与mysql对比

mongodb11天之屠龙宝刀（三）基本操作：增删改查与mysql对比基本概念_id和ObjectId： 1._id MongoDB 中存储的文档必有一”_id” 键。这个键的值可以是任何类型的，默认是个ObjectId 对象。在一个集合里面，每个文档都有唯一的”_id” 值，来确保集合里面每个文档都能被唯一标识。如果有两个集合的话，两个集合可以都有一个值为123 的”_id” 键，但是每个集合里面只能有一个”_id” 是123 的文档。 2. ObjectId ObjectId 是”

03

尚医通-MongoDB

NoSQL(NoSQL = Not Only SQL)，意即反SQL运动，指的是非关系型的数据库，是一项全新的数据库革命性运动，早期就有人提出，发展至2009年趋势越发高涨。NoSQL的拥护者们提倡运用非关系型的数据存储，相对于目前铺天盖地的关系型数据库运用，这一概念无疑是一种全新的思维的注入

03

Redis快速入门

Redis是一个开源，先进的key-value存储，并用于构建高性能，可扩展的Web应用程序的完美解决方案。 Redis从它的许多竞争继承来的三个主要特点： Redis数据库完全在内存中，使用磁盘仅用于持久性。相比许多键值数据存储，Redis拥有一套较为丰富的数据类型。 Redis可以将数据复制到任意数量的从服务器。 Redis 优势异常快速：Redis的速度非常快，每秒能执行约11万集合，每秒约81000+条记录。支持丰富的数据类型：Redis支持最大多数开发人员已经知道像

05

学习如何使用 Python 连接 MongoDB: PyMongo 安装和基础操作教程

Python 需要一个 MongoDB 驱动程序来访问 MongoDB 数据库。我将使用 MongoDB 驱动程序 PyMongo

01

mongodb必会知识点

8.2 架构在数据承载节点中，一个且只有一个成员被视为主节点，而其他节点则被视为辅助节点。节点接收所有写入操作，一个副本集只能有一个主实例能够写入，主节点记录所有变更到它的记录辅助节点复制主节点的 oplog 并将操作应用于数据集。仲裁员不维护数据集，仲裁器的目的是通过响应其他副本集成员的心跳和选择请求来维护副本集中的仲裁。因为它们不存储数据集，所以仲裁器是提供副本集仲裁功能的一种好方法。与具有数据集的完全功能副本集成员相比，仲裁器的资源成本更低，如果副本集的成员数为偶数，则添加一个仲裁器以在初选中获得多数票。当一个主服务器在超过配置的周期（默认为 10 秒）内未与该组的其他成员通信时，符合条件的辅助服务器将要求选择将其自身指定为新的主服务器。集群试图完成新的初选并恢复正常操作。 8.3 搭建步骤 (1) 准备三台虚拟机服务器，并各自安装好 mongoDB 注：为了保证复制集中三个服务器之间正常连接，请保证三个服务器的防火墙都已关闭！ 192.168.132:27017 192.168.133:27017 192.168.134:27017 (2) 修改 mongodb.conf 文件，添加 replSet 配置 ( 三台都需要修改成同一个名称 ) ，然后启动服务器 replSet=rep1 (3) 初始化复制集登录任意一台执行初始化操作说明 : _id 指复制集名称， members 指复制集服务器列表，数组中的 _id 是服务器唯一的 id,host 服务器主机 ip # 复制集名称 rs.initiate({_id:'rep1',members:[{_id:1,host:'192.168.197.132:27017'}, {_id:2,host:'192.168.197.133:27017'},{_id:3,host:'192.168.197.134:27017'}]}) (4) 查看集群状态 (5) 测试 # 添加数据 db.users.insert({"name":"lisi","age":11}) # 查询数据 db.users.find() # 切换到从数据库查询数据如果不允许查询，是因为默认情况下从数据库是不允许读写操作的，需要设置。 >rs.slaveOK() 执行该命令后可以查询数据 (6) 测试复制集主从节点故障转移功能 # 关闭主数据库 , 注意从数据库的变 >db.shutdownServer() (7) 主复制集添加仲裁者 (arbiter) 现在我们的环境是一主两从，仲裁者对偶数集群有效。需要停止一个从机，在主服务器中运行下面命令在一主一从关系中，任意节点宕机都无法选举出主节点，无法提供写操作，此时需要加入仲裁者节点即可。 rs.remove("ip: 端口号 ") // 删除从节点在一主一从关系中，任意节点宕机都无法选举出主节点，无法提供写操作，此时需要加入仲裁者节点即可。 rs.addArb("ip: 端口号 ")

01

分布式ID

系统唯一ID是我们在设计一个系统的时候常常会遇见的问题，也常常为这个问题而纠结。生成ID的方法有很多，适应不同的场景、需求以及性能要求。所以有些比较复杂的系统会有多个ID生成的策略。下面就介绍一些常见的ID生成策略。

05

数据库MongoDB-索引

索引通常能够极大的提高查询的效率，如果没有索引，MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。这种扫描全集合的查询效率是非常低的，特别在处理大量的数据时，查询可以要花费几十秒甚至几分钟，这对系统的性能是非常致命的。索引是特殊的数据结构，索引存储在一个易于遍历读取的数据集合中，索引是对数据库表中一列或多列的值进行排序的一种结构

04

mongodb11天之屠龙宝刀（三）基本操作：增删改查与mysql对比

mongodb11天之屠龙宝刀（三）基本操作：增删改查与mysql对比原文连接：直通车

03

Spark与mongodb整合完整版本

一，准备阶段 MongoDB Connector for spark是的spark操作mongodb数据很简单，这样方便使用spark去分析mongodb数据，sql分析，流式处理，机器学习，图计算。要求： 1),要有mongodb和spark的基础 2),mongodb要求是2.6以上 3),Spark 1.6.x 4),Scala 2.10.x 使用mongo-spark-connector_2.10 5),Scala 2.11.x 使用mongo-spark-connector_2.11 <depe

mongoDB

mongodb是时下流行的NoSql数据库，它的存储方式是文档式存储，并不是Key-Value形式。

03

用Python玩转统计数据：取样、计算相关性、拆分训练模型和测试

本文使用Python建立对数据的理解。我们会分析变量的分布，捋清特征之间的关系。最后，你会学习给样本分层，并将数据集拆分成测试集与训练集。

02

说起分布式自增ID只知道UUID？SnowFlake(雪花)算法了解一下(Python3.0实现)

客观地说，如果一定要用uuid生成订单号这类东西也能凑合用，但是它有着罄竹难书的“罪行”：肉眼可见，它是无序的；长度是64位数字字母随机组合的字符串，占用空间巨大；完全不具备业务属性，也就是说使用uuid你完全无法推算出它到底是干嘛的；因为无序，所以趋势递增就更不用指望了；所以用uuid生成订单号就是自杀行为，适合它的是类似生成token令牌的场景。

03

MongoDB的正确使用姿势

MongoDB是一个非常有前途的数据库，MongoDB官方对自己的定位是通用数据库，其实这个定位跟MySQL有些像。虽其流行度还远未达到MySQL的水平，但笔者有个可能不恰当的比较，MongoDB就像N年前的MySQL，随着时间的推移，会变得越来越强大，也会越来越流行。下面结合MongoDB的几大特色来谈谈MongoDB的适用场景。

02

Python爬虫之mongodb的索引操作

在进行数据去重的时候，可能用一个域来保证数据的唯一性，这个时候可以考虑建立复合索引来实现。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭