MongoDB ObjectId详解及使用ObjectId构成ObjectId获取时间根据时间构造ObjectIdQ&A

MongoDB中我们经常会接触到一个自动生成的字段:”_id”,类型为ObjectId。 本文详解ObjectId的构成和使用。

ObjectId构成

之前我们使用MySQL等关系型数据库时,主键都是设置成自增的。但在分布式环境下,这种方法就不可行了,会产生冲突。为此,MongoDB采用了一个称之为ObjectId的类型来做主键。ObjectId是一个12字节的 BSON 类型字符串。按照字节顺序,一次代表:

4字节:UNIX时间戳 3字节:表示运行MongoDB的机器 2字节:表示生成此_id的进程 3字节:由一个随机数开始的计数器生成的值

ObjectId获取时间

从ObjectId的构造上来看,内部就嵌入了时间类型。我们肯定可以从中获取时间信息:即插入此文档时的时间。MongoDB对ObjectId对象提供了getTimestamp()方法来获取ObjectId的时间。

> a = new ObjectId()ObjectId("53102b43bf1044ed8b0ba36b")> a.getTimestamp()ISODate("2014-02-28T06:22:59Z")

根据时间构造ObjectId

上例是直接使用MongoDB提供的新建方法来构造ObjectId的,我们自己可不可以通过字符串来构造呢?看下例:

// 使用Date的字符串构造方法生成日期,然后使用Date对象的getTime获取毫秒数,再除以1000得到标准时间戳

> a = new Date("2012-12-12 00:00:00").getTime()/1000

1355241600

// 获取时间戳的标准十六进制表示 
> a = a.toString(16) 

50c75880


// 在后面填补16个0 
> a = a + new Array(17).join("0") 50c758800000000000000000// 使用24个字符串构造ObjectId 

> b = new ObjectId(a) ObjectId("50c758800000000000000000")// 获取时间以验证 

> b.getTimestamp() ISODate("2012-12-11T16:00:00Z")

上述过程中 new Array(17).join(“0″)目的是生成16个0拼接的字符串。

这里使用了点小技巧。new Array(17)构造了一个17个元素的数组,但是数组里面没有元素,join(atr)方法的作用是连接数组元素并且以其参数分割。17个元素正好有16个间隔,所以最终拼接起来的字符串为16个。 根据ObjectId按照插入时间排序

MongoDB默认在ObjectId上建立索引,是按照插入时间排序的。我们可以使用此索引进行查询和排序。

// 按序插入三个文档

> db.col.insert({"num":1})
> db.col.insert({"num":2})
> db.col.insert({"num":3})

> db.col.find().pretty()
{ "_id" : ObjectId("53102fb4bf1044ed8b0ba36c"), "num" : 1 }
{ "_id" : ObjectId("53102fb9bf1044ed8b0ba36d"), "num" : 2 }
{ "_id" : ObjectId("53102fbabf1044ed8b0ba36e"), "num" : 3 }

Q&A

为什么选择ObjectId 而不是递增ID?参考segmentfault上面的问题:mongoDB修改”_id”的objectID到普通递增id为什么不好 如何取到ObjectId里面的时间?

shell下可直接oid.getTimestamp()。各种驱动也都有对应的方法。

如何使用日期范围来查询ObjectId?

既然ObjectId是可以排序的,它当然也可以比较大小。在有日期范围的情况下,实际上可以从_id中利用IXSCAN找到相应的记录,而不需要根据另外一个时间字段来查询。如果时间字段正好没有索引的话,_id的优势就体现出来了。stackoverflow上详细讲了该怎么做。

使用自己生成的UUID字符串和ObjectId比较哪个做_id更好?

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏用户画像

JAVA笔试题

4.public、private、protected、Friendly的区别与作用域,以及不写时的区别?

941
来自专栏点滴积累

shell脚本学习心得

近来主要捣鼓ubuntu,大多数项目中都用到了sh脚本作为启动脚本等,以前只是大概明白如何使用,今天需要自己修改并运行脚本就碰到了很多问题,所以决定静下心来学习...

2694
来自专栏TungHsu

这或许是对小白最友好的python入门了吧——17,while循环

for循环相比,你要你愿意,while循环可以不断运行。 先举一个比较简单的例子,数数: nums = 1while nums <= 10: print(nu...

3509
来自专栏IT派

菜鸟用Python操作MongoDB,看这一篇就够了

MongoDB是由C++语言编写的非关系型数据库,是一个基于分布式文件存储的开源数据库系统,其内容存储形式类似JSON对象,它的字段值可以包含其他文档、数组及文...

961
来自专栏java一日一条

50个常见的 Java 错误及避免方法(第二部分)

System.out.println("Whatdo you want to do?");

1143
来自专栏Java帮帮-微信公众号-技术文章全总结

Java基础19(02)总结IO流,异常try…catch,throws,File类

案例: a:考试成绩必须满足在0——100之间,不满足就抛出异常。 package cn.itcast_08(1); import java.util.Sca...

3945
来自专栏Java3y

Java锁机制了解一下

2596
来自专栏行者常至

015.多线程-并发队列

在并发队列上JDK提供了两套实现, 一个是以ConcurrentLinkedQueue为代表的高性能队列, 一个是以BlockingQueue接口为代表的阻...

792
来自专栏余林丰

Java线程安全性中的对象发布和逸出

发布(Publish)和逸出(Escape)这两个概念倒是第一次听说,不过它在实际当中却十分常见,这和Java并发编程的线程安全性就很大的关系。 什么是发布?简...

2349
来自专栏py+selenium

[笨方法学python]习题51自动化测试笔记

本节自动化测试部分看不大懂,自己每步都打印出来,帮助理解。(代码标红部分为自己加入调试为打印变量值所用)

2052

扫码关注云+社区

领取腾讯云代金券