MongoDB 索引

为啥需要索引?

增加索引是为了提高集合的查询效率。

当往一个集合中插入多个文档后,每个文档经过存储殷引擎后,有一个位置信息,通过这个位置信息。就能从存储引擎中读出该文档。在 mmapv1 引擎下,位置信息是【文件id+文件内 offset】 。在wiredtiger存储引擎里,位置信息是 wiredgiter 在存储文档时生成的一个 key ,通过这个key 能访问到对应的文档。

db.emp_res.find({})查询结果

查询结果

带条件查询

db.emp_res.find({"name":"yy3"})

如果想加速 db.emp_res.find({"name":"yy3"}) 的查询,可以考虑建立索引

MongoDB 索引类型

MongoDB 索引类型包括,单字段索引,复合索引,多Key索引,文本索引等。

单字段索引

db.emp_res.createIndex({name:1}) // 升序排列

复合索引

复合索引针对的是多个字段联合建立索引,先按照第一个字段排序,第一个字段相同的文档按照第二个字段排序,以此类推。

db.emp_res.createIndex({name:1,age:1}) // 升序排列

复合索引满足的场景比单字段索引更为丰富,比如db.emp_res.find({name:"yy3",age:1})也能够匹配复合索引前缀的查询,也就是说类型 db.emp_res.find({name:"yy3"}) 同样可以通过该索引来加速,但是 db.emp_red.find({age:1}) 就无法使用该复合索引。

多 key 索引

当索引的字段为数组时,创建爱你出的索引称为多 key 索引。

{"name" : "jack", "age" : 19, habbit: ["football, runnning"]}
db.person.createIndex( {habbit: 1} )  // 自动创建多key索引
db.person.find( {habbit: "football"} 

索引的额外属性

  • 唯一索引:保证索引对应的字段不会出现相同的值,_id索引就是唯一索引
  • TTL索引:可以针对某个时间段,指定文档的过期时间
  • 部分索引:只针对符合某个特定条件的文档建立索引。3.2版本后支持
  • 稀疏索引:只针对存在索引字段的文档建立索引,可看做是部分索引的一种特殊情况。

索引优化

MongoDb 支持对DB 的请求进行Profiling ,目前支持3种级别的 profiling

  • 0:不开启 profiling
  • 1:将处理时间超过某个阀值(默认100ms)的请求都记录到DB的system.profile集合
  • 2:将所有的请求都记录到 DB 的system.profile (生产环境慎用)

通常,生产环境建议 使用 1级别的 profiling ,根据自身需要配置合理的阀值,用于检查慢请求的情况,并及时组索引优化。

要根据实际情况不断的进行优化。索引并不是越多越好,集合的索引太多,会影响写入、更新的性能,每次写入都需要更新所有索引的数据;所以你system.profile里的慢请求可能是索引建立的不够导致,也可能是索引过多导致。

执行计划

索引快慢,可以根据索引的执行计划查看相关信息。

db.emp_res.find({"name":"yy5"}).explain()

没建立索引,执行的是 COLLSCAN, 全表扫描

db.emp_res.createIndex({name:1,age:1}) // 升序排列

建立索引后新进行【IXSCAN】)(从索引中查找),然后FETCH,读取出满足条件的文档。

https://docs.mongodb.com/manual/reference/explain-results/#queryplanner

db.emp_res.find({"name":"yy5"}).explain()

本文分享自微信公众号 - 程序员开发者社区(gh_016ffe40d550),作者:猿星人

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-08-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据库索引原理

    在下面这个表T中,如果我执行 select* from t where k between3and5,需要执行几次树的搜索操作,会扫描多少行?

    王小明_HIT
  • 怎么给字符串加索引

    如果 email 不建索引,那么就只能全表扫描,如果 email 这个字段是哪个没有索引,那么这个语句只能做全表扫描。

    王小明_HIT
  • 数据库索引有哪些?

    如果数据量比较少,是否使用索引对结果的影响并不大,比如数据不超过 1000 行,那么可以不建索引。

    王小明_HIT
  • 技术分享 | 常见索引问题处理

    数据库技术爱好者,爱可生 DBA 团队成员,负责 MySQL 日常问题处理以及数据库运维平台的问题排查,擅长 MySQL 主从复制及优化,喜欢钻研技术问题,还有...

    爱可生开源社区
  • Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引

      在前面的学习中, 我们知道 HBase 只能通过 rowkey 进行搜索, 一般把 rowkey 称作一级索引. 在很长的一段时间里 HBase 就只支持一...

    不温卜火
  • 聚集索引VS非聚集索引

    悟空聊架构
  • 聚集索引VS非聚集索引

    悟空聊架构
  • 玩转MongoDB: 索引,速度的引领

    数据库索引与书籍的索引类似,有了索引就不需要翻整本书,数据库可以直接在索引中查找,在索引中找到条目后,就可以直接跳到目标文档的位置,这可以让查找的速度提高几个数...

    MongoDB中文社区
  • 【Oracle】-【索引】先查数据再建索引,还是先建索引再插数据?

    1、新建一个表结构,创建索引,将百万或千万级的数据使用insert导入该表。 2、新建一个表结构,将百万或千万级的数据使用isnert导入该表,再创建索引。 ...

    bisal
  • 玩转MongoDB: 索引,速度的引领

    数据库索引与书籍的索引类似,有了索引就不需要翻整本书,数据库可以直接在索引中查找,在索引中找到条目后,就可以直接跳到目标文档的位置,这可以让查找的速度提高几个数...

    MongoDB中文社区

扫码关注云+社区

领取腾讯云代金券