MongoDB 稀疏(间隙)索引(Sparse Indexes)

稀疏索引(或者称间隙索引)就是只包含有索引字段的文档的条目,即使索引字段包含一个空值。也就是说间隙索引可以跳过那些索引键不存在的文档。因为他并非包含所有的文档,因此称为稀疏索引。与之相对的非稀疏索引或者说普通索引则包含所有的文档以及为那些不包含索引的字段存储null值。

一、间隙索引创建描述

    稀疏索引(或者称间隙索引)就是只包含有索引字段的文档的条目,跳过索引键不存在的文档
    本文中后面的描述使用间隙索引

    创建索引的语法:
    db.collection.createIndex(keys, options)

    创建间隙索引示例:
            db.addresses.createIndex( { "xmpp_id": 1 }, { sparse: true } )
            这个示例,哪些不包含xmpp_id的键(列)的文档将不会被索引

    间隙索引不会被使用到的情形
            如果一个间隙索引会导致查询或者排序操作得到一个不完整结果集的时候,MongoDB将不会使用这个索引,hint提示除外

    哪些索引缺省情况就是间隙索引              
            2dsphere (version 2), 2d, geoHaystack, 文本索引等总是稀疏索引

    间隙索引与唯一性
            一个既包含稀疏又包含唯一的索引避免集合上存在一些重复值得文档,但是允许多个文档忽略该键。

二、间隙索引示例

1、创建间隙索引

    > db.version()
    3.2.10

    > db.scores.insertMany([
    { "_id" : ObjectId("523b6e32fb408eea0eec2647"), "userid" : "newbie" },
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 },
    { "_id" : ObjectId("523b6e6ffb408eea0eec2649"), "userid" : "nina", "score" : 90 }])

    //下面为score键创建稀疏索引
    > db.scores.createIndex( { score: 1 } , { sparse: true } )

    > db.scores.find( { score: { $lt: 90 } } )
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 }
    //由于文档newbie并不包含score键,因此该文档不会出现在稀疏索引之中,也就不会被查询返回

    > //下面查询socre小于90文档的执行计划
    > db.scores.find( { score: { $lt: 90 } } ).explain()
    {
            "queryPlanner" : {
                    "plannerVersion" : 1,
                    "namespace" : "test.scores",  //Author : Leshami
                    "indexFilterSet" : false,     //Blog   : http://blog.csdn.net/leshami
                    "parsedQuery" : {
                            "score" : {
                                    "$lt" : 90
                            }
                    },
                    "winningPlan" : {
                            "stage" : "FETCH",
                            "inputStage" : {
                                    "stage" : "IXSCAN", //使用到了索引扫描
                                    "keyPattern" : {
                                            "score" : 1
                                    },
                                    "indexName" : "score_1",  //索引为score_1
                                    "isMultiKey" : false,
                                    "isUnique" : false,
                                    "isSparse" : true,        //此处表名为间隙索引
                                    "isPartial" : false,
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "score" : [
                                                    "[-inf.0, 90.0)"
                ...........
            "ok" : 1
    }

2、间隙索引无法使用的示例

    > db.scores.find().sort( { score: -1 } )
    { "_id" : ObjectId("523b6e6ffb408eea0eec2649"), "userid" : "nina", "score" : 90 }
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 }
    { "_id" : ObjectId("523b6e32fb408eea0eec2647"), "userid" : "newbie" }

    //从上面的查询结果可知,基于索引列score的排序返回了所有的文档
    //这个排序真实的执行计划则是全表扫描,因为索引键并不包含不存在的用户id为newbie的文档
    > db.scores.find().sort( { score: -1 } ).explain()
    {
            "queryPlanner" : {
                    "plannerVersion" : 1,
                    "namespace" : "test.scores",
                    "indexFilterSet" : false,
                    "parsedQuery" : {
                            "$and" : [ ]
                    },
                    "winningPlan" : {
                            "stage" : "SORT",
                            "sortPattern" : {
                                    "score" : -1
                            },
                            "inputStage" : {
                                    "stage" : "SORT_KEY_GENERATOR",
                                    "inputStage" : {
                                            "stage" : "COLLSCAN", //使用了集合扫描方式
                                            "filter" : {
                                                    "$and" : [ ]
                                            },
                                            "direction" : "forward"
                                    }
            ............
            "ok" : 1
    }

3、强制间隙索引的示例

    //如果我们强制增加一个hint提示,则用户id为newbie的文档未被返回,即走了索引(执行计划此处略)
    > db.scores.find().sort( { score: -1 } ).hint( { score: 1 } )
    { "_id" : ObjectId("523b6e6ffb408eea0eec2649"), "userid" : "nina", "score" : 90 }
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 }

4、间隙索引与唯一约束

    在唯一索引中,唯一索引会把null当做值,也就是说为null的通常只能有一个。后面的null将无法插入。
    //下面创建一个带有唯一约束的稀疏索引
    > db.scores.createIndex( { score: 1 } , { sparse: true, unique: true } )
    {
            "ok" : 0,
            "errmsg" : "Index with name: score_1 already exists with different options",
            "code" : 85
    }

    //由于score列上已经存在一个索引了,因此提示我们,需要先删除,再创建

    > db.scores.dropIndex("score_1")
    { "nIndexesWas" : 2, "ok" : 1 }                  

    > db.scores.createIndex( { score: 1 } , { sparse: true, unique: true } )
    {
            "createdCollectionAutomatically" : false,
            "numIndexesBefore" : 1,
            "numIndexesAfter" : 2,
            "ok" : 1
    }

    //下面尝试插入一些带有score键以及不带有score键的文档,如下,可以成功插入
    > db.scores.insert( { "userid": "AAAAAAA", "score": 43 } )
    WriteResult({ "nInserted" : 1 })
    > db.scores.insert( { "userid": "CCCCCCC" } )
    WriteResult({ "nInserted" : 1 })

    //下面插入一些score相关的文档,提示重复,如下示例
    > db.scores.insert( { "userid": "AAAAAAA", "score": 82 } )
    WriteResult({
            "nInserted" : 0,
            "writeError" : {
                    "code" : 11000,
                    "errmsg" : "E11000 duplicate key error collection: test.scores index: score_1 dup key: { : 82.0 }"
            }
    })
    > db.scores.insert( { "userid": "BBBBBBB", "score": 90 } )
    WriteResult({
            "nInserted" : 0,
            "writeError" : {
                    "code" : 11000,
                    "errmsg" : "E11000 duplicate key error collection: test.scores index: score_1 dup key: { : 90.0 }"
            }
    })

三、小结

a、间隙索引就是创建索引的索引列在某些文档上列不存在,导致索引存在间隙。 b、间隙索引在创建时应指定选项:{ sparse: true } c、间隙索引列上可以指定唯一性约束

四、更多参考

MongoDB 单键(列)索引

MongoDB 复合索引

MongoDB 多键索引

MongoDB执行计划获取(db.collection.explain())

MongoDB 唯一索引

MongoDB 部分索引

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Aloys的开发之路

oracle表空间表分区详解及oracle表分区查询使用方法(转+整理)

此文从以下几个方面来整理关于分区表的概念及操作: 1.表空间及分区表的概念 2.表分区的具体作用 3.表分区的优缺点 4.表分区的几种类型及操作方法 5...

58890
来自专栏张善友的专栏

使用信息架构视图访问数据库元数据

元数据简介 元数据 (metadata) 最常见的定义为"有关数据的结构数据",或者再简单一点就是"关于数据的信息",日常生活中的图例、图书馆目录卡和名片等都...

24760
来自专栏性能与架构

MySQL 8.0 新特性 :隐藏索引 Invisible Indexes

隐藏索引有什么作用 MySQL 8.0 支持了 Invisible Indexes 隐藏索引 这个特性,可以把某个索引设置为对优化器不可见,生成查询计划时便不使...

53590
来自专栏乐沙弥的世界

Oracle 索引监控(monitor index)

      合理的为数据库表上创建战略性索引,可以极大程度的提高了查询性能。但事实上日常中我们所创建的索引并非战略性索引,恰恰是大量冗余或是根本没有用到的索引耗...

11510
来自专栏idba

order by 结果不准确的问题

一 介绍 相信大部分DBA在和开发打交道的过程中,经常会遇到分页查询 order by 排序这样的需求。本文源于生产过程中的案例,5.6,5.7.16版本的...

9630
来自专栏个人随笔

MySQL 事物

事务是数据库处理操作,其中执行就好像它是一个单一的一组有序的工作单元。换言之,事务将永远不会是完全的,除非在组内每个单独的操作是成功的。如果事务中的任何操作失败...

36080
来自专栏Java帮帮-微信公众号-技术文章全总结

【数据库】MySQL进阶一、主外键讲解

MySQL进阶主外键讲解 1.什么是外键: 主键:是唯一标识一条记录,不能有重复的,不允许为空,用来保证数据完整性 外键:是另一表的主键, 外键可...

37870
来自专栏Java成神之路

Oracle学习笔记_04_多表查询

                                    (1)内连接           vs          外连接 (左、右、满)

9430
来自专栏java达人

join和where区别以及各类join的示例

1 WHERE子句中使用的连接语句,在数据库语言中,被称为隐性连接。INNER JOIN……ON子句产生的连接称为显性连接。(其他JOIN参数也是显性连接...

226100
来自专栏杨建荣的学习笔记

生产sql调优之统计信息分析(89天)

今天凌晨,又被电话叫醒了,说是有1个sql,现在跑的很慢。问题已经挺严重了,想让我看看,能不能做点什么。 首先就是和他们确认最近有什么改动,他们说这个是用了很...

28060

扫码关注云+社区

领取腾讯云代金券