专栏首页大数据和云计算技术MongoDB系列6:MongoDB索引的介绍

MongoDB系列6:MongoDB索引的介绍

1、前言

和关系型数据库一样,MongoDB的索引可以提高查询执行效率。索引就好比书中的目录,可以快速定位书中某一页。适当的索引查询,优化器可以快速地返回结果集。

2、MongoDB支持的索引类型

在MongoDB主要支持以下几种索引类型:

  • ·单列索引
  • ·复合索引
  • ·多键索引
  • ·全文索引
  • ·地理空间索引
  • ·哈希索引

2.1 单列索引

在MongoDB中,每个集合都会默认创建一个唯一索引列”_id”,”_id”列是最基本的单列索引。

创建单列索引可以使用以下语法:

db.collection.createIndex( { keyname : -1 } )

这里的keyname表示键名;

-1表示索引值按降序排列;

1表示索引值按升序排列;

创建单列唯一索引使用以下语法:

db.collection.createIndex( {keyname : -1},{“unique” : true})

MongoDB索引默认创建的是B树索引。

2.2 复合索引

MongoDB支持在多列上创建索引。

创建复合索引可以使用以下语法:

db.collection.createIndex( { <field1> :<type>,<field2> : <type> , ......} )

例如,集合test,记录如下:

在name和age列创建复合索引如下:

db.test.createIndex({ “name” : 1, ”age” : 1 })

:复合索引不能包含哈希索引列。

2.3 多键索引

如果索引字段的值为数组,MongoDB会创建数组中的每个元素的索引键(即多键索引),不需要明确指定多键型。

和单列索引语法一样,多键索引创建语法如下:

db.collection.createIndex({ <field> : <1 or -1> } )

:哈希索引不能是多键。

2.4 全文索引

MongoDB提供全文索引支持文本搜索查询字符串内容。全文索引可以是其值为字符串或字符串元素的数组的字段。目前,MongoDB集合最多只支持一个全文索引。

2.4.1 全文索引版本历史

从MongoDB 3.2开始,MongoDB全文索引默认的版本为Version3.

从MongoDB 2.6开始使用Version 2的全文索引为默认版本,MongoDB2.6和3.0都使用Version 2.

MongoDB 2.4则只支持Version 1的全文索引。

当创建全文索引时,想覆盖默认版本,可以使用选项{ “2dsphereIndexVersion” : <version> }

2.4.2 全文索引创建与索引名称

创建全文索引语法如下:

db.collection.createIndex( { <fields> : “text” } )

也可以在多列上创建全文索引:

db.collection.createIndex( { <fields1> : “text”,<fields2> : “text”,......} )

全文索引默认名称为“索引列名”加上“_text”,例如:

像上面创建的全文索引,默认的索引名称为content_text_name_text_sex_text

由于索引名称长度的限制,以及删除索引的方便,可以在创建索引给索引命令。

db.test.createIndex({bigdata:”text”,”name”:”text”,”sex”:”text”},{name:”NewTextIndex”})

2.4.3 全文索引的权重

对于全文索引,索引字段的权重表示相对于全文索引中的其他索引字段的重要性。索引列的默认权重为1。调整索引列的权重,可以使用包含weights选项的db.collection.createIndex()方法。

:选择权重时需要注意防止索引重建。

例子,集合blog,文档如下:

现在,创建一个包含三个字段的全文索引,并将权重分配给两个字段:

db.blog.createIndex(
{ content : “text”,keywords : “text”, about:”text” },
{ weights : {content : 10, keywords : 5 }, name: “TextIndex” }
)

则全文索引有以下字段和权重:

·content权重10

·keywords权重5

·about有默认权重1

2.4.4 通配符全文索引

创建多个字段的全文索引时,还可以使用通配符($**)。通配符全文索引,索引每一个包含字符串数据集合中的每个文档。以下是创建一个全文索引使用通配符语法:

db.collection.createIndex({ “$**”:”text” } )

如果不确定哪些文本字段在查询条件中,此类索引是有用的。

2.4.5 不区分大小写

Version 3的全文索引不区分大小写,而早期版本的全文索引只对[A-z]不区分大小写,对于所有其他字符,则视为不同。

2.4.6 全文索引的限制

·一个集合最多支持一个全文索引;

·在一个包含$text的查询表达式中不能用hint()提示;

·排序操作不能从全文索引中获得排序顺序;

2.4.7 存储需求和性能成本

·全文索引可以是大的。它们为每一个插入的文档在每个索引字段中包含一个唯一的索引词。

·构建全文索引与构建一个大型多键索引非常相似,而且相同数据下,比构建一个简单的有序索引要长。

·当在现有集合上构建一个大型全文索引时,确保打开的文件描述符有足够高的限制。

·全文索引会影响插入效率,因为MongoDB必须为每一个新的源文档的每一个唯一索引词添加索引。

2.5 地理空间索引

随着移动设备的应用的爆发式增长,有一种查询变得越来越流行:找到离当前位置最近的N个场所。MongoDB为坐标平面查询提供了专门的索引,称作地理空间索引。地理空间索引分2dsphere索引和2d索引。

2.5.1 2dsphere索引

2dsphere索引支持GeoJSON地理空间格式或传统的坐标对格式数据存储。

2dsphere索引创建语法:

db.collection.createIndex({<field> : “2dsphere”} )

这里的field的值必须是GeoJSON对象或传统的坐标对。

例如:下面的places集合,其中loc键是GeoJSON格式数据。

现在loc列,创建一个2d球面索引。

db.places.createIndex( { loc : “2dsphere” } )

查询离[-73.88,40.78]点(即飞机场)最近的10个文档:

db.runCommand( { geoNear : “places”, near : [-73.88,40.78],num : 10})

db.places.find( { “loc” : { $near : [-73.88,40.78]}}).limit(10)

注意事项

·geoNear命令和$geoNear管道要求集合最多只有1个2dsphere索引或2d索引;而地理空间查询操作(例如,$near和$geoWithin)允许集合具有多个地理空间索引。

·2dsphere索引的字段必须是GeoJSON格式数据或传统坐标对格式数据。

·不能在分片的集合中使用片键做2dsphere索引,但是可以在一个分片集合中,使用非片键列创建2dsphere索引。

2.5.2 2d索引

1) 2d索引创建语法:

db.collection.createIndex ( { <location field> : “2d” ,

<additionalfield> : <value> } ,

{<index-specification options> })

其中,<index-specificationoptions>选项可以是下列可选的选项:

{ min : <lower bound> , max : <upper bound>, bits :<bit precision> }

2) 2d索引的位置范围:

默认情况下,2d索引假定经度和纬度,边界为-180到180,如果文档中的坐标数据在范围之外,MongoDB就会返回一个错误。

3) 定义2d索引的位置精度:

默认情况下,传统坐标对上的2d索引使用26位精度,大致相当于2英尺或60厘米的精确度,默认范围-180到180。精度是衡量大小用来存储位置数据的Geohash值位。可以配置高达32位精度的地理空间索引。

索引精度不会影响查询精度。实际的网格坐标总是用于最终的查询处理。降低精度的好处使插入操作使用更少空间和处理开销较低。更高精度的一个好处是查询扫描索引的较小部分以返回结果。

配置非默认位置精度,在创建索引时可以使用位选项:

db.collection.createIndex( {<location field> : “<indextype>”},

{ bits: <bit precision> } )

注意事项

·geoNear命令和$geoNear管道要求集合最多只有1个2dsphere索引或2d索引;而地理空间查询操作(例如,$near和$geoWithin)允许集合具有多个地理空间索引。

·如果位置数据是GeoJSON格式数据对象,应使用2dsphere索引,而不是2d索引。

·同样,能在分片的集合中使用片键做2d索引,但是可以在一个分片集合中,使用非片键列创建2d索引。

2.6 哈希索引

1) 哈希索引的创建语法:

db.collection.createIndex({ _id : “hashed”} )

哈希索引支持分片使用哈希片键。基于分片使用哈希索引的字段作为片键在分片集群分区数据。

在分片集合中,使用哈希索引作为片键结果得到更加随机分布的数据。

2) 哈希函数

哈希索引使用哈希函数来计算的索引字段的值的哈希。哈希函数折叠嵌入式文档并计算整个值的哈希值,但不支持多键(即数组)索引。

注意事项

·MongoDB支持任何单一的列的哈希索引。但不支持多键(即数组)索引。

·不能在哈希索引列或指定哈希索引唯一约束字段上创建复合索引;但是,在同一个字段上,可以创建哈希索引和非哈希索引。MongoDB会使用标量索引范围查询。

本文分享自微信公众号 - 大数据和云计算技术(jiezhu2007)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 索引技术简介

    2.索引技术 索引是关系型数据库里的重要概念。总的来说,索引就是拿空间换时间。数据库技术和大数据技术会有一个融合的过程,除了前面讲到的B数索引、Hash索引等,...

    大数据和云计算技术
  • HBaseSQL及分析-Phoenix&Spark

    本文介绍了详细了HBaseSQL,Phoinix和Spark的架构,适用性以及优缺点,并在最后规划出未来将要设计的一款更符合用户需求的产品。

    大数据和云计算技术
  • 腾讯实时分析平台Hermes介绍

    腾讯大数据最近做了几件事,上线了一个官方网站http://data.qq.com/,将TDW(腾讯大数据库仓库)开源了,封闭的企鹅难得开放了一回。大数据网站上有...

    大数据和云计算技术
  • MySQL优化--概述以及索引优化分析

    win:C:\ProgramData\MySQL\MySQL Server 8.0\my.ini

    shimeath
  • 郑保卫 - 索引优化策略及实战

    本文中将要介绍的索引战略方案是以尽可能少的索引来满足尽可能多的数据读取类型的索引构建方法。这个策略方案要求在构建索引时,尽可能多地搜集当前正在使用的未来将要出...

    数据和云
  • SQL server 数据库的索引和视图

    L宝宝聊IT
  • Mysql常用的建立索引规则

    ​ 以上是一些普遍的建立索引时的判定依据。一言以蔽之,索引的建立必须慎重,对每个索引的必要性都应该经过仔细分析,要有建立的依据。因为太多的索引与不充分、不...

    剑行者
  • 小面试官教你 MySQL——引擎、索引和算法

    弄懂了 MySQL 的基本 CURD 操作之后,下一个必须掌握的知识就是 MySQL 的索引。

    amc
  • 面试官出的 MySQL 索引的问题,这篇文章全给你解决!

    这篇文章会讲解索引的基础知识,但主要是关于MySQL数据库的B+树索引的相关原理,里面的一些知识都参考了MySQL技术内幕这本书,也算对于这些知识的总结。对于B...

    好好学java
  • Mysql优化-索引

    单一索引是指索引列为一列的情况,即新建索引的语句只实施在一列上; 用户可以在多个列上建立索引,这种索引叫做复合索引(组合索引);

    剑行者

扫码关注云+社区

领取腾讯云代金券