MongoDB系列6:MongoDB索引的介绍

邓开表同学实战MongoDB系列文章,非常不错,赞!大力推荐!

本文是第6篇,主要讲述MongoDB索引的介绍的使用和配置的实战经验,非常值得一看。

1

1、前言

和关系型数据库一样,MongoDB的索引可以提高查询执行效率。索引就好比书中的目录,可以快速定位书中某一页。适当的索引查询,优化器可以快速地返回结果集。

2

2、MongoDB支持的索引类型

在MongoDB主要支持以下几种索引类型:

·单列索引

·复合索引

·多键索引

·全文索引

·地理空间索引

·哈希索引

2.1

2.1 单列索引

在MongoDB中,每个集合都会默认创建一个唯一索引列”_id”,”_id”列是最基本的单列索引。

创建单列索引可以使用以下语法:

这里的keyname表示键名;

-1表示索引值按降序排列;

1表示索引值按升序排列;

创建单列唯一索引使用以下语法:

MongoDB索引默认创建的是B树索引。

2.2

2.2 复合索引

MongoDB支持在多列上创建索引。

创建复合索引可以使用以下语法:

例如,集合test,记录如下:

在name和age列创建复合索引如下:

:复合索引不能包含哈希索引列。

2.3

2.3 多键索引

如果索引字段的值为数组,MongoDB会创建数组中的每个元素的索引键(即多键索引),不需要明确指定多键型。

和单列索引语法一样,多键索引创建语法如下:

:哈希索引不能是多键。

2.4

2.4 全文索引

MongoDB提供全文索引支持文本搜索查询字符串内容。全文索引可以是其值为字符串或字符串元素的数组的字段。目前,MongoDB集合最多只支持一个全文索引。

2.4.1全文索引版本历史

从MongoDB 3.2开始,MongoDB全文索引默认的版本为Version3.

从MongoDB 2.6开始使用Version 2的全文索引为默认版本,MongoDB2.6和3.0都使用Version 2.

MongoDB 2.4则只支持Version 1的全文索引。

当创建全文索引时,想覆盖默认版本,可以使用选项{ “2dsphereIndexVersion” : }

2.4.2全文索引创建与索引名称

创建全文索引语法如下:

也可以在多列上创建全文索引:

全文索引默认名称为“索引列名”加上“_text”,例如:

像上面创建的全文索引,默认的索引名称为content_text_name_text_sex_text

由于索引名称长度的限制,以及删除索引的方便,可以在创建索引给索引命令。

2.4.3全文索引的权重

:选择权重时需要注意防止索引重建。

例子,集合blog,文档如下:

现在,创建一个包含三个字段的全文索引,并将权重分配给两个字段:

{ content : “text”,keywords : “text”, about:”text” },

{ weights : , name: “TextIndex” }

)

则全文索引有以下字段和权重:

·content权重10

·keywords权重5

·about有默认权重1

2.4.4通配符全文索引

创建多个字段的全文索引时,还可以使用通配符($**)。通配符全文索引,索引每一个包含字符串数据集合中的每个文档。以下是创建一个全文索引使用通配符语法:

如果不确定哪些文本字段在查询条件中,此类索引是有用的。

2.4.5不区分大小写

Version 3的全文索引不区分大小写,而早期版本的全文索引只对[A-z]不区分大小写,对于所有其他字符,则视为不同。

2.4.6全文索引的限制

·一个集合最多支持一个全文索引;

·在一个包含$text的查询表达式中不能用hint()提示;

·排序操作不能从全文索引中获得排序顺序;

2.4.7存储需求和性能成本

·全文索引可以是大的。它们为每一个插入的文档在每个索引字段中包含一个唯一的索引词。

·构建全文索引与构建一个大型多键索引非常相似,而且相同数据下,比构建一个简单的有序索引要长。

·当在现有集合上构建一个大型全文索引时,确保打开的文件描述符有足够高的限制。

·全文索引会影响插入效率,因为MongoDB必须为每一个新的源文档的每一个唯一索引词添加索引。

2.5

2.5地理空间索引

随着移动设备的应用的爆发式增长,有一种查询变得越来越流行:找到离当前位置最近的N个场所。MongoDB为坐标平面查询提供了专门的索引,称作地理空间索引。地理空间索引分2dsphere索引和2d索引。

2.5.1 2dsphere索引

2dsphere索引支持GeoJSON地理空间格式或传统的坐标对格式数据存储。

2dsphere索引创建语法:

这里的field的值必须是GeoJSON对象或传统的坐标对。

例如:下面的places集合,其中loc键是GeoJSON格式数据。

现在loc列,创建一个2d球面索引。

查询离[-73.88,40.78]点(即飞机场)最近的10个文档:

db.runCommand( { geoNear : “places”, near : [-73.88,40.78],num : 10})

注意事项

·geoNear命令和$geoNear管道要求集合最多只有1个2dsphere索引或2d索引;而地理空间查询操作(例如,$near和$geoWithin)允许集合具有多个地理空间索引。

·2dsphere索引的字段必须是GeoJSON格式数据或传统坐标对格式数据。

·不能在分片的集合中使用片键做2dsphere索引,但是可以在一个分片集合中,使用非片键列创建2dsphere索引。

2.5.2 2d索引

1) 2d索引创建语法:

: } ,

{ })

其中,选项可以是下列可选的选项:

{ min : , max : , bits : }

2) 2d索引的位置范围:

默认情况下,2d索引假定经度和纬度,边界为-180到180,如果文档中的坐标数据在范围之外,MongoDB就会返回一个错误。

3)定义2d索引的位置精度:

默认情况下,传统坐标对上的2d索引使用26位精度,大致相当于2英尺或60厘米的精确度,默认范围-180到180。精度是衡量大小用来存储位置数据的Geohash值位。可以配置高达32位精度的地理空间索引。

索引精度不会影响查询精度。实际的网格坐标总是用于最终的查询处理。降低精度的好处使插入操作使用更少空间和处理开销较低。更高精度的一个好处是查询扫描索引的较小部分以返回结果。

配置非默认位置精度,在创建索引时可以使用位选项:

{ bits: } )

注意事项

·geoNear命令和$geoNear管道要求集合最多只有1个2dsphere索引或2d索引;而地理空间查询操作(例如,$near和$geoWithin)允许集合具有多个地理空间索引。

·如果位置数据是GeoJSON格式数据对象,应使用2dsphere索引,而不是2d索引。

·同样,能在分片的集合中使用片键做2d索引,但是可以在一个分片集合中,使用非片键列创建2d索引。

2.6

2.6哈希索引

1)哈希索引的创建语法:

哈希索引支持分片使用哈希片键。基于分片使用哈希索引的字段作为片键在分片集群分区数据。

在分片集合中,使用哈希索引作为片键结果得到更加随机分布的数据。

2)哈希函数

哈希索引使用哈希函数来计算的索引字段的值的哈希。哈希函数折叠嵌入式文档并计算整个值的哈希值,但不支持多键(即数组)索引。

注意事项

·MongoDB支持任何单一的列的哈希索引。但不支持多键(即数组)索引。

·不能在哈希索引列或指定哈希索引唯一约束字段上创建复合索引;但是,在同一个字段上,可以创建哈希索引和非哈希索引。MongoDB会使用标量索引范围查询。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180311G0AWE800?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券