磊哥评测之数据库:腾讯云MongoDB vs自建

上期文章我们聊到了redis。这期我们来说说另一个网红nosql数据库:MongoDB。有这么一个介绍MongoDB的说法是:MongoDB是非关系数据库当中功能最丰富,最像关系数据库的。这么说是因为作为一个面向文档存储型、数据结构非常松散自由的的数据库,却拥有着丰富的功能特性如强大灵活的查询语言、支持二级索引等特性,新版本的MongDB甚至还支持事务。听小伙伴说MongoDB不仅功能丰富,而且读性能强大到远远把MySQL甩在后面,今天我就代替大家来动手进行一下数据库测试,揭开MongoDB的神秘“面纱”。

为了进行数据库对比测试,这次我购买了腾讯云MongoDB的主从版(1主2从),同时在同样配置的云主机自建MongoDB作为对比。

下面给出CentOS7 64位上安装MongoDB 3.6的实践如下:

vim /etc/yum.repos.d/mongod-org.repo

编辑内容如下:

[mongodb-org]

name=MongoDB Repository

baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/3.6/x86_64/

gpgcheck=1

enabled=1

gpgkey=https://www.mongodb.org/static/pgp/server-3.6.asc

执行指令yum install mongodb-org -y安装

vim /etc/mongod.conf

此处根据自己需求修改bindIp: 0.0.0.0 #监听地址 port: 27017 #监听端口

systemctl start mongod.service #开启服务

netstat -anpt | grep 27017 #检查是否启动

服务开启后可以使用上面的指令测试服务是否启动,如果成功启动的话会看到结果如下图所示:

如果无法启动,需要根据日志分析具体原因。根据笔者的实践,大部分的原因会落在配置和权限上。如果排除错误太难,建议重新安装来的快一点。

接下来需要安装数据库测试工具,这次我们使用YCSB,雅虎开发的一个很强大的测试工具。

在安装YCSB前需要安装Java和Maven,测试前需要在workloads文件夹中创建配置文件,配置如下图所示:

考虑到购买的mongoDB是副本集配置,一个主节点带两个从节点,我们在本地也配置好副本集群,使用用 ./mongod --replSet amymongo --dbpath /data/27019 --port 27019 --logpath /var/log/mongodb/27019.log --fork 配置从节点,具体配置和初始化方法参考https://cloud.tencent.com/developer/article/1379231(当然部署在本机的方案不能保证高可用)

在workloads中防止配置文件,我们选择插入1千万条记录,执行1千万次操作,测试两种场景:read/update 9:1和纯insert场景。

废话少说,下面就一起来看看测试结果吧。

场景读更新read/update 9:1,单位ops/sec:

场景纯写入insert,单位ops/sec:

场景读更新read/update 9:1,单位us(延时):

场景纯写入insert,单位us(延时):

看来mongodb真的是一个高性能的数据库,为啥呢,因为mongo的延时单位居然是us微秒、微秒、微秒。。。16GB的内存基本上20线程之后延时就会大大增加,在100线程的时候基本上延时基本在1000us以上,而读多场景跟写入场景相比,写入场景的性能略差一点,随着线程数的增大,写入场景的吞吐量和延时表现和读更新场景的差距会扩大。

有读者可能会有疑惑,既然数据库测试是比较云和自建,看起来差距也没有那么大,用自建好像也可以接受啊。这里我要把测试中的发现讲给大家听,听完之后大家就明白了。

第一点,笔者买的是16G内存的机器(流下了没有钱的泪水),测试的时候发现cvm的内存占用基本到了百分之60左右,笔者在建立副本集和加大测试数据量(购买数据量的百分之80)之后发现,内存占用基本到了百分之80以上。看来mongo的第一个缺点,就是对内存的消耗真的非常可怕!!如果遇到高并发大数据量读写,恐怕分分钟就存在着存在着OOM的风险。

所以这里奉劝各位同学,如果要自建MongoDB,还是尽量购买超大内存满足业务需求,避免在业务高峰的时候被“干掉”。如果因为跟笔者一样贫穷不想买那么大的内存,可以考虑使用云数据库,云MongoDB具备动态伸缩能力,即使没有买够大的内存,也完全来得及在业务高峰扩容, 即使发生故障,也有完善的数据自动备份和无损恢复机制来恢复数据,在可用性上保障就高多了。

第二点,笔者在后续测试本地副本集的时候,尝试读secondary节点的数据,结果遇到了读延迟很高的情况。在网上研究了一下发现是因为,MongoDB 复制集里 Secondary 不断从主上批量拉取 oplog,然后在本地重放,以保证数据与 Primary 一致。这里为了防止脏读,会加一个锁阻塞所有的读请求。

所以如果遇到 Secondary 重放 oplog 占用锁时间长,读取的延时也会对应变长。这个锁最高能锁多久呢,看到有个案例锁了接近一个小时。。。看到的人内心一定是崩溃的,而在云Mongo测试的时候没有遇到这个情况,我想这一定是针对这个缺陷做了很大的改进,使用了其他方法实现同步。

总的来说,MongoDB确实可以不借助其他第三方工具实现高可用和分片功能,具备的高可用的故障切换,分片可以实现数据的分部均衡,大数据量的时候通过路由实现了服务器的负载均衡。所以MongoDB自身的可用性较高,也难怪会在短短时间内成为流行的nosql数据库。

但是MongoDB也存在着一些坑:如对内存的占用过高、对网络的占用过高、存在从节点锁导致读几乎不可用的情况,这些情况在实际业务使用的时候会导致很严重的问题,集群宕机、服务瘫痪、数据丢失无时不刻不是覆盖在运维同学心头的阴影。这个时候云MongoDB几乎就是救星,弹性伸缩、随时扩容、真正安全的数据热备以及强大的专业运维架构师团队,才能真的确保业务安全无故障的运行下去。

写到这里,笔者也在思考,云数据库到底是什么,它仅仅是把数据库封装一下,改改内核,提供给使用者吗?不,云数据库应当是一整套专业服务,除了数据库之外,还有监控、安全、迁移、灾备、运维等一系列的服务提供。能让业务开发专注于业务本身,把专业的交给专业的人去做。想要体会上云的好处,可以先从购买一个云数据库试用开始。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏好好学java的技术栈

一篇文章搞定,SpringBoot 创建定时任务

序言:创建定时任务非常简单,主要有两种创建方式: 一、基于注解(@Scheduled) 二、基于接口(SchedulingConfigurer). 前者相信大...

13420
来自专栏HUBU生信

数据库的一点理解

整个数据库系统包括数据,数据库,数据库管理系统。数据库管理系统是位于操作系统和应用程序开发工具之间的的一层,可以由数据库管理员来对数据库管理系统和数据库进行操作...

16740
来自专栏MongoDB中文社区

使用MongoDB图表可视化您的数据

将数据存储在数据库中是当今企业的基础。客户信息,订单历史记录,产品定价,物联网传感器数据等,都以备将来使用。但是,仅存储数据不足以形成市场竞争优势,我们也必须能...

32620
来自专栏java思维导图

分布式的系统核心是什么——日志

日志就是按照时间顺序追加的、完全有序的记录序列,其实就是一种特殊的文件格式,文件是一个字节数组,而这里日志是一个记录数据,只是相对于文件来说,这里每条记录都是按...

13120
来自专栏沃趣科技

2018中国存储与数据峰会 | 沃趣科技荣获企业私有云创新金奖

2018中国存储与数据峰会(DATA & STORAGE SUMMIT 2018),于12月11-12日在北京国际饭店成功举办,在本次峰会上,沃趣科技凭借自身在...

13910
来自专栏崔庆才的专栏

time date datetme timestamp 傻傻分不清楚

时间格式对于任何一个工程师来说都是绕不开的知识,爬虫工程师同样如此。爬虫工程师要将不同网站的相同类型内容存放在同一个数据表当中,常见的有:

36660
来自专栏MongoDB中文社区

MongoDB 收购mLab 巩固全球云数据库地位

MongoDB 公司日前宣布,公司已经就收购位于旧金山的云数据库服务商mLab达成最终协议。在满足惯例成交条件的情况下,此次收购预计将在截至2019年1月31日...

17020
来自专栏MongoDB中文社区

使用Power BI洞察MongoDB数据

我们很高兴地宣布 MongoDB BI ( 商业智能 ) 连接器的更新, 让MongoDB能与Microsoft 的Power BI Desktop一起使用。现...

69230
来自专栏HUBU生信

django2.0博客教程(创建 Django 博客的数据库模型)

博客最主要的功能就是展示我们写的文章,它需要从某个地方获取博客文章数据才能把文章展示出来,通常来说这个地方就是数据库。我们把写好的文章永久地保存在数据库里,当用...

20850
来自专栏HUBU生信

RNA二级结构预测

​ trna二级结构的预测可使用RNA Structure的预测服务器 http://rna.urmc.rochester.edu/RNAstructure...

18110

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励