前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >4种方法解决MongoDB游标超时的问题

4种方法解决MongoDB游标超时的问题

作者头像
青南
发布于 2019-08-20 07:45:39
发布于 2019-08-20 07:45:39
4.1K00
代码可运行
举报
文章被收录于专栏:未闻Code未闻Code
运行总次数:0
代码可运行
摄影:产品经理

厨师:kingname

当我们使用PythonMongoDB里面读取数据时,可能会这样写代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pymongo

handler = pymongo.MongoClient().db.col

for row in handler.find():
    parse_data(row)

短短4行代码,读取MongoDB里面的每一行数据,然后传入 parse_data做处理。处理完成以后再读取下一行。逻辑清晰而简单,能有什么问题?只要parse_data(row)不报错,这一段代码就完美无缺。

但事实并非这样。

你的代码可能会在 forrowinhandler.find()这一行报错。它的原因,说来话长。

要解释这个问题,我们首先就需要知道, handler.find()返回的并不是数据库里面的数据,而是一个 游标(cursor)对象。如下图所示:

只有当你使用for循环开始迭代它的时候,游标才会真正去数据库里面读取数据。

但是,如果每一次循环都连接数据库,那么网络连接会浪费大量时间。

所以pymongo会一次性获取100行, forrowinhandler.find()循环第一次的时候,它会连上MongoDB,读取一百条数据,缓存到内存中。于是第2-100次循环,数据都是直接从内存里面获取,不会再连接数据库。

当循环进行到底101次的时候,再一次连接数据库,再读取第101-200行内容……

这个逻辑非常有效地降低了网络I/O耗时。

但是,MongoDB默认游标的超时时间是10分钟。10分钟之内,必需再次连接MongoDB读取内容刷新游标时间,否则,就会导致游标超时报错:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pymongo.errors.CursorNotFound: cursor id 211526444773 not found

如下图所示:

所以,回到最开始的代码中来,如果 parse_data每次执行的时间超过6秒钟,那么它执行100次的时间就会超过10分钟。此时,当程序想读取第101行数据的时候,程序就会报错。

为了解决这个问题,我们有4种办法:

  1. 修改MongoDB的配置,延长游标超时时间,并重启MongoDB。由于生产环境的MongoDB不能随便重启,所以这个方案虽然有用,但是排除。
  2. 一次性把数据全部读取下来,再做处理:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
all_data = [row for row in handler.find()]

for row in all_data:
    parse(row)

这种方案的弊端也很明显,如果数据量非常大,你不一定能全部放到内存里面。即使能够全部放到内存中,但是列表推导式遍历了所有数据,紧接着for循环又遍历一次,浪费时间。

  1. 让游标每次返回的数据小于100条,这样消费完这一批数据的时间就会小于10分钟:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 每次连接数据库,只返回50行数据
for row in handler.find().batch_size(50):
    parse_data(row)

但这种方案会增加数据库的连接次数,从而增加I/O耗时。

  1. 让游标永不超时。通过设定参数 no_cursor_timeout=True,让游标永不超时:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cursor = handler.find(no_cursor_timeout=True)
for row in cursor:
    parse_data(row)
cursor.close()  # 一定要手动关闭游标

然而这个操作非常危险,因为如果你的Python程序因为某种原因意外停止了,这个游标就再也无法关闭了!除非重启MongoDB,否则这些游标会一直留在MongoDB上,占用资源。

当然可能有人会说,使用 try...except把读取数据的地方包住,只要抛出了异常,在处理异常的时候关闭游标即可:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cursor = handler.find(no_cursor_timeout=True)
try:
    for row in cursor:
        parse_data(row)
except Exception:
    parse_exception()
finally:
    cursor.close()  # 一定要手动关闭游标

其中 finally里面的代码,无论有没有异常,都会执行。

但这样写会让代码非常难看。为了解决这个问题,我们可以使用游标的上下文管理器:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
with handler.find(no_cursor_timeout=True) as cursor:
    for row in cursor:
        parse_data(row)

只要程序退出了with的缩进,游标自动就会关闭。如果程序中途报错,游标也会关闭。

它的原理可以用下面两段代码来解释:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
class Test:
    def __init__(self):
        self.x = 1

    def echo(self):
        print(self.x)

    def __enter__(self):
        print('进入上下文')
        return self

    def __exit__(self, *args):
        print('退出上下文')

with Test() as t:
    t.echo()
print('退出缩进')

运行效果如下图所示:

接下来在 with的缩进里面人为制造异常:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
class Test:
    def __init__(self):
        self.x = 1

    def echo(self):
        print(self.x)

    def __enter__(self):
        print('进入上下文')
        return self

    def __exit__(self, *args):
        print('退出上下文')

with Test() as t:
    t.echo()
    1 + 'a'  # 这里一定会报错
print('退出缩进')

运行效果如下图所示:

无论在 with的缩进里面发生了什么, Test这个类中的 __exit__里面的代码始终都会运行。

我们来看看pymongo的游标对象里面, __exit__是怎么写的,如下图所示:

可以看到,这里正是关闭游标的操作。

因此,如果我们使用上下文管理器,就可以放心大胆地使用 no_cursor_timeout=True参数了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 未闻Code 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
原创 | codeforces 1451D,一道有趣的博弈论问题
今天选择的问题是Contest 1451场的D题,这是一道有趣简单的伪博弈论问题,全场通过的人有3203人。难度不太高,依旧以思维为主,坑不多,非常友好。
TechFlow-承志
2020/12/08
4270
原创 | codeforces 1451D,一道有趣的博弈论问题
CF1405D「Tree Tag」
Alice and Bob are playing a fun game of tree tag.
hotarugali
2022/03/03
6240
Codeforces Round #668 (Div. 2)A-D
给出一个长度为 n 的排列,排列 p 的定义是,对于任意一个 p[ i ] 来说,其取值范围为 [ 1 , n ] ,且任意两个元素互不相等题目规定函数
ACM算法日常
2020/09/11
5540
Codeforces Round #668 (Div. 2)A-D
博弈专题入门总结(Nim 巴什 SG等证明+例题)
一堆n个物品,两个人轮流从这堆物品中取物, 规定每次取[1,m]个,最后取光者得胜,问先手必胜还是后手必胜。
Here_SDUT
2022/06/29
2K0
博弈专题入门总结(Nim 巴什 SG等证明+例题)
运用「博弈论」分析「先手必胜态」序列具有何种性质,以及如何思考「博弈论」问题
Alice 和 Bob 轮流从黑板上擦掉一个数字,Alice 先手。如果擦除一个数字后,剩余的所有数字按位异或运算得出的结果等于 0 的话,当前玩家游戏失败。 (另外,如果只剩一个数字,按位异或运算得到它本身;如果无数字剩余,按位异或运算结果为 0。)
宫水三叶的刷题日记
2023/01/03
4710
编程之美----NIM游戏
: 博弈游戏·Nim游戏 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 今天我们要认识一对新朋友,Alice与Bob。 Alice与Bob总是在进行各种各样的比试,今天他们在玩一个取石子的游戏。 在这个游戏中,Alice和Bob放置了N堆不同的石子,编号1..N,第i堆中有A[i]个石子。 每一次行动,Alice和Bob可以选择从一堆石子中取出任意数量的石子。至少取1颗,至多取出这一堆剩下的所有石子。 Alice和Bob轮流行动,取走最后一个石子的人获得胜利。 假设每一轮游戏
Gxjun
2018/03/26
1.3K0
只用一行代码就能搞定,博弈论究竟是什么神仙算法?
博弈论是一门很庞大的学科,它算是数学的一个分支,也和运筹学甚至是经济学有关。虽然它严格说起来并不是算法领域的内容,但是有不少关于博弈论有趣的算法和问题。关于博弈的相关理论从很早就已经有了雏形,但是正式构建理论成为一门学科是从计算机之父冯诺依曼开始的。从这点上来说也和计算机有点关系。
TechFlow-承志
2020/06/18
8810
【算法】博弈论(C/C++)
在算法竞赛中,博弈论算法也比较容易出现,一般出了博弈论的题目多少是有点难度的。博弈论算法常用于解决涉及对抗、策略选择、最优决策等问题。这类问题通常涉及两名或多名玩家在某种规则下的竞争,一般每个玩家都绝对聪明试图通过选择最优策略获胜。常见的博弈论问题类型包括零和博弈、格局游戏(如Nim博弈)、棋类游戏以及其他涉及策略选择的问题。下面介绍常见的博弈论算法。
摆烂小白敲代码
2024/10/09
1060
【算法】博弈论(C/C++)
一行代码击败 100% 用户,leetcode 尼姆问题求解
记得还是初中时期,就和同学玩过这样一个游戏。和对手轮流从一堆棋子中取走一个或者多个,最后不能再取的就是输家。
程序员小浩
2020/11/11
8070
AI的博弈论,一份插图教程
我肯定你说对了。对于我们这些早期数学发烧友来说,电影《美丽心灵》(A Beautiful Mind)已经深深地印在了我们的记忆中。Russell Crowe在电影中扮演John Nash,一位诺贝尔经济学奖得主(上图左侧)。
磐创AI
2019/11/29
9120
动态规划入门——动态规划与数据结构的结合,在树上做DP
之前的几篇文章当中一直在聊背包问题,不知道大家有没有觉得有些腻味了。虽然经典的文章当中背包一共有九讲,但除了竞赛选手,我们能理解到单调优化就已经非常出色了。像是带有依赖的背包问题,和混合背包问题,有些剑走偏锋,所以这里不多做分享。如果大家感兴趣可以自行百度背包九讲查看,今天我们来看一个有趣的问题,通过这个有趣的问题,我们来了解一下在树形结构当中做动态规划的方法。
TechFlow-承志
2020/04/14
8240
动态规划入门——动态规划与数据结构的结合,在树上做DP
P1288 取数游戏II
题目描述 有一个取数的游戏。初始时,给出一个环,环上的每条边上都有一个非负整数。这些整数中至少有一个0。然后,将一枚硬币放在环上的一个节点上。两个玩家就是以这个放硬币的节点为起点开始这个游戏,两人轮流取数,取数的规则如下: (1)选择硬币左边或者右边的一条边,并且边上的数非0; (2)将这条边上的数减至任意一个非负整数(至少要有所减小); (3)将硬币移至边的另一端。 如果轮到一个玩家走,这时硬币左右两边的边上的数值都是0,那么这个玩家就输了。 如下图,描述的是Alice和Bob两人的对弈过程,其中黑色节点
attack
2018/04/12
6780
P1288 取数游戏II
漫画:脑筋急转弯题目(尼姆问题求解)
你和你的朋友,两个人一起玩 Nim 游戏:桌子上有一堆石头,每次你们轮流拿掉 1 - 3 块石头。拿掉最后一块石头的人就是获胜者。你作为先手。
程序员小浩
2020/03/30
3650
漫画:脑筋急转弯题目(尼姆问题求解)
博弈论进阶 | 三下五除二解决组合博弈问题的SG函数,究竟是何方神圣?
今天这篇是算法与数据结构专题的第27篇文章,我们继续深入博弈论问题。今天我们要介绍博弈论当中非常重要的一个定理和函数,通过它我们可以解决许多看起来杂乱无章的博弈问题,使得我们可以轻松地解决一大类博弈问题。
TechFlow-承志
2020/07/02
8950
数学知识——博弈论(巴什博奕、尼姆博奕、威佐夫博奕)思路及例题「建议收藏」
在不和小B商量的情况下,作为小A的你是选择招供坐牢5年或0年,还是会选择抵赖坐牢10年或1年呢?
全栈程序员站长
2022/11/04
7.3K0
数学知识——博弈论(巴什博奕、尼姆博奕、威佐夫博奕)思路及例题「建议收藏」
程序员进阶之算法练习(九十五)
题目链接 题目大意: 有n个整数的数组a,现在需要构造一个1到n的排列b; 令𝑐𝑖 = 𝑎𝑖−𝑏𝑖,希望最终𝑐𝑖 出现尽可能多的不同整数。
落影
2024/01/06
1240
程序员进阶之算法练习(九十五)
[LeetCode]动态规划求解博弈问题
博弈论是有趣又有用的知识,可以用来预测在特定的规则下,人们会做出怎样的行为,又会导致怎样的结果。利用博弈论来指导人们的行事法则甚至商业操作,比如著名的囚徒困境就被很好的利用在了商业竞争上。同样,LeetCode也利用博弈论出了几道有意思的题目。
用户6557940
2022/07/24
5920
[LeetCode]动态规划求解博弈问题
LeetCode笔记:Weekly Contest 210 比赛记录
这一次的比赛结果依然是中规中矩,做出来三题,第四题没能搞定,然后排名的话全国202名,全球609名,不算是太挫的成绩,但是也让人开心不起来。
codename_cys
2021/03/26
2980
公平组合游戏-巴什游戏、尼姆游戏和SG函数
公平组合游戏(Impartral Combinatorial Game)是满足以下特征的一类问题:
唔仄lo咚锵
2020/10/09
1.5K0
公平组合游戏-巴什游戏、尼姆游戏和SG函数
2017广东工业大学程序设计竞赛决赛 题解&源码(A,数学解方程,B,贪心博弈,C,递归,D,水,E,贪心,面试题,F,贪心,枚举,LCA,G,dp,记忆化搜索,H,思维题)
心得: 这比赛真的是不要不要的,pending了一下午,也不知道对错,直接做过去就是了,也没有管太多! Problem A: 两只老虎 Description 来,我们先来放松下,听听儿歌,一起“唱”。 两只老虎两只老虎,跑得快跑得快。 一只没有耳朵,一只没有尾巴。 真奇怪,真奇怪。 Tmk也觉得很奇怪,因为在他面前突然出现了一群这样的老虎,有的没耳朵,有的没尾巴,不过也有正常的。 现在Tmk告诉你这群老虎的耳朵个数,尾巴条数,以及老虎的腿的数目,问你有多少只是正常的。 其中只有三种老虎: 第一种(正常的)
Angel_Kitty
2018/04/08
8870
推荐阅读
相关推荐
原创 | codeforces 1451D,一道有趣的博弈论问题
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文