pymongo存储库-爬虫干货系列7

死亡并不可怕

真正可怕的是

被人遗忘

在爱的记忆消失前

请记住彼此!

今天探长和大家探讨python爬虫存储库-pymongo,探长将从什么是pymongo、pymongo的安装、pymongo的常用语法等方面进行分析。

Part 0 - 分析架构

Part 1 - 什么是pymongo

首先需要清楚什么是mongodb,mongodb是一个基于分布式文件存储的开源数据库系统,是介于关系型和非关系型数据库之间的一种,以类json的键值对的方式进行存储;

pymongo同样是python的一个第三方库,顾名思义pymongo是在python中操作mongodb数据库的程序,操作者可以在python中使用python语法+mongodb语法实现对mongodb数据库的操作,简化在python中操作mongodb的流程。

Part 2 - pymongo的安装

2.1 先决条件

在使用pymongo前,首先确保电脑中有mongodb数据库,如果没有请下载安装,下载地址见mongodb官网,百度搜索mongodb。

2.2 pymongo的安装

在windows环境下,使用pip方法进行安装,首先打开cmd命令窗口,然后在命令窗口中输入:

另外还可以使用easy_install方法进行安装,同样打开cmd命令窗口,然后输入:

Part 3 - pymongo常用语法

3.1 建立与mongodb数据库的连接

在操作mongodb数据库前,首先需要建立与mongodb数据库的连接,建立python与mongodb数据库的沟通对象

其中host参数为主机ip,默认host = 'localhost',port参数为mongodb的端口号,默认port = 27017

3.2 连接特定的数据库和表/集合

与mongodb建立连接后,还需要连接到特定的数据库和表/集合,进而进行后续的插入、查找等操作

连接到特定数据库

以上两种方法均可使client连接到数据库

连接到特定数据表/集合

以上两种方法同样可以连接到我们想要操作的数据表/集合

3.3 查找数据

查找单一数据-find_one()方法

如果没有任何参数,那么tb.find_one()返回的是数据库中的第一条数据结果

find_one()方法支持按照数据字段进行查找,并返回第一条符合条件的数据,例如:tb.find_one({'shop': '知味观官方旗舰店'})

查找多个数据-find()方法

注意tb.find()方法返回的是一个可迭代的cursor对象,因此需要通过for进行迭代输出;如果没有任何参数,那么tb.find()方法返回的是数据表中的所有数据

同样,tb.find()方法支持按照字段进行查找,并返回所有符合条件的数据

范围查找

常用的范围操作符有:$lt、$lte、$gt、$gte、$ne分别代表了小于、小于等于、大于、大于等于、不等于

{}中用逗号分隔表示了and操作,表示查找shop为知味观官方旗舰店,同时deal大于10000的数据

3.4 插入数据

插入单条数据-insert_one()方法

批量插入数据-insert_many()方法

3.5 其他操作语法

排序操作-sort()方法

式中'$or'代表的是or操作,表示或者的意思,sort中需要指定按照哪个字段进行排序

计数操作-count()方法

以上就是存储库pymongo的使用方法,探长希望能够帮助到你!如有任何问题,欢迎与探长联系(在探长交流-->学习交流中可以加探长微信),或者进行留言互动!

茫茫人海中 期待与你相遇 在你我最美丽的时刻

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180610G1A4VB00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券