前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pymongo:Python下 MongoDB 的存储操作

pymongo:Python下 MongoDB 的存储操作

作者头像
luckzack
发布2023-09-29 09:53:19
2620
发布2023-09-29 09:53:19
举报
文章被收录于专栏:人人都是架构师

1.连接mongodb

代码语言:javascript
复制
#########  方法一  ##########
import pymongo
# MongoClient()返回一个mongodb的连接对象client
client = pymongo.MongoClient(host="localhost",port=27017)

#########  方法二  ##########
import pymongo
# MongoClient的第一个参数host还可以直接传MongoDB的连接字符串,以mongodb开头
client = pymongo.MongoClient(host="mongodb://127.0.0.1:27017/")

2.指定数据库

代码语言:javascript
复制
######  方法一  ######
# 指定test数据库
db = client.test

######  方法二  ######
# 指定test数据库(调用client的test属性即可返回test数据库)
db = client["test"]

3.指定集合

代码语言:javascript
复制
######  方法一  ######
# 指定student集合
collection = db.student

######  方法二  ######
# 指定student集合
collection = db["student"]

4.插入数据

  • db.collection.insert() 可以插入一条数据(dict),也可以插入多条数据(list),返回‘_id’或‘_id’的集合
代码语言:javascript
复制
###### 插入一条数据 ######
student = {
 'name': 'Jordan',
 'age': 18,
 'gender': 'man'
}

result = db.collection.insert(student)
# insert()返回执行后文档的主键'_id'的值
print(result)  # 5932a68615c2606814c91f3d

######  插入多条数据  ######
student1 = {
 'name': 'Jordan',
 'age': 10,
 'gender': 'man'
}

student2 = {
 'name': 'Mike',
 'age': 11,
 'gender': 'man'
}

result = collection.insert([student1,student2])
# insert()返回执行后文档的主键'_id'的集合
print(result)  #[ObjectId('5932a80115c2606a59e8a048'), ObjectId('5932a80115c2606a59e8a049')]

pymongo 3.x版本中,insert()方法官方已不推荐使用,推荐使用insert_one()insert_many()将插入单条和多条记录分开。

  • db.collection.insert_one() 用于插入单条记录,返回的是InsertOneResult对象
代码语言:javascript
复制
student = {
 'name': 'Jordan',
 'age': 18,
 'gender': 'man'
}

result = collection.insert_one(student)
# insert_one()返回的是InsertOneResult对象,我们可以调用其inserted_id属性获取_id。
print(result)  # <pymongo.results.InsertOneResult object at 0x10d68b558>
print(result.inserted_id) # 5932ab0f15c2606f0c1cf6c5
  • db.collection.insert_many() 用于插入多条记录,返回的是InsertManyResult对象
代码语言:javascript
复制
student1 = {
 'name': 'Jordan',
 'age': 10,
 'gender': 'man'
}

student2 = {
 'name': 'Mike',
 'age': 11,
 'gender': 'man'
}

result = collection.insert_many([student1, student2])
# insert_many()方法返回的类型是InsertManyResult,调用inserted_ids属性可以获取插入数据的_id列表
print(result)  # <pymongo.results.InsertManyResult object at 0x101dea558>
print(result.inserted_ids) # [ObjectId('5932abf415c2607083d3b2ac'), ObjectId('5932abf415c2607083d3b2ad')]

5.查询数据:find_one()、find()

  • db.collection.find_one() 查询返回单个结果(dict或者None)
代码语言:javascript
复制
result = db.collection.find_one({"name": "Mike"})
print(result) #{'_id': ObjectId('5932a80115c2606a59e8a049'),'name': 'Mike', 'age': 21, 'gende' :'man'}
  • db.collection.find() 查询返回多个结果(cursor类型,可迭代)。
代码语言:javascript
复制
results = collection.find({"age":18})
print(results) # <pymongo.cursor.Cursor object at 0x1032d5128>
for result in results:
      print(result)
#

如果要查询年龄大于 20 的数据,则写法如下:

代码语言:javascript
复制
results = collection.find({'age': {'$gt': 20}})

比较符号:

符  号

含  义

示  例

$lt

小于

{'age': {'$lt': 20}}

$gt

大于

{'age': {'$gt': 20}}

$lte

小于等于

{'age': {'$lte': 20}}

$gte

大于等于

{'age': {'$gte': 20}}

$ne

不等于

{'age': {'$ne': 20}}

$in

在范围内

{'age': {'$in': [20, 23]}}

$nin

不在范围内

{'age': {'$nin': [20, 23]}}

另外,还可以进行正则匹配查询。例如,查询名字以 M 开头的学生数据,示例如下:

代码语言:javascript
复制
results = collection.find({'name': {'$regex': '^M.*'}})

这里使用 $regex 来指定正则匹配,^M.* 代表以 M 开头的正则表达式。

这里将一些功能符号再归类为下表。

符  号

含  义

示  例

示例含义

$regex

匹配正则表达式

{'name': {'$regex': '^M.*'}}

name

以 M 开头

$exists

属性是否存在

{'name': {'$exists': True}}

name

属性存在

$type

类型判断

{'age': {'$type': 'int'}}

age

的类型为 int

$mod

数字模操作

{'age': {'$mod': [5, 0]}}

年龄模 5 余 0

$text

文本查询

{'$text': {'$search': 'Mike'}}

text

类型的属性中包含 Mike

字符串

$where

高级条件查询

{'$where': 'obj.fans_count == obj.follows_count'}

自身粉丝数等于关注数

关于这些操作的更详细用法,可以在 MongoDB 官方文档找到: https://docs.mongodb.com/manual/reference/operator/query/

  • 多条件查询 **and** **or**
代码语言:javascript
复制
# and查询
db.collection.find({
         $and :  [
                { "age" :  {$gt : 10 }} ,
                { "gender" :  "man" }
          ]
})

#or查询
db.collection.find({
          $or : [
                    {"age" :  {$gt : 10 }},
                    { "gender" :  "man"}
         ]
})

#and查询 和 or查询
db.inventory.find( {
    $and : [
        { $or : [ { price : 0.99 }, { price : 1.99 } ] },
        { $or : [ { sale : true }, { qty : { $lt : 20 } } ] }
    ]
} )
  • count() 计数,对查询结果进行个数统计
代码语言:javascript
复制
count = collection.find().count()
print(count)
  • 排序 **sort()** 调用sort方法,传入要排序的字段and升降序标志即可
代码语言:javascript
复制
#单列升序排列
results = db.collection.find().sort('name', pymongo.ASCENDING) # 升序(默认)
print([result['name'] for result in results])

# 单列降序排列
results = db.collection.find().sort("name",pymongo.DESCENDING)  #降序
print([result['name'] for result in results])

#多列排序
results = db.collection.find().sort([
  ("name", pymongo.ASCENDING),("age", pymongo.DESCENDING)
])
  • 偏移 **skip()**
代码语言:javascript
复制
results = collection.find().sort('name', pymongo.ASCENDING).skip(2)
print([result['name'] for result in results])

注意:在数据量非常庞大时(千万、亿级别),最好不要用skip()来查询数据,可能导致内存溢出。可以使用 find({'_id': {'$gt': ObjectId('593278c815c2602678bb2b8d')}}) 这样的方法来查询。

  • 限制 **limit()**
代码语言:javascript
复制
results = collection.find().sort('name', pymongo.ASCENDING).skip(2).limit(2)
print([result['name'] for result in results])

6.更新数据

  • db.collection.update() 修改单条或者多条文档,已不推荐此用法
代码语言:javascript
复制
result = collection.update(
            {"age": {"$lt" : 15}} ,
            {"$set" : {"gender" : "woman"}}
)

print(result)  # {'ok': 1, 'nModified': 1, 'n': 1, 'updatedExisting': True}
  • db.collection.update_one() 修改单条文档,返回结果是UpdateResult类型

针对UpdateResult类型数据,可以调用matched_count和modified_count属性分别获取匹配的条数和影响的条数

代码语言:javascript
复制
result = db.collection.update_one(
              {"name" : "Mike"} ,
              {
                "$inc" : {"age" : 5},
                "$set": {"gender": "male"}
              }
)

print(result)   # <pymongo.results.UpdateResult object at 0x10d17b678>

print(result.matched_count, result.modified_count)   # 1  1
  • db.collection.update_many() 修改多条文档,返回结果是UpdateResult类型
代码语言:javascript
复制
result = db.collection.update_many(
              {"name" : "Mike"} ,
              {"$inc" : {"age" : 5}}
)

print(result)   # <pymongo.results.UpdateResult object at 0x10c6384c8>

print(result.matched_count, result.modified_count)   # 3   3

7.删除数据

  • db.collection.remove() 删除指定条件的所有数据
代码语言:javascript
复制
result = db.collection.remove({"age" : {"$gte" : 10}})

print(result)  # {'ok': 3, 'n': 3}
  • db.collection.delete_one() 删除第一条符合条件的数据,返回DeleteResult类型数据
代码语言:javascript
复制
result = collection.delete_one({'name': 'Kevin'})
print(result) # <pymongo.results.DeleteResult object at 0x10e6ba4c8>
print(result.deleted_count)  # 1
  • db.collection.delete_many() 删除所有符合条件的数据,返回DeleteResult类型数据
代码语言:javascript
复制
result = collection.delete_many({'name': 'Kevin'})
print(result) # <pymongo.results.DeleteResult object at 0x55e6be5f1>
print(result.deleted_count)  # 4

其他

另外,pymongo还提供了更多方法,如find_one_and_delete() find_one_and_replace() find_one_and_update()。 当然,还有操作索引的方法:create_index() create_indexes() drop_index()等。

代码语言:javascript
复制
import pymongo

client = pymongo.MongoClient(host="127.0.0.1", port="27017")

db = client["test"]
coll = db["myindex"]

# 在后台创建唯一索引
coll.create_index([(x,1)], unique = True, background = True,name = "x_1")

# 查看集合coll的所有索引信息
result = coll.index_information()
print(result)

# 在后台创建复合索引
db.myindex.create_index([("x", 1), ("y", 1)])

# 删除索引
coll.drop_index([("x", 1)])
# coll.drop_index("x_1")

详细用法可以参见官方文档:http://api.mongodb.com/python/current/api/pymongo/collection.html

另外还有对数据库、集合本身以及其他的一些操作,在这不再一一讲解,可以参见官方文档:http://api.mongodb.com/python/current/api/pymongo/

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.连接mongodb
  • 2.指定数据库
  • 3.指定集合
  • 4.插入数据
  • 5.查询数据:find_one()、find()
  • 6.更新数据
  • 7.删除数据
  • 其他
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档