我有两个urls,一个数据库MongoDB由一个收集URL的爬行器使用。这个数据库相当大,而且大多数都只包含urls。第二个db posts由扫描url并基于url生成报告的程序使用。
我当前用于第二个脚本的代码检查当前posts数据库中是否存在urls数据库中的url。如果posts数据库不包含url,这意味着程序仍然需要为url生成报告。如果它存在,我们就跳过它。
下面是数据库循环:
for document in urls.find():
url = document['url'].split('.')[1]
if posts.find(
我是mongoBD的新手。我使用$lookup连接了两个表。我有两种型号的Posts和Savedpost。我需要比较两个字段-- postId和savedBy --我查看mongoDb文档进行查找,然后尝试
Posts.aggregate([{
$lookup: {
from: Savedpost.collection.name, // collection name in db
localField: "_id", // Post id from Post collection
forei
我正在连接到远程MongoDB服务器,将所有项目导入本地数据库,然后清除它。
有没有一种更安全、更有效的方法来做到这一点?
mongoexport -h 1.2.3.4 -d foo -c bar | mongoimport -d foo -c bar
mongo 1.2.3.4/foo --eval "db.bar.remove()"
mongo 1.2.3.4/foo --eval "db.repairDatabase()" # To free up disk space
远程数据库比我要导入的数据库要小得多,所以复制似乎不是一个选项。