在Pandas中直接加载MongoDb数据进行数据分析

在使用Pandas进行数据处理的时候,我们通常从CSV或EXCEL中导入数据,但有的时候数据都存在数据库内,我们并没有现成的数据文件,这时候可以通过Pymongo这个库,从mongoDB中读取数据,然后载入到Pandas中,只需要简单的三步。

第一步,导入相关的模块:

import pymongo

import pandas as pd

第二步,设置MongoDB连接信息:

# 设置MongoDB连接信息

client = pymongo.MongoClient('localhost',27017)

cn_78 = client['cn_78']

project_info = cn_78['project_info']

第三步,加载数据到Pandas中:

data = pd.DataFrame(list(project_info.find()))

# 删除mongodb中的_id字段

del data['_id']

# 选择需要显示的字段

data = data[['aear','cate','subcate','name','maxmoney','minmoney','time']]

print(data)

这样就可以轻松地从MongoDB中读取数据到Pandas中进行数据分析了。

是不是很简单?

原文发布于微信公众号 - 州的先生(zmister2016)

原文发表时间:2016-12-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏眯眯眼猫头鹰的小树杈

vue-cli的项目结构

这篇文章对纯新手友好,所以有过任何vue开发经验的人可以出门左转啦!这篇文章献给我的homie苏蕾儿童鞋,让她在学习vue项目的时候少走一点弯路(径直冲向末路哈...

1314
来自专栏大魏分享(微信公众号:david-share)

PowerVM 环境下实施 PowerHA7.1 要点

前言 随着 PowerVM 使用的越来越多,在虚拟化环境下实施 PowerHA 的案例会越来越多。传统 PowerHA6.1 在物理分区下实施是比较经典的配置,...

3244
来自专栏小白课代表

Autodesk Revit 2018安装教程

Revit是Autodesk公司一套系列软件的名称。Revit系列软件是专为建筑信息模型(BIM)构建的,可帮助建筑设计师设计、建造和维护质量更好、能效更高的建...

862
来自专栏kevin-blog

学会如何让你在网络上变的相对匿名

因为最近在弄渗透测试,就担心那天被查水表了,就想起怎么让自己的变的相对匿名呢,这时我想到了tor,“Tor(The Onion Router)是第二代洋葱...

1531
来自专栏JackeyGao的博客

Django小技巧03: 优化数据库查询

本文介绍一个非常简单的技巧, 能够帮助你在使用 Django ORM 时优化数据库查询.

672
来自专栏FreeBuf

Aws_Public_Ips:获取AWS账户关联的所有IP地址(IPv4IPv6)的工具

Aws_Public_Ips是一个可帮助你获取与AWS账户关联的,所有IP地址(IPv4/IPv6) 的工具。它可以被作为库和CLI使用,并支持以下AWS服务(...

952
来自专栏李蔚蓬的专栏

VMware Workstation14.1.3 & Ubuntu18.04从安装到实用的填坑之路

本机VMware Workstation环境是上学期安装的,拿的老师给的安装包,版本10.0.1。顺便装了个Ubuntu15.10。

1011
来自专栏信安之路

RedTeam 技巧集合

1、利用目标用户使用的 user agent 来隐藏自身的恶意流量,比如像 Outlook 软件的 UA。

882
来自专栏小白课代表

Autodesk Revit 2019安装教程

Revit是Autodesk公司一套系列软件的名称。Revit系列软件是专为建筑信息模型(BIM)构建的,可帮助建筑设计师设计、建造和维护质量更好、能效更高的建...

1153
来自专栏FreeBuf

开源版ZoomEye:基于Python的网络侦查框架 – IVRE

IVRE(又名DRUNK)是一款网络侦查框架,包括两个基于p0f和Bro的被动侦查模块和一个基于Nmap&Zmap的主动侦查模块,其功能类似于国内知道创宇公司推...

2607

扫码关注云+社区