MySQL作为z最为流行的关系型数据库管理平台之一,与绝大多数数据分析工具或者编程语言都有接口,今天这一篇分享如何将MySQL与R语言、Python进行连接。
R语言中与SQL管理平台通讯的接口包有很多,可以根据自己使用的数据库平台类型以及习惯,挑选合适的接口包。因为我个人笔记本使用的MySQL平台,所以本篇仅以MySQL为例分享。(如果你需要其他平台的接口导入方案,可以直接在csdn博客上搜关键字,有很多博客资料可以参考)。
我习惯使用的接口包是RMySQL,里面的核心函数主要涉及数据库连接,数据读写,数据查询三个方面,以下是三个方面的内容实例。
R与数据库的连接:
library(“RMySQL”)
library(“magrittr”)
数据库连接语句:
conn
MySQL(), #数据库平台类型
dbname=”db1”, #数据库名称
username=”root”, #登录账号(MySQL初始安装时设置的账号)
password=”**“, #登录密码(MySQL初始安装时设置的密码)
host=”127.0.0.1”, #地址
port=3306 #端口号
)
summary(conn) #查看连接信息:
User: root
Host: 127.0.0.1
Dbname: db1
Connection type: 127.0.0.1 via TCP/IP
dbGetInfo(conn) #查看连接详细信息(列表形式)
$host
‘127.0.0.1’
$user
‘root’
$dbname
‘db1’
$conType
‘127.0.0.1 via TCP/IP’
$serverVersion
‘5.7.17-log’
$protocolVersion
10
$threadId
11
$rsId
dbListTables(conn) #查看该数据库连接内的表信息
‘birthdays’ ‘company’ ‘dataanalyst’ ‘foodranking’ ‘foodtypes’ ‘orderinfo’ ‘str_date’ ‘userinfo’
dbDisconnect(conn) #关闭连接(数据通讯完成之后再运行)
以上读写都是一次性操作,不能在读写的同时执行条件筛选等步骤,通常我们需要使用查询方式来获取指定条件的数据并返回数据框。
这一句清除的是查询,即上一句中的dbSendQuery部分(布包含后面的dbFetch,我只是为了方便一次性输出了)。
Python:
Python与MySQL连接:
Python与MySQL数据读写操作:
Pandas库中有封装过的数据读写函数,可以直接针对连接后的数据进行数据读写,非常方便。
你可以通过以上MySQLlb接口建立的连接来执行查询操作!
总觉得MySQLlb的接口使用起来过于复杂,不直观,输出数据也不友好,还好pandas支持sqlalchemy的链接,使用pandas里面的函数可以基本满足写表、读表、执行查询的需要。
以上仅仅是MySQL与R语言、Python交互的基础函数,当然还有更为复杂的增删以及插入命令,如果需要了解详细内容可以参考RMySQL、sqlalchemy库的官方文档。
欢迎关注数据小魔方qq交流群
领取专属 10元无门槛券
私享最新 技术干货