前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【数据科学】R语言连接数据库

【数据科学】R语言连接数据库

作者头像
小莹莹
发布2018-04-23 16:15:58
1.5K0
发布2018-04-23 16:15:58
举报
文章被收录于专栏:PPV课数据科学社区

数据是关系数据库系统中存储的统一化格式。 因此,实施我们需要非常先进和复杂的SQL查询统计计算。但是R能够轻松地连接到诸如MySql, Oracle, Sql server等多种关系数据库并且可以从它们的记录转为R中的数据帧。一旦数据是在R环境中可用,就变成了正常R数据集,并可以被操纵或使用所有强大包和函数来进行分析。

在本教程中,我们将使用 MySQL 作为参考数据库,用于连接到 R 中。

RMySQL 软件包

R有一个名为“RMySQL”它提供了与 MySQL 数据库之间的本地连接的内置软件包。可以使用下面的命令来安装这个包到 R 的环境。

代码语言:javascript
复制
install.packages("RMySQL")

连接R到MySql

一旦软件包安装,我们创建 R 的连接对象连接到数据库。这需要用户名,密码,数据库名和主机名作为输入。

代码语言:javascript
复制
# Create a connection Object to MySQL database.
# We will connect to the sampel database named "sakila" that comes with MySql installation.
 mysqlconnection = dbConnect(MySQL(), user='root', password='', dbname='sakila', host='localhost')

# List the tables available in this database.
 dbListTables(mysqlconnection)

当我们上面的代码执行时,它产生以下结果:

代码语言:javascript
复制
 [1] "actor"                      "actor_info"                
 [3] "address"                    "category"                  
 [5] "city"                       "country"                   
 [7] "customer"                   "customer_list"             
 [9] "film"                       "film_actor"                
[11] "film_category"              "film_list"                 
[13] "film_text"                  "inventory"                 
[15] "language"                   "nicer_but_slower_film_list"
[17] "payment"                    "rental"                    
[19] "sales_by_film_category"     "sales_by_store"            
[21] "staff"                      "staff_list"                
[23] "store"

查询表

我们可以使用函数 dbSendQuery()查询在MySQL数据库表。查询获取执行在MySQL中并使用fetch()函数返回结果集。最后,它被存储为R的数据帧。

代码语言:javascript
复制
# Query the "actor" tables to get all the rows.
result = dbSendQuery(mysqlconnection, "select * from actor")

# Store the result in a R data frame object. n=5 is used to fetch first 5 rows.
data.frame = fetch(result, n=5)
print(data.fame)

当我们上面的代码执行时,它产生以下结果:

代码语言:javascript
复制
  actor_id first_name    last_name         last_update
1        1   PENELOPE      GUINESS 2006-02-15 04:34:33
2        2       NICK     WAHLBERG 2006-02-15 04:34:33
3        3         ED        CHASE 2006-02-15 04:34:33
4        4   JENNIFER        DAVIS 2006-02-15 04:34:33
5        5     JOHNNY LOLLOBRIGIDA 2006-02-15 04:34:33

查询与筛选子句

我们可以通过任何有效的 select 查询得到结果。

代码语言:javascript
复制
result = dbSendQuery(mysqlconnection, "select * from actor where last_name='TORN'")

# Fetch all the records(with n = -1) and store it as a data frame.
data.frame = fetch(result, n=-1)
print(data)

当我们上面的代码执行时,它产生以下结果:

代码语言:javascript
复制
  actor_id first_name last_name         last_update
1       18        DAN      TORN 2006-02-15 04:34:33
2       94    KENNETH      TORN 2006-02-15 04:34:33
3      102     WALTER      TORN 2006-02-15 04:34:33

更新表的行

我们可以通过传递更新查询到dbSendQuery()函数更新一个MySQL表中的行。

代码语言:javascript
复制
dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")

在执行上面的代码后,我们可以看到该表在MySQL环境中已经更新。

将数据插入到表

代码语言:javascript
复制
dbSendQuery(mysqlconnection,
"insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb)
values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)"
)

执行上面的代码后,我们可以看到插入到表在MySQL环境的记录行。

在MySQL中创建表

我们可以使用函数dbWriteTable()创建一个表在MySQL中。它覆盖表,如果它已经存在,并且需要一个数据帧输入。

代码语言:javascript
复制
# Create the connection object to the database where we want to create the table.
mysqlconnection = dbConnect(MySQL(), user='root', password='', dbname='sakila', host='localhost')

# Use the R data frame "mtcars" to create the table in MySql.
# All the rows of mtcars are taken inot MySql.
dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)

在执行上面的代码后,我们可以看到在MySQL环境中有创建后的表。

在MySQL删除表。

我们可以把 MySql 数据库这个表删除,通过 DROP TABLE 语句发送到 dbSendQuery(),与之前从表查询数据的方式相同。

代码语言:javascript
复制
dbSendQuery(mysqlconnection, 'drop table if exists mtcars')

在执行上面的代码后,我们可以看到该表在MySQL环境被丢弃。

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-11-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • RMySQL 软件包
  • 连接R到MySql
  • 查询表
    • 查询与筛选子句
    • 更新表的行
    • 将数据插入到表
    • 在MySQL中创建表
    • 在MySQL删除表。
    相关产品与服务
    对象存储
    对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档