首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

经典数据集DS的穿越之旅

R软件里存在许多世界著名的数据集DS,但这些数据如果仅在R里面做分析首先需要分析人员具备精通编程技能,其次是输出结果只能保存成图片且不存在交互性,但是tableau软件可以使不懂R编程的用户对这些经典的数据轻松实现可视化展示并具备交互性,问题是如何通过技术手段将整个过程打通并组合成一个小型作业平台,下文将作出详细的操作流程,成功连接后数据将在两个强大的软件组合下自由穿梭并让分析者的潜能获得极大的发挥。

一、在MySQL里建立rdatasets数据库

直接在Navicat界面建立rdataset的新数据库,无需做任何建表设置,建立成功的界面如下所示:

二、在Windows系统里做ODBC连接配置

进入Windows控制面板,打开管理工具,点击ODBC,点选配置设置要连接的MySQL数据库,这之前有一步添加设置MySQL的环境此处不再赘述,配置完成的界面如下图所示:

三、在R软件里安装RODBC软件包

要使R具备连接数据库的功能必须得到RODBC包的支持,这个需要下载安装,命令:

install.packages("RODBC")

由于本软件已经完成RODBC的安装,只需调入即可,调入界面如下,同时对于初次使用的用户可以阅读RODBC的详细介绍和帮助文件

library(RODBC)

??ROBDC

四、R软件里连接MySQL

自定义临时变量名dbtest并使用odbcConnect函数进行连接,连接完成后用sqlTables函数做基本的连通测试,代码和界面如下:

> dbtest

> sqlTables(dbtest)

五、在R软件里查看数据集的介绍

首先利用data()命令能查看到R里所有的数据集,控制台面板会对数据集做初步的简单介绍,我们使用help(DB)命令能够对数据集内容进行深入的介绍阅读和字段介绍查看,这里以USarrest数据集为例介绍,

数据内容介绍:

Description

This data set contains statistics, in arrests per 100,000 residents for assault, murder, and rape in each of the 50 US states in 1973. Also given is the percent of the population living in urban areas.

这一统计数据集包含在1973年美国50个州的每10万名居民因袭击、谋杀和强奸而被逮捕。另外,同时提供与城市人口的百分比

数据查看,使用view(USarrest)

六、将USarrestDS写入MySQL

使用函数sqlSave将该数据集写入MySQL,dbtest是第四步已经建立好的数据库临时变量rownames参数是建立ID,addPK=TRUE

sqlSave(dbtest,USArrests,rownames = "id",addPK = TRUE) 回车开始执行

返回MySQL查看写入情况,数据已经被成功写入rdataset库下

七、连接MySQL和tableau desktop

启动tableau desktop,点击MySQL链接,输入基本的连接信息后连接成功,我们可以在下拉列表里看到刚刚建立的rdataset,点击他,再点击更新数据,数据已成功与tableaudesktop之间建立了联系

九、在tableau desktop里制作应用

我们能在极短的时间内输出部分结果,可视化图表显示暴力和谋杀犯罪成正相关,谋杀最高的城市是佐治亚洲Georgia,暴力犯罪最多的洲是北卡罗来纳North Carolina,而强奸犯罪率最高的城市是内华达洲Nevada,同时我们可以将应用发布到web,供任何地区连接互联网的用户进行访问。

到此整个平台的连接到数据可视化的实现就完成了,感兴趣的朋友快去试试吧。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180119G0TW8M00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券