实验2 关系可视化

一. 实验目的

1. 了解关系可视化知识,了解和学习散点图、饼图、堆叠柱形图、板块层级图和直方图等常见图表类型;

2. 学习图形语法方式绘图;

3. 学习与巩固R+Illustrator可视化绘图模式。

二. 实验内容

1. 根据《鲜活的数据》第6章6.2.1介绍的方法与提供的数据,在R中绘制基本散点图,并存为PDF文件;

2. 将上一步所得的PDF文件,导入Illustrator,以教材图6-7为模板,完成图6-7,并添上自己的署名。

三. 实验步骤

1. 下载编程工具R, 推荐用RStudio免费版(free),下载地址:https://www.rstudio.com/products/rstudio/download/;

2. 数据下载地址:http://datasets.flowingdata.com/crimeRatesByState2005.csv。

3. 用R绘图,具体如下:

(1)安装ggplot2包:

启动RStudio后,菜单栏点击Tools>Install Packages…中输入ggplot2,安装;

(2)新建一个R Script文件;

(4)启用ggplot2包:

在新建的R Script文件中输入下面代码来启用ggplot2包: library(ggplot2) 将光标放在上面代码所在行,点击菜单Code->Run Select Lines运行本行代码;快捷键Ctrl+Enter;以下每行代码都需运行,不再重复。

(3)数据读取:

输入以下代码来读取CSV文件数据到crime变量中: crime<-read.csv(‘c:\Users\…\crimeRatesByState2005.csv’,sep=",", header=TRUE) 其中,请将“c:\Users\…\crimeRatesByState2005.csv”改为你自己的文件路径。

(4)数据整理:

通过以下两行代码来剔除掉华盛顿特区和全美平均值,并将剔除后的数据存入crime2变量中: crime2 <- crime[crime$state != “District of Columbia”,]

crime2 <- crime2[crime2$state != “United States”,]

(5)ggplot2绘图:通过以下代码来绘制:

(i)基本图形:

以数据集中的murder列为x坐标,burglary为y坐标绘制散点图如下: ggplot(crime2, aes(x = murder, y = burglary)) + geom_point()

(ii)增加坐标轴范围:

ggplot(crime2, aes(x = murder, y = burglary)) +geom_point()+ xlim(0, 10)+ ylim(0, 1200)

(iii)增加回归曲线:

ggplot(crime2, aes(x = murder, y = burglary)) + geom_point()+ xlim(0, 10)+ ylim(0, 1200)+ geom_smooth()

(6)保存绘图:

在R绘图窗口中点击Export->Save as PDF将绘图结果保存为pdf,注意保存选项的Orientation。

4. 用Illustrator来修饰完善:

将所保存的绘图结果Pdf文件导入到Illustrator中,进行修饰完善,具体过程不再赘述,请自行百度解决。

四. 实验结果

图6-7英文和中文版分别如下图所示,大家提交作品文字部分按中文版处理,图形效果参考英文版。

五. 实验报告

实验报告的实验题目、实验目的、实验内容请按照本博客所给内容填写,实验时间按上机时间填写。实验结果为上图,可以手绘,可以文字描述,也可以将图缩小打印贴上。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏梦里茶室

毫秒级检测!你见过带GPU的树莓派吗?

树莓派3B+英特尔神经计算棒进行高速目标检测 转载请注明作者梦里茶 ? 代码: 训练数据预处理: https://gist.github.com/ahan...

4.8K80
来自专栏量子位

TensorFlow 1.2正式发布,新增Python 3.6支持

王小新 编译整理 量子位 出品 | 公众号 QbitAI TensorFlow 1.2.0今日正式发布。 主要功能和改进点: 在Windows系统下新增对Pyt...

35740
来自专栏生信技能树

如何选择聚类模块数目

一般来说,类似K-means聚类算法需要我们提取指定聚类得到的cluster数目。 那么问题来了,如何为聚类选择一个适合的cluster数目呢 ? 很遗憾,上面...

1.4K100
来自专栏云计算教程系列

如何在Ubuntu 14.04第2部分上查询Prometheus

Prometheus是一个开源监控系统和时间序列数据库。在如何在Ubuntu 14.04第1部分中查询Prometheus,我们设置了三个演示服务实例,向Pro...

12300
来自专栏专知

Tensorflow Eager Execution入门指南

本文介绍了最新版的Tensorflow 1.7的功能及其使用方法,重点介绍其中最有趣的功能之一eager_execution,它许用户在不创建静态图的情况下运行...

580130
来自专栏逍遥剑客的游戏开发

Nebula3绘制基本图元

15060
来自专栏SIGAI学习与实践平台

编写基于TensorFlow的应用之构建数据pipeline

本文主要以MNIST数据集为例介绍TFRecords文件如何制作以及加载使用。所讲内容可以在SIGAI 在线编程功能中的sharedata/intro_to_t...

13620
来自专栏AI2ML人工智能to机器学习

TF Boy 之初筵 - 分布十三式

我们在 " 机器学习平台的优化器 (平台篇、优化篇)" 里面提到TensorFlow (TF) 速度的成为深度学习的武林第一大帮。 博士好友清华,在这方面也颇有...

8820
来自专栏磐创AI技术团队的专栏

Tensorboard 详解(上篇)

26030
来自专栏小巫技术博客

A008-drawable资源

关于drawable资源笔者之前有写过两篇文章: Android-自定义图像资源的使用(1) Android-自定义图像资源的使用(2) 这里笔者就不做过多的赘...

8920

扫码关注云+社区

领取腾讯云代金券