首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Google Earth Engine——在 R 中计算和绘制二维空间点密度

快速计算点密度度量并将其显示在地图上通常很有用。在本教程中,我们将使用 ggmap R 包中包含德克萨斯州休斯顿犯罪数据来演示这一点。 我们将从加载库开始。...请注意,由于 Google 提供地图方式发生了变化,本课程中不再使用 ggmap 包来生成底图,但本教程中使用数据包含ggmap 包中。...library(ggplot2) library(ggmap) 然后,我们可以加载德克萨斯州休斯顿内置犯罪数据集。...data(crime) # 删除任何有缺失数据 crime <- crime[complete.cases(crime), ] # 看一下犯罪数据结构 str(crime) ## 'data.frame...ggplot(crime, aes(x = lon, y = lat)) + geom_point() + coord_equal() + xlab('Longitude') +

8110
您找到你想要的搜索结果了吗?
是的
没有找到

stata对包含协变量模型进行缺失多重插补分析

p=6358 多重插补已成为处理缺失数据常用方法 。 我们可以考虑使用多个插补来估算X中缺失。接下来一个自然问题是,在X插补模型中,变量Y是否应该作为协变量包含在内?...我们可以在Stata中轻松完成此操作,为每个缺失生成一个估算,然后根据X结果推算或观察到X(当观察到它时)绘制Y: mi impute reg x,add(1) ?...Y对X,其中缺少X而忽略了Y. 清楚地显示了在X中忽略Y缺失问题 - 在我们已经估算X那些中,Y和X之间没有关联,实际上应该存在。...要继续我们模拟数据集,我们首先丢弃之前生成估算,然后重新输入X,但这次包括Y作为插补模型中协变量: mi impute reg x = y,add(1) Y对X,其中使用Y估算缺失X 多重插补中变量选择...选择要包含在插补模型中变量时一般规则是,必须包括分析模型中涉及所有变量,或者作为被估算变量,或者作为插补模型中协变量。

2.2K20

Excel小技巧90:快速删除包含指定所有

有一个Excel操作问题:我想删除所有包含有“完美Excel”,如何快速操作? 我想,你肯定是多么地不想再看“完美Excel”公众号了!...如下图1所示工作表,现在要删除单元格内容为“完美Excel”所在。 ? 图1 首先,选择所有的数据。...接着,按Ctrl+F键,在“查找和替换”对话框“替换”选项卡中,输入“完美Excel”,如下图2所示。 ?...图2 单击“查找全部”按钮,在下面的列表框中选中全部查到单元格(先选取第1,按住Shift键,滚动到最后,选取最后1,这将选择所有查找到结果),如下图3所示。 ?...图4 单击“确定”按钮,即可删除所有含有“完美Excel”内容单元格所在。 详细操作演示见下图5。 ? 图5

9.1K50

数据处理R包

MARGIN=2:操作基于列 MARGIN=c(1,2):对和列都进行操作 FUN内置函数有mean(平均值)、medium(中位数)、sum(求和)、min(最小)、max(最大),当然还包括自定义函数...key:将原数据框中所有列赋给一个新变量key value:将原数据框中所有赋给一个新变量value na.rm:是否删除缺失 > library(tidyr) > df <- data.frame...gender_class是列名转化后指定列名, count为各列。 (2) spread spread函数作用和gather相反。...value:需要分散 fill:对于缺失,可将fill赋值给被转型后缺失 > df_spread <- spread(df_gather,gender_class,count) > df_spread...除了maps包,ggmap,maptools,baidumap和REmap也是不错绘制地图R包 ggmap包整合了四种地图资源,分别是Google、OpenStreetMaps、Stamen和Cloudmade

4.6K20

地图可视化之——移花接木

本文调用得ggmap包,该包封装了包含Googlemap、openstreetmap、stamenmap等强大在线开源地图地图素材背景,如果能仔细甄别、精心挑选,还是可以淘到不少好背景。...因为ggmap是哈神参与创建包,专门为了拓展ggplot对于地图源支持,弥补其制作数据地图方面的缺陷,所以我们从ggmap中get到所有地图素材,都是可以直接供ggplot图层函数调用,只是之后投影参数什么部分会失效...shp素材导入、抽取、整理、合并等过程,而调用ggmap在线地图背景,确实可以省去不少功夫,代码量也小了很多!)。...最后总结一下关于ggplot调用ggmap制作数据地图几点建议: 弄清业务分析场景:ggmap在线地图素材大多是特定场景素材,有道路图、河流图、交通图、卫星图、等高线图、地貌图植被图等,只有明确自己图表使用场景才能选好素材...语法上差别:单纯使用ggplot结合shp素材制作,语法复杂,而借助ggmap,语法简洁,其中最重要差异,我觉得是投影参数,在ggmap中请勿使用地图投影参数,因为在线地图本身自带投影,你不知情情况下使用投影格式很可能与素材投影格式不一致

1K60

kaggle案例重复:科比投篮选择之一

原文很长,准备分成几个部分来重复,今天是第一部分 读入数据、查看数据维度、删除缺失等 shots<-read.csv("data.csv") dim(shots) [1] 30697 25 可以看到原数据集总共包括...25个变量,30697数据 删除缺失所在 shots<-na.omit(shots) dim(shots) [1] 25697 25 删除缺失后数据少了5000条。...因为kaggle贴出数据集目的为:是否可以根据科比20年职业生涯出手数据来预测下一次投篮是否可以命中。所以在原数据集中删除了5000条shotmadeflags。这部分用来做测试集。...用来拼图(ggplot2出图拼接有一个专门R包ggpubr,很好用) 数据可视化 散点图看一下科比投篮方式(shot type) 首先看一下数据集中combinedshottype变量中都包括哪些...可以看出绝大部分进攻都以跳投结束 散点图出手距离、柱形图每个距离范围出手次数 shotzonerange变量中包含 unique(shots$shot_zone_range) [1] 8-16 ft

1.1K20

用R在地图上绘制网络图三种方法

首先准备需要R包,当需要一次性加载多个R包时,我们可以利用pacman,它整合了library包中一些相关函数,利用pacman包中p_load函数可以自动加载需要R包,如果没有找到则会自动安装缺失...library(pacman) p_load(assertthat,tidyverse,ggraph,igraph,ggmap) 为了方便大家练习,仅挑出部分国家地理位置,如下: country_coords_txt...mapcoords <- coord_fixed(xlim=c(-150,180), ylim=c(-55,80)) 方法一:ggplot2 除了需要世界地图(country_shape)中国家边界外...,我们还需要三个几何对象: geom_point:绘制节点; geom_text:添加节点标签名字; geom_curve:绘制节点间连线(edge)。...然后是绘制第二个需要叠加图层——节点(nodes) (p_nodes <- ggplot(nodes) + geom_point(aes(x = lon, y = lat, size = weight

2.7K20

🤧 ggmice | 用这只可爱小老鼠来填补你缺失吧!~

1写在前面 我们在处理数据时候常常会遇到存在缺失(NA)情况,如何处理就仁者见仁,智者见智了。...最简单粗暴方法可能就是删除法(listwise)或者个案删除法(case-wise)了,这种方法在缺失比较少情况下比较适用,但在NA较多情况下可能就会丢失过多信息导致无法继续分析。...ggmice(dat, aes(Ozone, Solar.R))+ geom_point() ---- 5.2 分类变量 接着我们对分类变量缺失进行一下可视化,红色缺失。...包填补缺失 6.1 填补缺失 在这里我们生成几个填补缺失数据,m默认是5,为了减小计算量,这里我设置成3。...我们再看一下填补缺失散点图吧,红色缺失填补后。

37310

R数据科学|5.4内容介绍及习题解答

5.4 缺失 处理异常值有2种方法: 1.将带有可疑全部丢弃 diamonds2 % filter(between(y, 3, 20)) 我们不建议使用这种方式...缺失代替 最简单做法就是使用mutate()函数创建一个新变量来代替原来变量。...注意:和 R 一样,ggplot2也遵循不能无视缺失原则。...要想不显示这条警告,可以在geom_point()中设置na.rm = TRUE。 比较有无缺失区别 有时你会想弄清楚造成有缺失观测和没有缺失观测间区别的原因。...5.4 习题解答 该节作业习题较少,就直接在内容后面附上了。 问题一 直方图如何处理缺失?条形图如何处理缺失?为什么会有这种区别? 解答 直方图:当计算每个箱中观察数时,丢失被删除。

2.3K30

R海拾遗_naniar

偶然发现这个新包,想起以前都是自己撰写函数,进行缺失分析 缺失分析一般包括 缺失查看 缺失变量间关系 缺失模式 查看缺失 通常情况下,我们使用summary函数或者is.na对缺失进行查看,但是当数据量增大时候...原理是将缺失替换为该变量最小10% geom_miss_point # 使用ggplot ggplot(airquality, aes(x = Solar.R,...数字化缺失查看函数】 对于个案查看 n_miss 查看缺失数量 n_complete 查看非缺失数量 prop_miss_case 查看缺失比例 pct_miss_case 查看缺失百分比 miss_case_summary...airquality %>% # 添加一列,用于描述这个缺失比例 add_prop_miss() %>% head() ## Ozone Solar.R Wind Temp Month...结束语 naniar包是一个较新包,记得去年我还是自己编码进行缺失分析,有些函数还是比较有用,比如对变量和个案分别进行缺失分析,这个包还在不断完善中,未来会变得越来越好。

89720

一篇全是代码数据可视化案例

实在没时间写文字步骤了,算了,就甩一篇代码给大家吧,这篇代码包含五张图,分别可以呈现放射状线路图、迁徙路径图、闭环路径图、菱形气泡图、方形气泡图。...library("plyr") library("dplyr") library("ggplot2") library("ggmap") library("maptools") library("maps...D9D9D9")+ geom_segment(data=address,aes(x=lon,y=lat,xend=lonx,yend=laty),size=0.3,colour="#FF6833")+ geom_point...(data=address,aes(x=lon,y=lat,size=Num),shape=21,fill="#ED7D31",col="#E02939",alpha=.6)+ geom_point(data...以上所有图表指标数据均为随机数虚构,图表图形代码使用showtext和Cario进行高清渲染并自动输出,除了需加载地图素材之外,其他代码均可一次性放在控制台流畅运行。

83060

R语言缺失探索强大R包:naniar

本次学习主要探讨3个问题: 开始探索缺失 探索缺失机制 模型化缺失 如何开始探索缺失 当你面对新数据时,可能首先会使用各种汇总函数查看数据基本情况,比如: summary() str()...但是当数据有缺失时,就会影响接下来分析。所以首先还要查看数据缺失情况。...探索缺失关系 通过vis_miss可以知道哪些变量有缺失,但是我们还想知道这些缺失之间有什么关系,这时候就用到naniar包了。...这幅图会直接把缺失删掉,并不能知道缺失情况。...以下结果说明:有111没有缺失,占数据72%,有40只有1个缺失,占数据26%,有2含2个缺失,只占1%。

1.3K40

R语言机器学习方法分析二手车价格影响因素

分析数据构成: 将数据分为NA和非NA组,分析缺失是否均匀分布: 对于因变量“交易价格”,可见其缺失基本均匀分布。 其他自变量缺失也基本均匀分布。...Linear Regression with mixing Lasso & Ridge Penalty: 包含三种模型混合预测。...主要依据为10 folds cross validation 结果 在此案例中,Stochastic Gradient Boosting Machine 所得到RMSE最小,预测效果最好。...预测结果仅作为参考一个权重,还需要专家意见,按照一定权重来计算。...R语言在地图上绘制散点饼图可视化 r语言空间可视化绘制道路交通安全事故地图 在GIS中用ggmap地理空间数据分析 tableau骑行路线地理数据可视化 R语言推特twitter转发可视化分析

17830

利用主成分分析构建股票指数

date.stock.matrix<-cast(prices,Date~Stock,value="Close") > which(complete.cases(date.stock.matrix)==F) # 22 875条记录有缺失...[1] 22 875 > # 分析了这个生成结--巨大日期-股票矩阵之后,我们注意到缺失了一些元素。...数据集,删除那些缺失元素数据,再运行cast函数: > prices # 这个结果有点让人疑惑,因为载荷有一个相当不错分布,但是几乎全是负数。它实际上是个很小麻烦,我们用一代码就能解决。 > # 到目前为止我们获得了主成分,接下来可以把这些数据总结成一列了。...> # 这一次结果并不是很好,因为DJI都是很高,而我们指数都是很小,但是可以使用scale函数解决这个问题。

1.3K90

数据清洗(data cleaning)重要性

根据Ron Cody在他《Cody's Data Cleaning Techniques Using SAS》中定义是: 确保原始数据准确输入 检查字符型变量仅包含有效 检查数值型变量在预定范围内...检查是否存在缺失数据 检查并删除重复数据 检查特殊是否唯一,如患者编号 检查是否存在无效数据 检查每一个文件内ID编号 确保是否遵循复杂多文件规则 举个例子,当我获得一个包含几百名临床患者数据集时...如果数据量很大时候,拖动屏幕去看看下面的几万观测除了让你觉得卡顿之外,也不太可能一眼就看出什么有效信息,所以没有任何意义。 粗略来划分变量类型,通常可以分成字符型和数值型组成。...因为“RMDQ”中存在缺失(missing data),后面会通过多重填补(multiple imputation)方法进行缺失处理,需将数据变换为宽数据格式时才可以。 ?...图3 总结一下数据清洗具体包含操作除了检查变量是否有效、是否在合理范围内,还包括拼接、抽提、拆分、观测和变量筛选、变量类型转换、行列转置、新变量生成、赋值、缺失数据填补等等只要是为进一步数据分析做准备工作都可以看做是数据清洗

2K10

R语言naniar包(新名词:阴影矩阵;Shadow matrices)

缺失是一种不同颜色,因此缺失变得十分关注。 由于它是ggplot2几何图形,因此支持诸如构面和其他ggplot功能等功能。 ?...naniar提供了一种用于处理缺失数据数据结构,即阴影矩阵。阴影矩阵与数据维数相同,由数据缺失二进制指示符组成,其中缺失表示为“ NA”,而未缺失表示为“!...将阴影矩阵绑定到有助于您更好地跟踪缺失数据。 这种格式称为“ nabular”,是“ NA”和“ tabular”组合。...统计缺失和完整观测 naniar还提供了方便助手来计算缺失和完整观测数量,比例和百分比: n_miss(airquality) #> [1] 44 n_complete(airquality)...可以使用miss_var_summary()和miss_case_summary()查看每种情况下缺失数量和百分比以及变量,它们都返回按缺失数量排序输出。

1.6K20

Python数据分析实战基础 | 清洗常用4板斧

02 ——空去重 2.1 空 在一些场景,源数据缺失(空)对于分析来说是干扰项,需要系统删除。...上文我们合并后df数据集就是有缺失数据: 要删除空,一个dropna即可搞定: dropna函数默认删除所有出现空,即只要一中任意一个字段为空,就会被删除。...,要基于“流量级别”这列进行去重,则可以: 我们会发现,流量有三个级别,通过指定subset参数,我们删除了这个字段重复,保留了各自不重复第一。...继续展开讲,在源数据中,流量渠道为“一级”有7数据,每行数据其他字段都不相同,这里我们删除了后6,只保留了第一,但如果我们想在去重过程中删除前面6,保留最后一数据怎么操作?...keep等于last,保留最后一数据,不输入keep时,系统默认会给keep赋值为first,就会保留第一数据而删掉其他

2K21

R语言ggmap空间可视化机动车交通事故地图|附代码数据

p=12350 最近我们被客户要求撰写关于空间可视化研究报告,包括一些图形和统计输出。 在本文中,我使用ggmap可视化纽约市交通事故 数据来自纽约市开放数据。...我还解析日期变量以创建年份变量,并使用该变量创建两个数据集:一个数据集包含2013年所有车辆事故,另一个数据集包含2014年所有车辆事故。...ny_plot=ggmap(get_map('New York, New York',zoom=12, maptype='terrain'))   grid.arrange(plot1, plot2,...我编写了一个函数boro(),该函数会删除所有缺少街道名称观测,并基于自治市镇(2013)子集。我将它们堆叠在一起,同时添加自治市镇名称,然后在向量col_vals中为每个自治市镇分配一种颜色。...本文选自《R语言ggmap空间可视化机动车交通事故地图》。

16520
领券