首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言数据清洗实战——世界濒危遗产地数据爬取案例

最近重复新翻阅R语言领域唯一一本关于网络数据采集参考书——《基于R语言自动数据收集》,开篇就是一个数据爬取案例。...(是一个list体),里面嵌套有所有表格(数据框 ),确定我们需要表格是第2、4两个。...以下函数除了sapply之外,我都在最近几篇推送中有所涉及,特别是正则表达式在本次数据清洗起到了很大作用,如果你对正则还不太熟悉,可以参考这篇文化文章。...sapply函数在这里起到批量提取列表单个对象第n个子对象作用,因为strsplit函数按照“;”作为分隔符分列,这里“[[”其实是一个函数,详细用法参考?sapply文档说明。...——爬取小姐姐秒拍MV 教你如何优雅R语言调用有道翻译 2017年第一周,你吸了多少雾霾?

2K60

R」apply,lapply,sapply用法探索

本文节选自张丹R极客理想》系列。 1. apply家族函数 apply函数族是R语言中数据处理一组核心函数,通过使用apply函数,我们可以实现对数据循环、分组、过滤、类型控制等操作。...很多R语言新手,写了很多for循环代码,也不愿意多花点时间把apply函数使用方法了解清楚,最后把R代码写跟C似得,我严重鄙视只会写forR程序员。...apply函数可以对矩阵、数据框、数组(二维、多维),按行或列进行循环计算,对子元素进行迭代,并把子元素以参数传递形式给自定义FUN函数,并以返回计算结果。...参数列表: X:list、data.frame数据 FUN: 自定义调用函数 …: 更多参数,可选 比如,计算list每个KEY对应该数据分位数。...函数定义: sapply(X, FUN, ..., simplify=TRUE, USE.NAMES = TRUE) 参数列表: X:数组、矩阵、数据框 FUN: 自定义调用函数 …: 更多参数,可选

4.4K32
您找到你想要的搜索结果了吗?
是的
没有找到

社交网络分析 R 基础:(四)循环与并行

前三章列出大多数示例代码都很短,并没有涉及到复杂操作。从本章开始将会把前面介绍数据结构组合起来,构成真正程序。...(或其他数据结构)元素: for (name in vector) { # TODO } 下面的示例将会输出向量元素: > v <- c("a", "b", "c") > for (item...在不使用向量运算前提下计算向量平方,使用 sapply() 函数可以这样: > v <- c(1, 2, 3) > sapply(v, function(item) { return(item ^...紧接着调用 parApply() 进行并行计算,并行计算 parApply() 系列方法仅仅需要在第一个参数将创建集群传递进去即可。...> length(addresses) [1] 2 > length(spec) [1] 8 紧接着就可以调用 makeCluster() 创建集群,此过程根据计算机数量可能需要数分钟。

1.2K10

快速掌握apply函数家族推荐这篇文档

❝apply 家族是 R 语言中常用函数,用于对列表、数组或其他类型数据进行循环操作。 ❞ apply 家族包括以下几个函数: ❝lapply:用于遍历列表每一个元素,并对其执行函数操作。...❞ 例如,下面的代码使用 sapply 函数将列表每个字符串转换为大写: # 创建列表 x <- list("apple", "banana", "cherry") # 使用 sapply 函数对列表每个字符串执行...例如,下面的代码使用 apply 函数求出矩阵每一列和: # 创建矩阵 x <- matrix(1:9, nrow = 3) # 使用 apply 函数求出矩阵每一列和 apply(x, 2,...函数求出矩阵每一列最大值: # 创建矩阵 x <- matrix(1:9, nrow = 3) # 使用 apply 函数求出矩阵每一列最大值 apply(x, 2, max) [1] 3...总结 ❝apply 家族是 R 语言中常用函数,用于对列表、数组或其他类型数据进行循环操作。它们包括 lapply、sapply、apply 和 tapply 函数,每个函数都有各自用途。

2.9K30

R语言中循环函数(Grouping Function)

R语言中有几个常用函数,可以按组对数据进行处理,apply, lapply, sapply, tapply, mapply,等。这几个函数功能有些类似,下面介绍下这几个函数用法。...其调用如下: Apply(数据,运算函数,函数参数) 对于Data Frame来说,如果不同列有不同数据类型,不能转换成Matrix,但是却可以转换成List,然后使用lapply函数。...Sapply Sapply函数和Lapply函数很类似,也是对List进行处理,只是在返回结果上,Sapply会根据结果数据类型和结构,重新构建一个合理数据类型返回。...Mapply 这是对多个数据(multivariate)进行sapply处理,只是调用是参数位置有所变化,先把函数放前面: mapply(运算函数,函数参数,第一个传入参数,第二个数据…,SIMPLIFY...Tapply 前面介绍几个apply函数都是对整体数据进行处理,而tapply是对向量数据进行分组处理。

1.5K20

R语言中 apply 函数详解

apply函数集来转换R数据 介绍 数据操作是机器学习生命周期中最关键步骤之一。...因此,在Python和R中都有大量函数和工具可以帮助我们完成这项任务,这一点也不奇怪。 今天,我们将使用R并学习在R中转换数据时使用最广泛一组“apply”函数。...https://blackbelt.analyticsvidhya.com/accelerate 目录 该系列各种函数包括: 设置上下文 apply lapply sapply vapply...sapply() sapply()函数(simplified apply缩写)类似于lappy函数。唯一区别是输出返回类型——sapply()根据返回值简化了输出。...尾注 到目前为止,我们学习了Rapply()函数族各种函数。这些函数集提供了在一瞬间对数据应用各种操作极其有效方法。本文介绍了这些函数基础知识,目的是让你了解这些函数是如何工作

20.2K40

R语言中apply函数族

很多R语言新手,写了很多for循环代码,也不愿意多花点时间把apply函数使用方法了解清楚,最后把R代码写跟C似得。...也可以是自己编写函数。 ... :FUN额外参数。 现在假设我们需要对一个矩阵每一行求和,那么用apply怎么实现呢?...,那么直接使用lapply就不能达到想要效果了,lapply会分别循环矩阵每个值,而不是按行或按列进行分组计算。...mapply函数 mapply是sapply变形函数,类似多变量sapply,但是参数定义有些变化。第一参数为自定义FUN函数,第二个参数’…’可以接收多个数据,作为FUN函数参数调用。...eapply函数平时很难被用到,但对于R包开发来说,环境空间使用是必须要掌握。特别是当R要做为工业化工具时,对变量精确控制和管理是非常必要

4.4K52

R编程(七:向量类型详解2)

因为向量化,我选择R image.png 我们所有操作,都可以对向量每一个元素执行。...同样操作也可以用来取子集: 一些使用注意事项 一般来说,c() 是创建向量语法,但R 也提供了一些例外:可不要因为它们养成坏习惯了哦。 2....尽可能向量化 我觉得下面的内容讲更全:https://www.yuque.com/mugpeng/rr/01r-de-bian-cheng-xiao-lu 这里提一下Vectorize函数,可以将标量...base::Vectorize(if_else_statement) test001 <- c(rep("Fire", 100000), rep("Ice", 200000)) system.time(sapply...非向量化情况 输入为上一次输出 但其实有的如cumsum cumprod 等也考虑到了一些基本运算。 应对策略 尽量避免循环和嵌套次数。 4.

34450

R语言数据结构(包含向量和向量化详细解释)

更多内容请参考《R语言编程艺术》 ——————————————— 向量类型是R语言核心。深入理解向量对R数据结构及其操作,函数开发和应用有着重要意义。...也就是说,向量所有元素必须属于同种模式(mode),或数据类型(见1.2),比如数值型,字符型等。其类型可以用typeof()查看。 标量只含有一个元素,在R没有0维度或标量类型。...,可用sapply函数进行简化,调用sapply(x,f)可对x每一个元素使用函数f(),并将结果转化为矩阵。...还有合并 apply族函数在数据框用法 apply lapply sapply apply 如果数据框每一列数据类型相同,则可以对该数据框使用apply函数。或针对数据框某些列应用。...(d[,-1],mean) ages score 11.0 92.5 6 因子factor 因子是R许多强大运算和可视化基础,暴多很多针对表格数据运算。

7K20

R语言中批处理函数

R语言中,apply系列函数作为批量处理函数,可以循环遍历某个集合内所有或部分元素,以简化操作。这些函数底层是通过C来实现,所以效率也比手工遍历来高效。...apply系列函数基本作用是对矩阵或者列表(list)按照元素或元素构成子集合进行迭代,并将当前元素或子集合作为参数调用某个指定函数。...其中参数na.rm=TRUE,可以忽略所用NA值 ? 2.lapply和sapply函数 lapply和sapply函数可以用于处理列表数据和向量数据(vector/list)。...lapply函数得到处理得到数据类型是列表,而sapply函数得到处理数据类型是向量。这两个函数除了在返回值类型不同外,其他方面基本完全一样。 ? ?...总结以上函数应用可以减少在R语言中For循环,从而提升R语言效率。 欢迎各位学习交流

2.7K20

R语言︱数据分组统计函数族——apply族用法与心得

笔者寄语:apply族功能强大,实用,可以代替很多循环语句,R语言中不要轻易使用循环语句。...lapply使用格式为: lapply(X, FUN, ...) lapply返回值是和一个和X有相同长度list对象, 这个list对象每个元素是将函数FUN应用到X每一个元素。...其中X为List对象(该list每个元素都是一个向量), 其他类型对象会被R通过函数as.list()自动转换为list类型。...在vapply函数总是会进行简化,vapply会检测FUN所有值是否与FUN.VALUE兼容, 以使他们具有相同长度和类型。...lapply中所要使用函数,一定需要是输入为单一变量,输出为单一变量可以存至list

3.4K30

【学习】笨办法学R编程(二)

经历了前面两个小挑战,你应该对R有点理解了。我们继续推进,今天问题有点点复杂,复杂不是R,而是一个数学概念:质数和质因子。...myfunc <- function(r) { area <- pi*r^2 return(area) } print(myfunc(4)) # 同时求四个不同半径圆面积 r <- c(2,2,4,3...) sapply(X=r,FUN=myfunc) # Project Euler 3 # 找到600851475143这个数最大质因子 # 先建立一个函数以判断某个数是否为质数 findprime...=0)) return(TRUE) else return(FALSE) } # 列出1到100质数,看函数对不对 x = 1:100 x[sapply(x,findprime)] # 寻找最大质因子...本例除了使用for循环外,还见到了sapply函数,这是R语言中非常重要一类向量化计算函数。求质数方法可以参考这个文章,本例使用是其中境界4。

68190
领券