首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言筛选的方法--select

我们知道,R语言学习,80%的时间都是在清洗数据,而选择合适的数据进行分析和处理也至关重要,如何选择合适的进行分析,你知道几种方法? 如何优雅高效的选择合适的,让我们一起来看一下吧。 1....r$> library(learnasreml) r$> data(fm) r$> head(fm) 「我们的目的:」 ❝提取fm的TreeID,Rep,dj,dm,h3,并重命名为:ID,...使用R语言默认的方法:选择 这一种,当然是简单粗暴的方法,想要哪一,就把相关的号提取出来,形成一个向量,进行操作即可。...> names(d1) = c("ID","F1","y1","y2","y3") r$> head(d1) 结果: 「缺点:」 这种方法,需要找到性状所在的号,然后还要重命名,比较麻烦。...而且,后面如果想要根据的特征进行提取时(比如以h开头的,比如属性为数字或者因子的等等),就不能实现了。 这就要用到tidyverse的函数了,select,rename,都是一等一的良将。

7.5K30
您找到你想要的搜索结果了吗?
是的
没有找到

RR 基础语法与获取帮助

本文汇总之前两篇关于 R 基础知识的笔记以及获取 R 帮助文件的记录。 R 基础语法 就像学习一门外语,如果你想要学好,必须掌握语义、语法:单词、连词、句子结构等等。...学习一本编程语言也基本一样,我们如果想要高效地编程 R,必然要学好 R 的语言的语义和语法。.../R_notebook4.ipynb 获取帮助 学习是一个持续的过程,没有谁可以记住所有的包、所有的函数、一个复杂函数所有的参数说明。...如果要获取关于某个函数的帮助信息,例如glm,输入: > help(glm) 或者 > ?glm 如果想要搜索关于某个操作符的帮助信息,需要用使用反引号(`)括起来: > ?...R会返回所有相关主题的列表。它还有一个快捷方式: > ?? regression 有时我们可以用上面的方法获取关于包的帮助文档,其实也可以使用library函数的help选项来获取更完整的信息。

52511

R语言:以多标准筛选特定行

问题提出 在data.table语句中,i是用来进行行选择的重要组成部分,很多情况下我们都需要以很多的同一个特殊值进行行的选择,大多数情况下,我们可能会针对所有的变量逐一写出条件,例如a==1&b==...外层代码 下面来看外层代码: rowMeans(clinic[, 31:52] == "醛固酮") > 0 这里运用了R语言中非常关键的一个知识点:对逻辑判断值进行四则运算时,TRUE会被当做1,FALSE...= "继发性醛固酮") == 1] 写在结尾 应用好对象格式是R语言编程中的精髓之一,在这个例子中就很好的利用了对象格式里面的格式性质,做了一些适当的变通处理,让数据处理过程变得更加巧妙和方便,这点大家可以在以后的数据处理中做更多的尝试和思考...大猫的R语言课堂 我是大猫,一个高中读文科但却在代码、数学的路上狂奔不止的Finance Ph. D Candidate。 我是村长,一个玩了9年指弹吉他,却被代码深深吸引的博士候选人。

1.9K40

基于R的竞争风险模型的线图

以往推文我们已经详细描述了基于R语言的实现方法,这里不再赘述。那么,您如何看待竞争风险模型呢?如何绘制竞争风险模型的线图?在这里,我们演示如何绘制基于R线图。...案例分析 案例1 此案例数据的下载地址是: http://www.stat.unipg.it/luca/R/ 研究人员计划比较骨髓移植和血液移植治疗白血病的疗效。...主要原因是,如果哑变量出现在线图中,结果将难以解释清楚。 因此,应避免在线图中使用哑变量。 regplot包中的regplot()函数可以绘制更多美观的线图。...因此,为了绘制竞争风险模型的线图,我们需要对原始数据集进行加权,以创建用于竞争风险模型分析的新数据集。mstate包中crprep()函数的主要功能是创建此加权数据集,如下面的R代码所示。...R中的riskRegression包可以对基于竞争风险模型构建的预测模型进行进一步评估,例如计算C指数和绘制校准曲线等。

4K20

R语言之数据获取操作

实际上,R 中有大量的内置数据集可用于分析和实践,我们也可以在R 中创建模拟特定分布的数据。...R 提供了适用范围广泛的数据导入工具。 1.获取内置数据集 R 中的内置数据集存在于各个包中,其中基本包 datasets 里只有数据集,没有函数。...获取其他格式的数据 3.1 txt 与csv 格式 如果数据来源是一个用 Windows 记事本或其他纯文本编辑器所创建的 ASCII 格式文件,我们可以使用函数 read.table( ) 读取其中的数据...例如,假设创建的数据框 patients 的数据文件 patients.txt 存放于当前工作目录下,我们可以使用下面的命令读取该数据: # getwd() # 获取当前工作目录 # 临时创建下 patients.txt...4.数据录入 在 R 中可以直接输入数据,但是如果数据量较大(超过 10 或超过 30 行),在 R 里录入数据并不是一个最佳选择。我们可以选择电子表格软件录入小规模的数据,比如 Excel。

29540

Pandas vs Spark:获取指定的N种方式

导读 本篇继续Pandas与Spark常用操作对比系列,针对常用到的获取指定的多种实现做以对比。...无论是pandas的DataFrame还是spark.sql的DataFrame,获取指定一是一种很常见的需求场景,获取指定之后可以用于提取原数据的子集,也可以根据该衍生其他。...在两个计算框架下,都支持了多种实现获取指定的方式,但具体实现还是有一定区别的。 01 pd.DataFrame获取指定 在pd.DataFrame数据结构中,提供了多种获取单列的方式。...02 spark.sql中DataFrame获取指定 spark.sql中也提供了名为DataFrame的核心数据抽象,其与Pandas中DataFrame有很多相近之处,但也有许多不同,典型区别包括...在Spark中,提取特定也支持多种实现,但与Pandas中明显不同的是,在Spark中无论是提取单列还是提取单列衍生另外一,大多还是用于得到一个DataFrame,而不仅仅是得到该的Column类型

11.4K20

R语言入门之频率表和联表

‍‍ ‍‍‍‍‍‍在这一期我们将要学习如何针对分类变量数据创建频率表和联表,之后在此基础之上进行独立性检验、关联度测量以及相关数据的可视化。 ‍...创建频率表和联表 R语言提供了许多方法来创建频率表和联表,在这里我们主要介绍三种常用的函数,它们虽有各自的特点,但大同小异,大家在学习中能细细体会出来。 1....margin.table(mytable, 2) # 对每一的数据求和 ? prop.table(mytable) # 计算每格数据占总数的比例 ?...prop.table(mytable, 2) # 以列为单位,计算其中每个变量的占比,每求和为1 ?...但是由于这些功能我们也可以通过R的基本函数来实现,所以这里就不对CrossTable()这个函数进行过多讲解,感兴趣的朋友可以使用方法?CrossTable()自行了解和学习。 ‍‍‍ ‍

2.6K30

Pandas库的基础使用系列---获取行和

前言我们上篇文章简单的介绍了如何获取行和的数据,今天我们一起来看看两个如何结合起来用。获取指定行和指定的数据我们依然使用之前的数据。...我们先看看如何通过切片的方法获取指定的所有行的数据info = df.loc[:, ["2021年", "2017年"]]我们注意到,行的位置我们使用类似python中的切片语法。...同样我们可以利用切片方法获取类似前4这样的数据df.iloc[:, :4]由于我们没有指定行名称,所有指标这一也计算在内了。...如果要使用索引的方式,要使用下面这段代码df.iloc[2, 2]是不是很简单,接下来我们再看看如何获取多行多。为了更好的的演示,咱们这次指定索引df = pd.read_excel(".....通常是建议这样获取的,因为从代码的可读性上更容易知道我们获取的是哪一行哪一。当然我们也可以通过索引和切片的方式获取,只是可读性上没有这么好。

38700

R tips:手动获取函数的源码

R中的函数分为普通函数、S3方法和S4方法。 普通函数的源码获取细节 普通函数的源码手动获取比较简单,只需要在console中输入函数名,打印一下即可。...<- as.character(substitute(name)) # get(name, envir = asNamespace(pkg), inherits = FALSE) #} 在R中...,base包的::、[ 等操作符,colnames%、%$%等操作符都是函数,由于他们不是合法的R变量名称(只包含数字、英文字母...S3方法源码 S3方法的源码的获取可以手动构造一下函数名称,然后在console中打印它即可,之所以需要手动构造方法名称是因为一个S3泛型函数直接打印的并不是真正的源码细节。...S4方法源码 不同于S3方法,S4方法源码无法通过构造函数名称来获取,但是methods包(R的官方S4类包,默认自动导入)中提供了getMethod方法来获取源码。

86310
领券