首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言第二章数据处理⑤数据框列的转化和计算目录正文

正文 本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数: Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。...同时还有mutate()和transmutate()的三个变体来一次修改多个列: Mutate_all()/ transmutate_all():将函数应用于数据框中的每个列。...Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定列 Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择的列...tbl:一个tbl数据框 funs:由funs()生成的函数调用列表,或函数名称的字符向量,或简称为函数。predicate:要应用于列或逻辑向量的谓词函数。...mutate_if()对于将变量从一种类型转换为另一种类型特别有用。

4.2K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言系列第三期:②R语言多组汇总及图形展示

    在这里我们就得介绍一下R的隐式循环了,之前我们学习过while循环,repeat,break循环,for循环;循环的一个常用功能是把一个函数应用到一组值或者向量中的每一个元素,并将结果返回。...在R中,就可以使用lapply()和sapply()两个函数实现。前一个总是返回列表(用“l”标识),而后者则尽可能将结果简化(用“s”标识)成向量或矩阵。...同时显示多个变量是很有用的。...由于函数应用于整个数据框,所以可以选择数据框的子集进行运算,这里是选择了数值变量。...之前我们通过一些作图函数如par()来强行将多个图汇集到一起,但是这里有些函数在显示多组数据时有一些独有的特征。

    1.7K00

    matlab 单元数组和元胞数组

    删除单元数组中的某一部分内容,可以将这部分内容设置为空数组,即可删除单元数组中的这部分内容 高维数组取值区别 对于其他语言来说,往往使用多个方括号的形式[][],来对高维数组中的元素进行取值,但是在matlab...,Am ] = cellfun( ___ ) 说明 A = cellfun(func,C) 将函数 func 应用于元胞数组 C 的每个元胞的内容,每次应用于一个元胞。...当 func 返回的值不能串联成数组时,可以按元胞数组的形式返回 A。您可以将 Name,Value 对组参数与上述任何语法中的输入参数结合使用。 当 func 返回 m 个输出值时,[A1,......将函数应用于元胞数组的内容 创建一个元胞数组,其中包含不同大小的数值数组。...您可以使用 cellfun 将函数应用于字符向量元胞数组和字符串数组。

    1.8K40

    R语言系列第六期:②R语言基本绘图(下)

    对属性变量分类后,每个箱线图中仅包含特定类别中定量变量的几个数字。我们按变量party分类,绘制unemploy的并列箱线图。...参数names=可对输出图形中各分类型变量的类别命名,参数boxwex=0.5将箱子的宽度设置为默认宽度的一半。 C. 条形图 条形图普遍应用于商学和管理学中,而在自然科学中并不经常用到。...在R中,条形图命令barplot()需要一个数值型变量来对其绘制条形图。如果有多个数值那么会绘制多条结果,所以首先要计算出两个变量的均值,并将其组成向量进行绘图。...最后,参数space=2将条形的间距设置为条形宽度的2倍。 D. 饼图 饼图与条形图不同的是它重点展示的是组内的构成比,绘制饼图的pie()以向量为参数,其中向量中包含需要比较的数字。...饼图将总值作为整体,对各部分的百分比进行比较。在经济数据中,或许可看一下民主党和共和党在预算年中各自所占的百分比。

    1.2K10

    5分钟掌握Pandas GroupBy

    Pandas是非常流行的python数据分析库,它有一个GroupBy函数,提供了一种高效的方法来执行此类数据分析。在本文中,我将简要介绍GroupBy函数,并提供这个工具的核心特性的代码示例。...这将生成所有变量的摘要,这些变量按您选择的段分组。这是快速且有用方法。 在下面的代码中,我将所有内容按工作类型分组并计算了所有数值变量的平均值。输出显示在代码下方。...在下面的代码中,我只选择credit_amount。 data[['job', 'credit_amount']].groupby(['job']).mean() ? 我们也可以按多个变量分组。...多聚合 groupby后面使用agg函数能够计算变量的多个聚合。 在下面的代码中,我计算了每个作业组的最小和最大值。...除了使用GroupBy在同一图表中创建比较之外,我们还可以在多个图表中创建比较。 df[['duration', 'target']].groupby('target').boxplot() ?

    2.2K20

    【GNN】R-GCN:GCN 在知识图谱中的应用

    (只发到 C 可能是因为 R-GCN 表现不太好) 这篇论文主要有两大贡献: 证明了 GCN 可以应用于关系网络中,特别是链接预测和实体分类中; 引入权值共享和系数约束的方法使得 R-GCN 可以应用于关系众多的网络中...将分类器视为自编码器,从而完成节点的预测。...在实践中,利用稀疏矩阵乘法可以有效地实现前向传播,同时为了避免了对邻域的显式求和,可以将多层堆叠起来,以便跨多个关系步骤实现依赖关系。...基函数分解可以看作是不同关系类型之间权重共享的一种方式;而块分解可以看作是对每个关系类型的权值矩阵的稀疏约束,其核心在于潜在的特征可以被分解成一组变量,这些变量在组内的耦合比在组间的耦合更紧密。...链接预测其实是预测一个三元组(subject,relation,object),作者通过一个打分函数 来判断 是否符合要求。

    3.2K20

    现代 IT 人一定要知道的 Ansible系列教程:Ansiable配置

    可以在配置文件中进行更改并使用该更改,该文件将按以下顺序搜索: ANSIBLE_CONFIG(如果设置了环境变量) ansible.cfg(在当前目录中) ~/.ansible.cfg(在主目录中) /...将变量分配给多台计算机:组变量 如果组中的所有主机共享一个变量值,则可以一次将该变量应用于整个组。...proxy: proxy.atlanta.example.com 组变量是一次将变量应用于多个主机的便捷方法。...但是,在执行之前,Ansible 始终将变量(包括清单变量)展平到主机级别。如果主机是多个组的成员,则 Ansible 会从所有这些组中读取变量值。...如果为不同组中的同一变量分配不同的值,Ansible 会根据内部合并规则选择要使用的值。 继承变量值:组的组变量 您可以将变量应用于父组(嵌套组或组组)以及子组。

    26410

    R语言基础-数据清洗函数pivot_longer

    发现自己的R语言的基础还是相对弱很多的,通过对前面的肺癌单细胞文章代码的学习,也在巩固自己的R基础。今天是需要对昨天test的icitools的R包进行自己的数据分析。...首先是需要对自己所查找的转录组的数据进行整理,由于给的example的数据比较少,因此发现手动也是可以的,很快,但是由于自己的转录组数据太多了,达到了几十个,因此自己需要再次借助R语言的函数转换。...names_to:一个字符向量,指定要根据存储在 cols 指定的数据的列名中的信息创建一个或多个新列。如果长度为 0,或者如果提供了 NULL,则不会创建任何列。...预计这种情况在未来会有所改变。names_transform, values_transform:(可选)列名-函数对的列表。或者,可以提供一个函数,该函数将应用于所有列。...values_drop_na:如果为 TRUE,将删除 value_to 列中仅包含 NA 的行。这有效地将显式缺失值转换为隐式缺失值,并且通常仅应在数据中的缺失值由其结构创建时使用。

    6.8K30

    Flux脚本语言入门教程

    2、语法基础 2.1、管道转发运算符 管道转发运算符:|> 将一个函数的输出作为输入发送到下一个函数。在“水处理比喻”中,管道转发运算符是通过管道传送水(或数据)的管道。...函数可以是命名的或匿名的。在括号 (()) 中定义参数,并使用箭头运算符 (=>) 将参数传递到运算中。...2.7.1、定义数据流变量 Flux 中变量赋值的一种常见用例是为一个或多个输入数据流创建变量。...常见的数据调整包括 按列值或按时间重新分组数据或将列值转换为行。...aggregateWindow()是一个辅助函数,可以塑造和处理数据。该函数按时间对数据进行开窗和分组,然后将聚合 或selector 函数应用于重构的表。

    1.2K30

    备战春招 | 数据科学&机器学习面试题,来挑战吧~

    回答: 算术平均值:它是统计学中的一个重要概念。算术平均值也可称为平均值,它是通过将两个或多个数字/变量相加,然后将总和除以数字/变量的总数而获得的数量或变量。...分层抽样:在分层抽样中,数据将分为组或分层。 系统抽样:根据系统抽样方法,每隔k个成员,从总体中抽取一个。 回答: 当我们在统计中进行假设检验时,p值有助于我们确定结果的显著性。...你可以通过cor()函数返回相关系数,cov()函数返回协方差。 在R中,t.test()函数用于进行各种t检验。 t检验是统计学中最常见的检验,用于确定两组的均值是否相等。...With()函数类似于SAS中的DATA,它将表达式应用于数据集。 BY()函数将函数应用于因子的每个水平。它类似于SAS中的BY。...为了重新整理数据,R提供了各种方法,转置是重塑数据集的最简单的方法。为了转置矩阵或数据框,可以使用t()函数。 通过一个或多个BY变量,使得折叠R中的数据变得容易。

    51030

    1.基础知识(1) --Matlab基础知识

    当你使用 MATLAB 时,您可以发出创建变量和调用函数的命令。例如,通过在命令行输入这个语句创建一个名为 a 的变量: a = 1 MATLAB 将变量 a 添加到工作区并在命令窗口中显示结果。...要调用函数,如 max,将其输入参数括在括号中: A = [1 3 5]; max(A) ans = 5 如果有多个输入参数,请用逗号分隔: B = [10 6 4]; max(A,B) ans = 1...×3 10 6 5 通过将函数赋值给一个变量,返回函数的输出: maxA = max(A) maxA = 5 当有多个输出参数时,用方括号括起来: [maxA,location] = max(A) maxA...A = 4*pi*r^2; V = (4/3)*pi*r^3; 将这份文件保存在当前文件夹中。...如果要将 monospace 字体应用于文本中的函数名,请点击 Live Editor 选项卡上的 Text 选项中的按钮 M 。

    2.9K20

    组织病理学的生存模型综述

    组织分割 其他技术将高级知识带入了模型训练中,尤其是图像中存在的组织类型。病理学家或机器学习模型都可以将组织划分为一组类别,以便可以对每个类别进行适当建模。...我们将生存函数定义为t时刻患者生存的比例: ? 则在时间t的瞬时死亡概率为 ? CPH函数对一组协变量x的效果进行建模: ? 其中λ₀(t)是基准风险函数,h(x)是风险函数。...一些将生存模型应用于组织学的早期工作使用手工制作的特征作为协变量。深度学习模型通过应用一组非线性运算来使用相同的公式,以针对一组网络权重产生输出hᵩ(x)。...为了将此模型应用于组织学图像,将CPH损失功能放置在CNN的顶部。 CPH模型的缺点之一是它不可分离。在模型训练的每次迭代期间,通过比较当前批次中患者的相对风险来估计其值。...作为处理同一张图片中的多个斑块的另一种方法,Bychkov等人将递归神经网络应用于从组织微阵列核心图像斑块中提取的CNN特征[Bychkov2018]。

    81440

    JSON神器之jq使用指南指北

    keys,keys_unsorted 内置函数keys,当给定一个对象时,会在一个数组中返回它的键。 键按 unicode 代码点顺序“按字母顺序”排序。...高级功能 变量在大多数编程语言中是绝对必要的,但它们在 jq 中被归为“高级特性”。 在大多数语言中,变量是传递数据的唯一方式。如果你计算一个值,并且你想多次使用它,你需要将它存储在一个变量中。...数组模式中的变量声明(例如,. as [first, second])按顺序绑定到数组的元素,从索引零的元素开始。当数组模式元素的索引处没有值时,null将绑定到该变量。...请注意,调用addvalue(.[])将导致在调用站点map(. + $f)的值中的每个值对部件进行一次评估。. 允许使用相同函数名的多个定义。...内置将stderr 其输入以原始模式输出到 stder,没有额外的装饰,甚至没有换行符。 大多数 jq 内置函数在引用上是透明的,并且在应用于常量输入时会产生常量和可重复的值流。

    28.7K30

    R语言之可视化⑥R图形系统续目录

    改变颜色形状 也可以通过分组变量(此处为Species)控制点的形状和颜色。 例如,在下面的代码中,我们将点颜色和形状映射到Species分组变量。...分面板 您还可以根据分组变量将绘图拆分为多个面板。 R函数:facet_wrap()。 ggplot2的另一个有趣特性是可以在同一个图上组合多个图层。...例如,使用以下R代码,我们将: 使用geom_point()添加点,按组着色。 使用geom_smooth()添加拟合的平滑回归线。...按小组将图片分成多个面板 使用scale_color_manual()和scale_fill_manual()函数手动更改颜色和填充 ggplot(iris, aes(x = Sepal.Length,...它从文件扩展名中猜出图形设备的类型。 ggexport()[在ggpubr中]。 一次安排和导出多个ggplots。

    2K10

    机器学习系列 | 十种机器学习算法的要点(含代码)

    监督学习 该算法由一个目标变量/结果变量(或因变量)组成,该变量由一组给定的预测变量(自变量)中预测而来。我们利用这些变量集生成一个将输入值映射到期望输出值的函数。...这个算法将种群聚类到不同的分组中,例如被广泛用于将用户分到不同的用户组从而对不同的用户组进行特定的干预。非监督学习的例子有:关联算法和k均值算法。 3. 强化学习 该算法训练机器做出具体的决策。...令人惊奇的是,它同时适用于分类变量和连续因变量。在这个算法中,我们将总体分为两个或更多个同类集,即基于个体最重要的属性/自变量将总体分成不同的组别,不同组别的个体存在尽可能大的差异。...R代码: ? 4.SVM(支持向量机) 这是一种分类方法。在这个算法中,我们将每个数据在N维空间中用点标出(N是特征数量),每个特征的值对应一个特定的坐标值。...我们可以很容易地将kNN应用于我们的现实生活中。如果你想要了解一个完全陌生的人,也许你可以通过了解他/她的密友或者他/她的好友圈来获取他/她的信息。

    89750

    最全面的 Android 编码规范指南

    layout文件中的先后顺序排列 普通成员变量按照使用的先后顺序排列 方法基本上都按照调用的先后顺序在各自区块中排列 相关功能作为小区块放在一起(或者封装掉) 3.4.2.3 重载:永不分离 当一个类有多个构造函数...,或是多个同名方法,这些函数/方法应该按顺序出现在一起,中间不要放进其它函数/方法。...layout文件中的先后顺序排列 普通成员变量按照使用的先后顺序排列 方法基本上都按照调用的先后顺序在各自区块中排列 相关功能作为小区块放在一起(或者封装掉) 3.4.2.3 重载:永不分离 当一个类有多个构造函数...,或是多个同名方法,这些函数/方法应该按顺序出现在一起,中间不要放进其它函数/方法。...量词列表:量词后缀说明 First 一组变量中的第一个 Last 一组变量中的最后一个 Next 一组变量中的下一个变量 Prev 一组变量中的上一个 Cur 一组变量中的当前变量。

    1.7K40

    数据科学&机器学习常见面试题答案,建议收藏

    算术平均值也可称为平均值,它是通过将两个或多个数字/变量相加,然后将总和除以数字/变量的总数而获得的数量或变量。 2. 中位数 中位数也是观察一组数据平均情况的一种方法。它是一组数字的中间数字。...分层抽样:在分层抽样中,数据将分为组或分层。 系统抽样:根据系统抽样方法,每隔k个成员,从总体中抽取一个。 12. p值 当我们在统计中进行假设检验时,p值有助于我们确定结果的显著性。...你可以通过cor()函数返回相关系数,cov()函数返回协方差。 在R中,t.test()函数用于进行各种t检验。t检验是统计学中最常见的检验,用于确定两组的均值是否相等。...With()函数类似于SAS中的DATA,它将表达式应用于数据集。 BY()函数将函数应用于因子的每个水平。它类似于SAS中的BY。...为了重新整理数据,R提供了各种方法,转置是重塑数据集的最简单的方法。为了转置矩阵或数据框,可以使用t()函数。 通过一个或多个BY变量,使得折叠R中的数据变得容易。

    91610

    备战春招 | 数据科学&机器学习面试题,来挑战吧~

    回答: 算术平均值:它是统计学中的一个重要概念。算术平均值也可称为平均值,它是通过将两个或多个数字/变量相加,然后将总和除以数字/变量的总数而获得的数量或变量。...分层抽样:在分层抽样中,数据将分为组或分层。 系统抽样:根据系统抽样方法,每隔k个成员,从总体中抽取一个。 回答: 当我们在统计中进行假设检验时,p值有助于我们确定结果的显著性。...你可以通过cor()函数返回相关系数,cov()函数返回协方差。 在R中,t.test()函数用于进行各种t检验。 t检验是统计学中最常见的检验,用于确定两组的均值是否相等。...With()函数类似于SAS中的DATA,它将表达式应用于数据集。 BY()函数将函数应用于因子的每个水平。它类似于SAS中的BY。...为了重新整理数据,R提供了各种方法,转置是重塑数据集的最简单的方法。为了转置矩阵或数据框,可以使用t()函数。 通过一个或多个BY变量,使得折叠R中的数据变得容易。

    43810
    领券