开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在R中对两组变量使用mutate_at()

在R中，可以使用mutate_at()函数对两组变量进行操作。mutate_at()函数允许对指定的变量进行相同的操作，可以是数学运算、逻辑运算或其他操作。

使用mutate_at()函数的一般语法如下：

mutate_at(.tbl, .vars, .funs, ...)

其中，.tbl表示要操作的数据框或数据表，.vars表示要操作的变量，可以是变量名的字符向量或选择器函数，.funs表示要应用的函数，可以是函数名或函数列表。

对于两组变量的操作，可以使用mutate_at()函数的选择器函数来指定要操作的变量。例如，可以使用starts_with()函数来选择以特定前缀开头的变量，使用ends_with()函数来选择以特定后缀结尾的变量，使用contains()函数来选择包含特定字符串的变量。

下面是一个示例，展示如何在R中使用mutate_at()函数对两组变量进行操作：

library(dplyr)

# 创建一个示例数据框
data <- data.frame(
  var1_a = 1:5,
  var1_b = 6:10,
  var2_a = 11:15,
  var2_b = 16:20
)

# 对以"_a"结尾的变量进行平方操作
# 对以"_b"结尾的变量进行加1操作
data <- mutate_at(data, vars(ends_with("_a")), funs(.^2))
data <- mutate_at(data, vars(ends_with("_b")), funs(.+1))

# 输出结果
print(data)

在上述示例中，我们首先创建了一个示例数据框data，其中包含了两组变量var1和var2，每组变量都有两个子变量，分别以"_a"和"_b"结尾。然后，我们使用mutate_at()函数对以"_a"结尾的变量进行平方操作，对以"_b"结尾的变量进行加1操作。最后，输出结果。

对于这个问题，腾讯云的相关产品和产品介绍链接地址如下：

腾讯云云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云云数据库MySQL版：https://cloud.tencent.com/product/cdb_mysql
腾讯云云原生容器服务（TKE）：https://cloud.tencent.com/product/tke
腾讯云人工智能平台（AI Lab）：https://cloud.tencent.com/product/ailab
腾讯云物联网平台（IoT Hub）：https://cloud.tencent.com/product/iothub
腾讯云移动开发平台（MTP）：https://cloud.tencent.com/product/mtp
腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云区块链服务（BCS）：https://cloud.tencent.com/product/bcs
腾讯云元宇宙服务（Tencent XR）：https://cloud.tencent.com/product/xr

相关搜索:根据两组变量在R中创建新变量如何在R中使用mutate_at()来更改列？使用mutate_at在R中输入多个列如何使用R根据共享元素对两组进行排序？在R中对阶乘输入变量使用RNN 如何使用R中的后缀组合变量对？对r中的多个列(变量)使用函数 for循环通过R中的两组对向量中的值求和如何在Python中粘贴(如R)和groupby 如何对R中的变量求和？如何在Typoscript中定义对象变量(如javascript)根据R中两组的最大值来编码虚拟变量？如何在r中对向量元素使用enquo 如何在Svelte中使用RXJs主题，如存储变量在R中对多个变量进行分组对r中的字母数字变量排序对另一个变量使用带有case_when条件的dplyr::mutate_at 如何在R中复制变量使用anova或r中的其他检验方法比较具有多个变量的两组如何在R中使用宏变量

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

linux中对shell变量的使用

我有一段shell命令如下：cd /www/wwwroot/learn.gaojiufeng.cngit fetch --all git reset --hard origin/masterchmod -R...755 /www/wwwroot/learn.gaojiufeng.cnchown -R www /www/wwwroot/learn.gaojiufeng.cn很显然有很多重复的路径，我们用变量替换试试...learn.gaojiufeng.cn/" && cd $dirgit fetch --all git reset --hard origin/masterdir+="runtime"chmod -R...755 $dirchown -R www $dir切记变量等号左右不能有空格

1.3K2 0

R语言第二章数据处理⑤数据框列的转化和计算目录正文

正文本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数： Mutate（）：计算新变量并将其添加到数据表中。它保留了现有的变量。...Transmutate（）：计算新列但删除现有变量。...Mutate_at（）/ transmutate_at（）：将函数应用于使用字符向量选择的特定列 Mutate_if（）/ transmutate_if（）：将函数应用于使用返回TRUE的谓词函数选择的列...选择predicate为或返回TRUE的变量。...转换特定列 mutate_at（）：转换按名称选择的特定列： my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),

4.1K2 0

R语言使用马尔可夫链对营销中的渠道归因建模

p=5383 介绍在这篇文章中，我们看看什么是渠道归因，以及它如何与马尔可夫链的概念联系起来。我们还将通过一个电子商务公司的案例研究来理解这个概念在理论上和实践上如何运作（使用R）。...（18,19）其他如促销活动在不同的地点现在，我们需要帮助电子商务公司确定投资营销渠道的正确策略。应该关注哪些渠道？公司应该投资哪些渠道？我们将在下一节中使用R来解决这个问题。...使用R的实现让我们继续前进，尝试在R中的实现并检查结果。...我们将创建一个特定格式的变量'路径'，可以作为模型的输入。另外，我们将使用“dplyr”包找出每条路径的总发生次数。...结束在上面的图表中，我们已经能够找出哪些是我们关注的重要渠道，哪些可以被忽略或忽视。这种情况使我们对客户分析领域马尔可夫链模型的应用有了很好的了解。

1.2K2 0

如何在CDH中使用Solr对HDFS中的JSON数据建立全文索引

本文主要是介绍如何在CDH中使用Solr对HDFS中的json数据建立全文索引。...2.在Solr中建立collection，这里需要定义一个schema文件对应到本文要使用的json数据，需要注意格式对应。...Morphline可以让你很方便的只通过使用配置文件，较为方便的解析如csv，json，avro等数据文件，并进行ETL入库到HDFS，并同时建立Solr的全文索引。...必须指定唯一键（uniqueKey），类似主键，唯一确定一行数据，我们这里的示例demo使用的是json中的id属性项。...schema文件中的字段类型定义，标准如int，string，long等这里不再说明，注意有两个类型text_cn，text_ch，主要对应到英文或者中文的文字内容，涉及到分词和全文检索技术。

5.9K4 1

R语言使用马尔可夫链对营销中的渠道归因建模|附代码数据

在这篇文章中，我们看看什么是渠道归因，以及它如何与马尔可夫链的概念联系起来我们还将通过一个电子商务公司的案例研究来理解这个概念如何在理论上和实践上运作（使用R）。什么是渠道归因？...如果我们要弄清楚渠道1在我们的客户从始至终转换的过程中的贡献，我们将使用去除效果的原则。...我们将在下一节中使用R来解决这个问题。使用R的实现我们读取数据，尝试在R中实现并检查结果。 > head(channel) 输出： 1....创建一个特定格式的变量'路径'，可以作为模型的输入。另外，我们将使用“dplyr”包找出每条路径的总发生次数。...结束在上面的图表中，我们已经能够找出哪些是我们关注的重要渠道，哪些可以被忽略或忽视。这种情况使我们对客户分析领域马尔可夫链模型的应用有了很好的了解。

5300 0

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

这篇文章的很大一部分内容涉及从FF网站导入数据，并对其进行整理，以用于我们的投资组合收益。我们将看到，处理数据在概念上很容易理解，但在实际操作中却很耗时。...使用tempfile() 基础 R 中的函数来创建一个名为 temp. 这是我们将放置压缩文件的地方。 temp <- tempfile() R 创建了一个名为的临时文件 temp 。...但是，请注意 FF 使用当月的第一天，而我们的投资组合收益使用的是当月的最后一天。这会将每月日期回滚到上个月的最后一天。我们 FF 数据中的第一个日期是“1990-07-01”。让我们回滚。...CAPM 使用简单的线性回归，而 FF 使用具有许多自变量的多元回归。因此，我们的 3 因子 FF 方程为 lm(R_excess ~ MKT_RF + SMB + HML。...因此，市场因素在该模型中占主导地位，而其他两个因素的置信区间为零。 ---- 本文摘选《R语言Fama French (FF) 三因子模型和CAPM多因素扩展模型分析股票市场投资组合风险/收益可视化》

3.8K3 0

0765-7.0.3-如何在Kerberos环境下用Ranger对Hive中的列使用自定义UDF脱敏

文档编写目的在前面的文章中介绍了用Ranger对Hive中的行进行过滤以及针对列进行脱敏，在生产环境中有时候会有脱敏条件无法满足的时候，那么就需要使用自定义的UDF来进行脱敏，本文档介绍如何在Ranger...中配置使用自定义的UDF进行Hive的列脱敏。...目前用户ranger_user1拥有对t1表的select权限 2.2 授予使用UDF的权限给用户 1.将自定义UDF的jar包上传到服务器，并上传到HDFS，该自定义UDF函数的作用是将数字1-9按照...6.再次使用测试用户进行验证，使用UDF函数成功 ? 2.3 配置使用自定义的UDF进行列脱敏 1.配置脱敏策略，使用自定义UDF的方式对phone列进行脱敏 ? ?...3.在配置脱敏策略时，方式选择Custom，在输入框中填入UDF函数的使用方式即可，例如：function_name(arg)

4.9K3 0

如何保证自己的生存分析结果图有意义

KM plot在生物医学中很常见，主要用来做预后分析，比如可以根据表达量把病人分成两组，然后比较哪组病人预后好，进而可以得出基因表达量高低与病人预后好坏相关性的结论。...画KM plot时，有时候会比较纠结怎样对病人进行分组，如何来设置分组的cutoff。...一般来说常见的几种设置cutoff值得思路如下： 1：大多数情况下，根据表达量从低到高对样本进行排序，取前50%为低表达，后50%为高表达，然后画KM plot。...例子例如下面例子所示：（通过NFE2L2基因的表达量中位值，我们将所有的样本分为高表达和低表达两组，然后通过绘制KM生存分析曲线的形式来探讨两组生存概率是否存在差别） > # ============...rm(list=ls()) data <- read.csv('data.csv', header = T) head(data) str(data) rt % mutate_at

1.7K4 0

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...它使用 tidy 选择语法（像 select() 那样），因此你可以按照位置、名字和类型来选择变量。...（包括 lambda 函数）的命名列表来对每个变量同时执行多个函数操作。..._at() 函数是「dplyr」中唯一你需要手动引用变量名的地方，这让它们比较奇怪且难以记忆。为什么过了这么久才发现 across()？...这是由 base R 提供的，但它并没有很好的文档，我们花了一段时间才发现它是有用的，而不仅仅是理论上的好奇。我们可以使用数据框让汇总函数返回多列。

2.4K1 0

流量结构分布图——桑基图（Sankey）

第一个图是我们要呈现的原始数据，这样看来有两组对应关系，即大区对应地区、地区对应省份，我们如果要呈现这两组信息，只筛选出大区与地区对应关系及其权重值、地区与省份对应关系及其权重值，并将两组三变量数据表进行列对齐合并...（说的有点绕了，其实就是图表上有多少节点对，那么数据就有多少个三变量观测值）。...以上两种方式做出来的动态图表（调用了D3的在线图形库，格式是html格式的，如果你需要将HTML嵌入PPT中使用，那么本公众号早前曾经推送过一篇此类文章，讲解如何在PPT中嵌入HTML对象）。...将html格式动态图表网页嵌入ppt中 PowerBI版讲解：接下来讲解如何在PowerBI中实现以上桑基图效果，因为改图表并未包含在PowerBI的内置基础图表库中，所以我们需要在他的在线社区中下载该图表的可视化插件...productgroup=PowerBI 关于如何下载PowerBI图形可视化插件，如何导入、加载和使用，此前的另一篇文章中也介绍的很详细。当PowerBI遇到R语言 ? ? ?

6.8K5 0

相关性分析的五种方法有哪些_数据相关性分析

相关分析（Analysis of Correlation）是网站分析中经常使用的分析方法之一。通过对不同特征或数据间的关系进行分析，发现业务运营中的关键影响及驱动因素。并对业务的发展进行预测。...在实际工作中不需要按下面的方法来计算，可以通过Excel中COVAR()函数直接获得两组数据的协方差值。协方差只能对两组数据进行相关性分析，当有两组以上数据时就需要使用协方差矩阵。...回归分析（regression analysis)是确定两组或两组以上变量间关系的统计方法。回归分析按照变量的数量分为一元回归和多元回归。两个变量使用一元回归，两个以上变量使用多元回归。...这里还要单独说明下R Square的值0.87。这个值叫做判定系数，用来度量回归方程的拟合优度。这个值越大，说明回归方程越有意义，自变量对因变量的解释度越高。...获得这个方程还有一个更简单的方法，就是在Excel中对自变量和因变量生成散点图，然后选择添加趋势线，在添加趋势线的菜单中选中显示公式和显示R平方值即可。

13.2K2 0

R语言tidyverse包使用杂记：删除行、设置因子水平、指定列小写转大写

首选是构造一份数据集 image.png 数据是excel存储，读取数据使用R包readxl中的函数read_excel() 读取数据 library(readxl) df% ggplot(aes(x=var,y=value))+ geom_col(aes(fill=var)) image.png 指定列大小写转换 df %>% mutate_at...("var",toupper) 欢迎大家关注我的公众号小明的数据分析笔记本小明的数据分析笔记本公众号主要分享：1、R语言和python做数据分析和数据可视化的简单小例子；2、园艺植物相关转录组学

2.2K1 0

Nature图表解读｜系统发育树循环添加背景

论文论文原图图形解读此图使用门水平的信息进行绘制 1.根据OTU丰度表+注释表可以获得每一个门水平的包含的OTU信息 2.根据需要在门水平下选取一定量的OTU编号 3.进化树的构建则根据选取的...OTU编号从代表序列中提取，对代表序列进行多序列比对后构树。...❝完成上述操作后就得到了基础的树图，但是由于我们是根据已有的分组信息来对OTU添加背景条带，此时若是使用「geom_strip」函数来添加条带则会比较麻烦，因此通过循环来添加则比较便捷。...❞ 加载R包 library(tidyverse) library(treeio) library(ape) library(magrittr) library(ggtree) 数据清洗 otu <-...taxonomy, into=c("domain","phylum","class","order","family","genus","species"),sep=";") %>% mutate_at

4205 0

手把手教你R语言方差分析ANOVA

如果你的数据已经存储在一个外部文件中（如CSV、Excel或RData），你需要使用适当的R函数（如read.csv(), readxl::read_excel(), load()等）将其加载到R环境中...()等函数）或进行变量选择（使用子集选择或dplyr包的select()函数）。...在R中，你可以使用aov()函数来执行方差分析。这个函数需要一个公式，该公式描述了你要分析的数值型变量和分类变量之间的关系。...aov函数运行单因素方差分析 (公式是：Y是检验变量，X是分组变量)；再使用summary函数获取单因素方差分析的结果。...(变量中的水平数减1)和残差的自由度(观察总数减1和自变量中的水平数减1)； Sum Sq列显示平方和(即组均值与总体均值之间的总变化)。

2901 0

手把手教你做倾向评分匹配

各位科研芝士的朋友大家好，今天和大家分享一下新的知识点—PSM，或许大家早已听过这个名词了，或许你对它还是半知半解，不过没关系，希望可以通过今天的帖子帮助你对该名词有一定的理解。...但是在观察性研究中（如队列研究），研究对象是非随机分配的，这就会使混杂因素在两组中分配不均匀，导致处理因素和结局的关系受到混杂因素的干扰。...之前我们平台推出了基于SPSS计算PSM，那我们今天采用R语言计算PSM，测试数据在后台回复"PSM"提供。今天PSM推荐的包为MatchIt，一听名字就是做匹配用的。...数据匹配，采用matchit函数，首先要定义一个逻辑变量，这一点非常重要： ? 生存好逻辑变量之后，接着我们需要进行匹配 ?...Ok，今天的推文就到这，我们分享了如何在基于R语言的PSM的计算，希望能对大家有所帮助，最后，欢迎大家多多交流。 —END—

4.9K6 0

FPGA中的DSP-Packing: 提高算法性能功耗和效率

在Xilinx UltraScale FPGAs的DSP48E2上，这种方法可以实现两组乘法（w0·a0=r0 和 w1·a1=r1）以及一个乘积累加结果（r2=w0·a1+w1·a0）。...Mert等人的方法： Mert等人提出了一种方法，可以在单个DSP上实现两组乘法（c0·a0=r0 和 c1·a0=r1）。其中 c0 和 c1 必须是常数，而 a0 是相同的变量输入。...Xilinx白皮书的方法：在Xilinx白皮书中提出了一种方法，可以在单个DSP上实现两组乘法（w0·a0=r0 和 w0·a1=r1），这种方法称为INT8-packing。...然而，每种方法都有其局限性，如特定的输入位宽要求、对常数的需求或是对输入数据的限制。...过打包引入的大误差由于低位的污染导致，但对于某些应用如卷积神经网络(CNNs)，这种误差是可以接受的，因为它们对量化和近似具有内在的鲁棒性。

2081 0

stringr2

stringr2 sunqi 2020/8/13 概述 str_detect:用来匹配字符中的字母，返回布尔值 str_count()：匹配字符，返回匹配的个数正文 rm(list=ls()) library..."1234", "B246", "217C", "2357f", "21WD4") ) str_match_all(x, "\\d") ## [[1]] ## [,1] # 求tibble中每个单元格中数字的和...library(tidyverse) data %>% # 匹配字符中的所有数字，返回列表 mutate(num = str_match_all(x, "\\d")) %>% # 将返回的列表还原为数据框...unnest(num) %>% # 对提取的的数字转换为数字 mutate_at(vars(num), as.numeric) %>% # 按照x分组计算和 group_by(x)...## 1 1234 10 ## 2 217C 10 ## 3 21WD4 7 ## 4 2357f 17 ## 5 B246 12 结束语随着数据量越来越大，R语言对于内存的需求也越来越大

4672 0

在数据分析工作中运用因果推断模型的实践指南

原理：随机分配：将研究对象随机分配到处理组或对照组，确保两组在所有其他方面（除处理外）相同。实施干预：对处理组进行特定干预（如广告、药物等），对照组不进行干预。...实施干预：对处理组实施干预措施，对照组不进行干预。数据收集：在干预前后收集两组的数据，确保数据的准确性和完整性。数据分析：使用统计方法比较两组的结果，确定干预措施的效果。...本部分将通过三个具体案例，详细介绍如何在实际中应用因果推断方法，包括随机对照试验（RCTs）、工具变量法（IV）和回归不连续设计（RDD）。...4.1 案例研究1：使用RCTs分析营销活动的效果4.1.1 背景和问题描述某电商平台希望评估一项新的营销活动（如打折促销）是否能够有效提升销售。...回归分析控制：在回归分析中，加入潜在的混杂因素作为控制变量，减少其对结果的影响。匹配方法：使用匹配方法（如倾向得分匹配），在处理组和对照组之间进行匹配，确保两组在混杂因素上的均衡。7.

2151 0

elife: 写作及审稿中常见的十个统计错误

如图1A所示，X和Y是两个变量，每个变量分为两组，两组之间相关性一样(红线和黑线)。但是当两组分别与0比较时，那么对于组A的相关性是显著的，而对组B的显著性是不显著的。...然而研究人员更倾向于认为高相关性 (如R>0.5)比中等相关性(如R=0.2)更稳健。在小样本的情况下，这些假阳性的效应很大，这就导致了显著性谬误:如果在小样本情况下，效应那么大，那它只能是真的。...最常见的是，循环分析用于划分(如分组，分箱)或减少(如定义一个感兴趣的区域，去除异常值)完整数据集，使用的选择标准是回顾性的和内在相关的统计结果。...分析的灵活性：p-hacking 错误描述：在数据分析中使用灵活性的方法(如改变参数、添加协变量、预处理流程、去除离群值)来增加获得显著P值的概率。...研究者应该只有在一个变量被精确操纵时才使用因果语言，即使这样，他们也应该对第三个变量或混淆因素的作用保持谨慎。

8813 1

卡方检验spss步骤_数据分析–学统计&SPSS操作

如果场景中需要对连续变量进行卡方检验，首先需要将连续变量转换为分类变量，如年龄分成70后、80后、90后、00后。....研究假设：两组总体中的方差是不等的当p<0.05，则研究假设成立，即两组总体中的方差是不等的，需要看第二行的t值检验结果。...比如只考虑自变量的直接效应，或部分自变量的交互作用当自变量特别多时，尤其是分类自变量多时，且样本量不多时，应该使用定制模型。...应用 1）分析哪些自变量对因变量存在显著影响作用，R方值可以不要求大于0.8： 2）通过选择对因变量存在显著影响的自变量，建立预测因变量取值的预测模型，模型R方值必须要求大于等于0.8 但是，在人文社科领域...P值是否小于0.05，如小于0.05，则研究假设成立，即该自变量对因变量存在显著影响。

3.9K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭