开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何将公式应用于R中行中的每个组？

在R中，可以使用apply()函数或者for循环来将公式应用于行中的每个组。

使用apply()函数： apply()函数可以在矩阵或数据框的行或列上应用一个函数。对于每个组，可以使用apply()函数将公式应用于行中的每个元素。

例如，假设有一个数据框df，其中包含一个分组变量group和一个数值变量value，我们想要将公式应用于每个组中的value列，可以按照以下步骤进行：

# 创建一个示例数据框
df <- data.frame(group = c("A", "A", "B", "B", "C", "C"),
                 value = c(1, 2, 3, 4, 5, 6))

# 定义要应用的公式
my_formula <- function(x) {
  # 在这里定义你的公式，例如计算平均值
  mean(x)
}

# 使用apply()函数将公式应用于每个组
result <- tapply(df$value, df$group, my_formula)

上述代码中，tapply()函数将df$value按照df$group进行分组，并将每个组应用my_formula()函数。最终的结果存储在result中，其中每个组的结果都可以通过组名进行访问。

使用for循环：另一种方法是使用for循环逐个处理每个组。以下是一个示例代码：

# 创建一个示例数据框
df <- data.frame(group = c("A", "A", "B", "B", "C", "C"),
                 value = c(1, 2, 3, 4, 5, 6))

# 定义要应用的公式
my_formula <- function(x) {
  # 在这里定义你的公式，例如计算平均值
  mean(x)
}

# 获取唯一的组名
groups <- unique(df$group)

# 创建一个空向量来存储结果
result <- numeric(length(groups))

# 使用for循环逐个处理每个组
for (i in 1:length(groups)) {
  group <- groups[i]
  subset <- df$value[df$group == group]
  result[i] <- my_formula(subset)
}

上述代码中，我们首先使用unique()函数获取唯一的组名，然后使用for循环逐个处理每个组。在每次循环中，我们将组名存储在group变量中，并使用subset <- df$value[df$group == group]获取该组的子集。然后，我们将子集应用my_formula()函数，并将结果存储在result向量中。

无论是使用apply()函数还是for循环，都可以将公式应用于R中行中的每个组。具体选择哪种方法取决于数据的结构和个人偏好。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

「R」tidyverse 中的公式函数

img 公式保存了创建它的环境使用到 R 的朋友几乎都用过公式，它在统计建模方面给了我们极大的方便。不过，公式相比于数值、逻辑值这些数据类型，有什么特点吗？...")= 从属性部分我们可以看到公式保存了创建它的环境。...基本用法假设我们要对 df 中的 x 和 y 列进行归一化处理，在不使用 scale() 函数的情况下，我们可能会手写一个函数： scale2 <- function(x) { (x - mean...-2.886256 -0.782301 0.476785 2.117951 0.472815 0.553460 -0.980149 #> [99] 0.150879 -2.060062 在公式中...在公式中，我们可以直接使用前面已经定义的变量，这里是 cfs。

3.9K2 0

【数据挖掘】决策树中根据信息增益确定划分属性 ( 信息与熵 | 总熵计算公式 | 每个属性的熵计算公式 | 信息增益计算公式 | 划分属性确定 )

信息增益计算使用的数据集 S V . 信息增益计算公式已知条件 VI . 信息增益总熵计算公式 VII . 信息增益每个属性的熵计算公式 VIII . 信息增益计算公式 IX ....决策树中的信息增益 : 属性的信息增益越大 , 就越能将分类效果达到最大 ; 如 : 想要从用户数据集中找到是否能买奢侈品的用户 , 先把高收入群体划分出来 , 将低收入者从数据集中去除 , 这个收入水平的属性...信息增益每个属性的熵计算公式 ---- 1 . 计算熵的属性 : 属性 A 的值为 \{ a_1 , a_2 , \cdots, a_v \} ; 2 ....总熵计算 : ① 总熵 : 计算每个属性的信息增益 , 先要使用 Entropy(S) 公式计算出总熵 ; ① 预测属性分析 : 最后预测的属性是是否购买电脑 , 有两个取值 , 是或否 ,...计算公式使用 : 根据上述公式 , 计算出每个属性的信息增益 , 递归选取信息增益最大的作为树根 ; 2 .

2K2 0

R语言计算两组数据变量之间的相关系数和P值的简单小例子~应用于lncRNA的trans-act

中的论文 Comparative analysis of long noncoding RNAs in angiosperms and characterization of long noncoding...这里相当于是计算两个数据集中的变量之间的相关性，之前发现correlation这个R包里的函数correlation()可以做但是这里遇到了一个问题 ? 关掉这个报错界面以后就会提示 ?...但是mRNA的表达量有上万个，用这个函数计算的时候是非常慢的找到了另外一个函数是Hmisc这个包中的rcorr()函数这个速度快很多，但是他不能计算两个数据集之间变量的相关性，这样的话可以先计算，...) flattenCorrMatrix(res.cor$r,res.cor$P) ?...零基础学习R语言之相关性分析 https://www.bilibili.com/video/BV1vb4y1k7kv psych这个包里的corr.test()函数也是可以直接计算两个数据集变量之间的相关性的

5.9K2 0

【干货】50个Excel常用功能，一秒变数据处理专家

50个实用技巧 ▽附动态说明图▽ 1、自动筛选 2、在Excel中字符替换 3、在Excel中冻结行列标题 4、在Excel中为导入外部数据 5、在Excel中行列快速转换 6、共享Excel工作簿 7...Excel中录制“宏” 14、在Excel中建立图表 15、在Excel中获取网络数据 16、用好Excel的“搜索函数” 17、在Excel中插入超级链接 18、在Excel中打印指定页面 19、在Excel...正确输入身份证号码 33、Excel数据排序操作 34、Excel数据表格中如何将姓名信息按笔画排列 35、Excel数据格式设置 36：Excel自定输入数据下拉列表 37、Excel内置序列批量填充...38、Excel模版的保存和调用 39、Excel监视窗口 40、Excel中行列隐藏操作 41、Excel工作簿加密保存 42、Excel公式引用方式转换 43、Excel中特殊符号的输入 44、Excel...中文日期格式 45、Excel工作表的移动 46、Excel工作表的复制 47、Excel分区域锁定 48、Excel加载“宏” 49、Excel表格列宽行高设置 50、Excel“公式求值”功能好了

26K10 3

50个逆天功能，看完变Excel绝顶高手（全都是动图！）

1、自动筛选 2、在Excel中字符替换 3、在Excel中冻结行列标题 4、在Excel中为导入外部数据 5、在Excel中行列快速转换 6、共享Excel工作簿 7、在Excel中添加说明文字 8、...中建立图表 15、在Excel中获取网络数据 16、用好Excel的“搜索函数” 17、在Excel中插入超级链接 18、在Excel中打印指定页面 19、在Excel中直接编辑“宏” 20、用窗体调用...、Excel数据排序操作 34、Excel数据表格中如何将姓名信息按笔画排列 35、Excel数据格式设置 37、Excel内置序列批量填充 38、Excel模版的保存和调用 39、Excel监视窗口...40、Excel中行列隐藏操作 41、Excel工作簿加密保存 42、Excel公式引用方式转换 43、Excel中特殊符号的输入 44、Excel中文日期格式 45、Excel工作表的移动 46、Excel...工作表的复制 47、Excel分区域锁定 48、Excel加载“宏” 49、Excel表格列宽行高设置 50、Excel“公式求值”功能文章来自网络分享，如有版权问题请联系小编

2.1K6 0

【DB笔试面试405】在一个关系R中，若每个数据项都是不可再分割的，那么R一定属于（）

题目在一个关系R中，若每个数据项都是不可再分割的，那么R一定属于（） A、第一范式 B、第二范式 C、第三范式 D、第四范式 A 答案答案：A。...About Me：小麦苗 ● 本文作者：小麦苗，只专注于数据库的技术，更注重技术的运用 ● 作者博客地址：http://blog.itpub.net/26736162/abstract/1/ ● 本系列题目来源于作者的学习笔记

2.5K2 0

轻松搞懂中文分词的评测

a 混淆矩阵在分类任务中每个样本都有相应的真实值以及算法预测的预测值。...c 中文分词中P、R、F1的计算由于F1值的本质就是计算精准率P和召回率R的调和平均值，因此有了精准率和召回率，自然可以求出F1值，因此接下来主要介绍如何计算中文分词的精准率和召回率。...混淆矩阵是计算精准率和召回率的关键所在，因此有了混淆矩阵中的具体元素值，接下来只需要相应的代入精准率和召回率的计算公式中。...如果想要计算中文分词中的精准率和召回率需要解决两个问题： 如何将中文分词的分块问题转换为分类问题？ 如何将转换为分类问题的中文分词映射到混淆矩阵中，进而求出精准率和召回率？...▍ 如何将中文分词的分块问题转换为分类问题对于长度为n的字符串，分词结果为一系列单词。每个单词按它在文本中起始位置可以记作区间[i, j]，其中1 ≤ i ≤ j ≤ n。

1.4K4 0

《搜索和推荐中的深度匹配》——2.2 搜索和推荐中的匹配模型

接下来，我们概述搜索和推荐中的匹配模型，并介绍潜在空间中的匹配方法。 2.2.1 搜索中的匹配模型当应用于搜索时，匹配学习可以描述如下。...每个元组 r）∈D的生成方式如下：查询q根据概率分布P（q）生成，文档d根据条件概率分布P（d∣q）生成，并且相关性r是根据条件概率分布 P（r∣q，d）生成的。...可以将学习问题形式化为公式（2.1）中的 pointwise loss function，公式（2.2）中的 pairwise loss function 或公式（2.3）中的 listwise loss...学习的模型必须具有泛化能力，可以对看不见的测试数据进行匹配。 2.2.2 推荐中的匹配模型当应用于推荐时，匹配学习可以描述如下。给出了一组M个用户U=u1，......，uM和一组N个项目 V=i1，...，iN，以及评级矩阵 R∈RM×N，其中每个条目 rij表示用户ui在项目 ij上的评分（互动），如果该评分（互动）未知，则 rij设置为零。

1.4K3 0

Motif中的PWM矩阵

比如CTCF的motif序列为（来自于JASPAR数据库）： ? 要构建出PWM矩阵，首先要得到position frequency matrix (PFM)，即在每个位置的四种核苷酸出现的次数。...将每个位置的频数转换为频率 (某核苷酸的出现数量/这个位置四种核苷酸的总数量)，可以得到position probability matrix (PPM) (图中行列互换用的是JASPAR中的.meme...最后通过以下公式将PPM转换为PWM： ? 其中M是指的这个位点的probability，b是指的background (上图的background为0.25)。...得到motif PWM后，可以用Fimo或其他软件在基因组中扫描得到序列，其基本用法为： fimo [options] 提供motif的PWM...文件和参考基因组即可。

2.1K3 0

WPF DataGrid 如何将被选中行带到视野中

WPF DataGrid 如何将被选中行带到视野中目录前言准备工作方法一方法二总结独立观察员 2021 年 12 月 11 日前言在 WPF 开发中，显示表格一般使用 DataGrid...而还有一种情况，我们可能在业务逻辑中，由程序自己选中了某一行，如果这一行当前不在用户界面的可视区（换句话说也就是滚动条没有滚到那个位置），那么我们如何将其带到用户的视野中呢？...，以及一个执行选中操作的按钮：下面来演示一下没有自动将选中行带到视野中的情况。...BringIntoViewBehavior 类提供了一个 IsBroughtIntoViewWhenSelected 附加属性，给每个列表项的 Selected 事件指定了处理方法，处理方法中调用 BringIntoView...总结关于将 DataGrid 选中行带到视野中的需求，本文介绍了两种方法。方法一提供了一个附加属性，可以方便地实现该需求，不过要求不能开启行虚拟化。

1.8K1 0

在Python中实现Excel的VLOOKUP、HLOOKUP、XLOOKUP函数功能

标签：Python与Excel,pandas Excel的LOOKUP公式可能是最常用的公式之一，因此这里将在Python中实现Excel中查找系列公式的功能。...此外，我们可以使用INDEX/MATCH组合，但这需要更多的输入。在最新的Office中，Microsfot推出了XLOOKUP公式，但它只在Office 365中可用。...使用XLOOKUP公式来解决这个问题，如下图所示，列F“购买物品”是我们希望从第二个表（下方的表）中得到的，列G显示了列F使用的公式。...import pandas as pd df1 =pd.read_excel(r'D:\users.xlsx', sheet_name='User_info') df2 =pd.read_excel(r'D...默认情况下，其值是=0，代表行，而axis=1表示列 args=()：这是一个元组，包含要传递到func中的位置参数下面是如何将xlookup函数应用到数据框架的整个列。

6.6K1 0

【独家】手把手教线性回归分析（附R语言实例）

本文将介绍如何将回归方法应用到你自己的数据中，主要介绍学习内容：用线性回归方法来拟合数据方程的基本统计原则和它们如何描述数据元素之间的关系。...无论我们用什么软件来做线性回归（本文中的例子统一采用R语言），它都会用某种形式来报告这两个数值。截距就是我们的公式中的b，斜率就是Y和自变量之间的倾斜程度。...之所以发生这种情况，是因为lm()函数自动将一种称为虚拟编码(dummy coding)的技术应用于模型所包含的每一个因子类型的变量中。...在我们的模型中，R自动保留sexfemale、smokerno和regionnortheast变量，使东北地区的女性非吸烟者作为参照组。...如果怀疑两个变量相互作用，那么可以通过在模型中添加它们的相互作用来检验这一假设，可以使用R中的公式语法来指定相互作用的影响。

13.7K12 1

Excel公式技巧51：根据条件来排序（续）

在《Excel公式技巧50：根据条件来排序》中，我们基于指定的一个条件对数据进行排序，所举示例为给不同区域的员工按销售额从大到小的顺序排序，结果如下图1所示。 ?...公式中： (B2:B24=B2) 将公式所在单元格中行对应的列B中的值与单元格区域B2:B24中的每个值相比较，得到一个由TRUE/FALSE值组成的数组：TRUE表示区域中与该单元格值相等的单元格，FALSE...同理，公式中： (C2:C24=C2) 也得到一个由TRUE/FALSE值组成的数组，表示公式所在单元格中行对应的列C中的值与单元格区域C2:C24中的每个值相对较的结果。...公式中： (D2<D24) 将公式所在单元格行对应的列D中的值与单元格区域D2:D24中的每个值比较，如果比该值大则为TRUE，否则为FALSE，也得到一个由TRUE/FALSE值组成的数组。...完美Excel社群2020.8.31动态 #Excel公式# 查找一列中有多少个值出现在另一列中 #话题# 关于Excel中的高级筛选功能

1.8K6 0

重度抑郁症患者的脑龄

将学习到的模型系数应用于927名对照组男性和986名抑郁症男性、1199名对照组女性和1689名抑郁症女性，以获得独立的无偏差脑龄预测值。...2.5 模型验证在对照组的测试样本中，进一步验证模型的性能。将从对照组的训练模型中学习得到的参数，应用于对照组测试样本和MDD测试样本，以评估大脑年龄。...，p<0.001；R2=0.69) ，MDD测试样本 (男性r=0.77，p<0.001；R2=0.57，女性r=0.78，p<0.001；R2=0.59 ) ，以及ENIGMA BD工作组中完全独立的健康对照样本...对于ENIGMA MDD和BD工作组的受试者，还绘制了每个站点和年龄组的预测误差图。...请注意，我们使用下述公式，用R语言的caret包计算R2： R2 = 1-\frac{∑ (y_i - \hat{y}_i)2}{∑ (y_i - \bar{y}_i)2} 上式中R2也可能为负

3724 0

智能主题检测与无监督机器学习：识别颜色教程

最后，你将看到如何将非监督分类应用于其他类型的数据，包括在特定类别下对股票和债券ETF基金进行分类。...在完成本教程之后，你将了解如何将无人监督的机器学习应用到各种主题，包括其他数字数据、行业特定主题、自然语言处理，甚至文本中。一堆漂亮的颜色让我们通过生成一组不同的颜色来开始本教程。...在图表上绘制颜色我们可以使用如下所示的R代码来生成一组随机颜色并将它们转换为数值表示。...请注意，底部的大多数蓝色点被分配给集群1(“蓝色组”)。在图的底部也有几个点被分配给集群3(“绿色组”)。记住，我们要根据一个简单的数学公式，把原始的红，绿，和蓝色的值转换成数值。...它们被绘制在图表的顶部，因为它们的数值来自于我们的简单公式，但是它们被分组到“绿色”集群中，因为它们的rgb值仍然在训练的“绿色”组的范围内。毕竟，黄色就在绿色的旁边。

2.4K4 0

Trans论文 | Proposal Learning用于半监督的目标检测

Problem Definition 在半监督目标检测（ Semi-Supervised Object Detec- tion (SSOD) ）中，一组标记数据D_l={（I，G）}和一组给出了未标记数据的...在目标检测中，G由一组具有位置和目标类的对象组成。SSOD的目标是训练目标检测器，包括标记数据D_l和未标记数据D_u。...IEEE transactions on pattern analysis and machine intelligence, 39(6):1137–1149, 2017 将上面公式中定义的标准全监督损失应用于标记数据...通过优化反向传播过程中的损失方程中的θb，θrpn，θr-cnn，θcls，θreg，θself，对目标检测器进行了训练： ? 然后将总损失写成如下： ?...结合上面的两个公式中的候选位置损失以及对比损失，自监督的候选学习损失写为： ?

1.5K3 0

论文阅读报告_小论文

此外，本文展示了如何将本体论知识整合到因子分解中以提高学习结果，以及如何将计算分布到多个节点上。通过实验表明，我们的方法在与关联数据相关的几个关系学习任务中取得了良好的结果。...与其他张量分解相比，RESCAL的主要优势在于：当应用于关系数据时，它可以利用集体学习效应。集体学习是指在跨越多个互连的实体和关系中自动开发属性和关系相关性。...众所周知，将集体学习方法应用于关系数据可以显著改善学习结果。例如，考虑预测美利坚合众国总统的党籍的任务。自然而然地，总统和他的副总统的党籍是高度相关的，因为两人大部分都是同一党的成员。...实体由数据中所有资源、类和空白节点的集合给出，而关系集由包含实体-实体关系的所有谓词组成。对于每个现有的三元组(第i个实体、第k个关系、第j个实体)，对应的条目Xijk被设置为1，否则它被设置为0。...给定一个规模为n×n×m的张量X，RESCAL计算X的因数分解，使得X的每个切片Xk被因数分解成矩阵积其中A是n×r矩阵，Rk是一个完整的、非对称的r×r矩阵，r是给定的参数，指定潜在成分或因子的数量

8173 0

百度Apollo发布海量自动驾驶数据集，还有两项重磅挑战赛

姿势文件中每行的格式如下所示： r00 r01 r02 t0 r10 r11 r12 t1 r20 r21 r22 t2 0 0 0 1 image_name 相机已经很好地经过了校准。...基于数据集，他们定义了一组现实问题，并鼓励为自动驾驶创造新算法，而不只是应用于自动驾驶。数据集我们收集并注释了两个大型数据集。第一个由 Berkeley DeepDrive（BDD）提供。...BDD 集包括 100K 个短视频剪辑（每个视频剪辑为 40 秒），每个视频剪辑中的一个关键帧都会进行注释。第二套 ApolloScape 集由百度提供。...任务 4：实例级视频可移动对象分割（Instance-level Video Movable Object Segmentation）在这个任务中，给予参与者一组具有良好像素级标记的视频序列，特别是车辆和行人等移动对象的实例也是标记...这项挑战将自动驾驶车辆投入到一个仿真路网中行驶，可以模仿真实的复杂驾驶场景和多车博弈过程，是目前最先进的智能驾驶仿真技术之一。

1.9K3 0

手把手教线性回归分析（附R语言实例）

本文将介绍如何将回归方法应用到你自己的数据中，主要介绍学习内容：用线性回归方法来拟合数据方程的基本统计原则和它们如何描述数据元素之间的关系。...无论我们用什么软件来做线性回归（本文中的例子统一采用R语言），它都会用某种形式来报告这两个数值。截距就是我们的公式中的b，斜率就是Y和自变量之间的倾斜程度。...之所以发生这种情况，是因为lm()函数自动将一种称为虚拟编码(dummy coding)的技术应用于模型所包含的每一个因子类型的变量中。...在我们的模型中，R自动保留sexfemale、smokerno和regionnortheast变量，使东北地区的女性非吸烟者作为参照组。...如果怀疑两个变量相互作用，那么可以通过在模型中添加它们的相互作用来检验这一假设，可以使用R中的公式语法来指定相互作用的影响。

6.8K3 2

RS Meet DL(52)-基于注意力机制的用户行为建模框架ATRank

本文来介绍一下阿里巴巴数据技术团队与北京大学共同提出的 ATRank ，ATRank是基于注意力机制的用户异构行为建模框架，可应用于推荐系统中，一起来了解一下吧。...对于用户在bgi这一组中的某一个行为(aj,oj,tj)，我们会将aj、oj、tj分别转换为嵌入向量。 ? 这里按照不同的组bgi进行划分的主要原因是针对不同的组，特征o是不同的。...这里文中提到了一种离散化的表示方法，将时间间隔按照如下的区间进行离散化： ? 在得到每个行为的embedding表示后，可以根据组别，得到每个组的embedding表示： ? 其中： ?...2.4 Latent Semantic Spaces 由于每组中行为的最终embedding长度不一，同时所处的向量空间也不同。这里其实就是通过线性变换来将其统一到同一个语义空间。具体来说： ?...这里仍然使用类似于self-attention的过程： ? ? 数学公式是不是看着头大？还是用excel来表示一下吧，假设下游任务是一个物品相关的行为： ?

1K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭