如何在R中将一个向量分成具有相等数量的观察值的组？

在R中，可以使用函数cut()将一个向量分成具有相等数量的观察值的组。

cut()函数的语法如下：

cut(x, breaks, labels = NULL, include.lowest = FALSE, right = TRUE, dig.lab = 3, ordered_result = FALSE, ...)

参数说明：

x：要分组的向量。
breaks：指定分组的方式，可以是一个整数表示分组的数量，也可以是一个向量表示每个分组的边界值。
labels：可选参数，用于指定每个分组的标签。
include.lowest：逻辑值，表示是否包含最小值所在的组。
right：逻辑值，表示是否右闭合区间。
dig.lab：整数，表示标签的小数位数。
ordered_result：逻辑值，表示是否返回有序的分组结果。
...：其他参数。

示例代码如下：

# 创建一个向量
vec <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

# 将向量分成具有相等数量的观察值的组
groups <- cut(vec, breaks = 5)

# 打印分组结果
print(groups)

输出结果如下：

[1] (0.992,2] (0.992,2] (2,3]     (3,4]     (4,5]     (5,6]     (6,7]     (7,8]     (8,9]     (9,10]   
Levels: (0.992,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10]

以上代码将向量vec分成了5个组，每个组具有相等数量的观察值。分组结果以区间的形式表示，例如(0.992,2]表示观察值在0.992和2之间。

对于腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体的云计算品牌商，无法提供相关链接。但是可以通过搜索引擎或腾讯云官方网站获取相关信息。

相关·内容

基于TensorFlow Eager Execution的简单神经网络模型

架构和符号该示例中构建的神经网络由输入层，一个隐藏层和输出层组成。输入层包含3个节点，隐藏层20个节点，输出层包含1个节点。输出值是连续的（即神经网络执行回归）。...输入，隐藏和输出层的值以及层之间的权重可以表示为矩阵。隐藏和输出层的偏差可以表示为向量（具有一行或一列的矩阵的特殊情况）。下图显示了每个矩阵和向量的尺寸。...通过这种方法，创建了两组独立的数据，一组用于训练，另一组用于评估。每组数据包含1个输入数组和1个输出数组。输入数组的形状（观察数量，特征数量），而输出数组的形状（观察数量，每次观察的输出值数量）。...特征的数量对应于输入层中的节点的数量，而每个观察的输出值的数量对应于输出层中的节点的数量。生成数据后，将测试数据分批，以便进行更有效的评估。列车数据也将分成批次，但在训练过程中完成。...作为旁注，如果预期输出是分类的，则在第二个等式中将需要诸如sigmoid或softmax的非线性变换函数。

7542 0

挑战NumPy100关，全部搞定你就NumPy大师了 | 附答案

如何在向量中找到最接近的值（给定标量）？(★★☆) 51. 创建一个表示位置（x，y）和颜色（r，g，b）的结构化数组（★★☆） 52....创建一个具有name属性的数组类(★★☆) 64. 设有一个给定的向量，如何让每个能被第二个向量索引的元素加1（注意重复索引的情况）？（★★★） 65....设有一个任意数组，编写一个函数，以给定元素为中心, 提取具有固定形状的子部分（必要时可以用固定值来做填充）(★★★) ? 81....求一个矩阵的秩 (★★★) 秩(RANK), 我们知道线性代数中的矩阵, 有一种含义就是代表一个方程组, 矩阵的秩就是这个方程组中那些原有的成员的数量 83....设有一个10x3矩阵，请找出其中数值不完全相等的行 (e.g. [2,2,3]) (★★★) 95. 将int的向量转换为二元矩阵来表示(★★★) 96.

4.8K3 0

Plos Comput Biol: 降维分析中的十个重要tips!

缩放步骤确保每个变量的贡献相等，这对于包含具有高度可变范围或不同单元异构特征的数据集尤其重要，例如患者临床数据或环境因素数据。...请记住，维度的数量最多可以是数据中观察数(行)和变量数(列)的最小值。...特征向量之间的夹角或与PC轴之间的夹角具有重要意义:向量之间的夹角大约为0度(180度)，表明相应的变量密切、正(负)相关，而向量之间的夹角为90度表示大致独立。...如图4所示的biplot允许同时探索数据样本和特征中的趋势;同时查看这两种变量，可能会发现相似(近距离)的观察组对某些测量变量具有高或低的值。...虽然由这些组成部分组成的子空间是有意义的，但特征向量(PCs)不是单独提供信息的，它们不能单独解释，因为即使是一个观察中的一个非常微小的变化也会导致一个完全不同的特征向量集合。

1.1K4 1

股票收益分布一致性检验KS检验KOLMOGOROV-SMIRNOV、置换检验PERMUTATION TEST可视化

介于 0 和 1 之间（通过构造，因为我们减去两个概率并取绝对值）。是一个 Brownian bridge. （最大）差异具有已知分布。...在我们的例子中，因为我们把收益率聚集在一个向量中，对向量进行排列意味着2018年的每日收益率现在分散在向量中，所以像上面的方程那样取一个差值，就像从一个无效假设中进行模拟：2018年每日收益率的分布与其他的完全相同...现在，对于每个x，我们将有一个在原假设下的差异。我们也有每个x的实际差异，来自我们的观察数据。...我们现在可以将密度之间的实际差异（每个x）平方（或取绝对值），并将其与我们从 "数据 "生成的模拟结果进行比较。通过观察实际差异落在模拟差异的哪个四分位数，可以估计出p值。...两个参数 boot 和grid 是您想要的模拟数量以及您在计算 x 时想要使用的网格点数 . 因此 ngrid=100 。 # 我们需要两组的索引，2018年和其他的。

4374 0

【Embedding】LINE：大规模信息网络的潜入方法

LINE 2.1 First-order 很多 NetWork Embedding 算法只观察到了节点的链路表示，这种关系只具有 first-order 相似性，并没有捕捉到节点间更多的关系。...所以，该如何设定一个较好的学习率以应对边的权值方差较大的现象？ 3.2 Edge Sampling 一种直接的想法是：导致这种问题的原因是边的权值，如果另所有边的权值相等就不会在出现这种问题了。...因此一个简单的方法就是将一个加权边分成多个权值为 1 的二元边，例如：一个权值为 4 的边，我们可以将其分成 4 个权值为 1 的二元边。但这样又会出现新的问题：内存开销过大。...我们构造两个大小相同的数组分别为概率表 Prob 和别名表 Alias，概率表为原始列在现有情况下的概率，如概率值为的第一列对应现在的概率值为，概率值为的第二列对应的现在的概率值为...还有参数敏感性（这里的稀疏性只和自己进行了比较，但我们要知道具有 second-order 相似性的节点数量比具有 first-order 相似性的节点数量要多出很多，所以 LINE 是非常适用于稀疏网络的

1.1K2 0

tcR包：T细胞受体和免疫球蛋白数据进行高级分析和可视化（二）

（2）主成分分析Principal Component Analysis (PCA) 主成分分析(PCA)是一种将一组观测值转换为一组特殊值进行分析的统计过程。...twb[[1]]和twb[[2]]中同时存在的元素（2）“Top cross” 在最丰富的克隆型中，共有克隆型的数量可能与那些具有较少计数的克隆型显著不同。...比如当且仅当它们的CDR3 aa序列相等且它们的V基因相等时，一个CDR3克隆型与另一个CDR3克隆型是相等的。...#'avrc'中的第一个字母a表示使用CDR3氨基酸序列，若换成n表示核苷酸序列 #'avrc'中的第二个字母v表示是否使用V.gene列，若换成0代表不使用 #'avrc'中的第三个字母r表示选择带有数字字符的列时使用...kmers的向量 #K是代表kmer的大小，kmers是指将序列分为k个碱基的字符串 d <- kmer.profile(km) #返回给定字符向量或数据框具有相同长度序列的配置文件 vis.logo(

3K3 0

Bengio2310：以对象为中心的架构支持高效的因果表示学习

在本文中，我们展示了通过利用以对象为中心的架构，我们有效地将多对象问题简化为一组单对象去耦问题，这不仅解决了单射性失败的问题，而且还显著减少了我们需要观察的扰动数量，以便使用Ahuja等人（2022b）...每个对象由一个d维属性向量zi ∈ Rd描述，因此vec(Z) ∈ Rkd。我们说对象具有共享属性，如果zi的坐标在对象之间具有一致的含义。...我们观察到的图像x是通过生成函数g(·)生成的，该函数将一组对象属性渲染成像素空间中的一个场景，即x = g(Z)。...这样做的原因很简单：通常更容易在一小组相关对象上进行推理，而不是例如一个大的特征向量网格。以这种方式表示数据具有下游优势，如更好的鲁棒性（Huang等人，2020）。...在这两个数据集中，对象级的真实潜在值由z = (px, py, h, s, r, ϕ)组成，其中px, py表示对象中心的坐标，然后是颜色色调h、形状s、大小r和绕z轴的旋转角度ϕ。

701 0

基尼系数近似计算：sql （hive）实现简单高效

通过近似的方法，如何在sql中计算基尼系数。如何在python中实现基尼系数计算的两种方法，可以查看我的另一篇文章。两篇文章取数相同，可以结合去看。...如果样本数量为100个，如果分组数量为100，近似的方法取得的结果跟实际值相等。但随着分组数量的减少，精确度也减少。本文是在hive中实现，需要使用到hive中的over函数。...-- 这里由于over函数计算cumsum的特殊性，先进行分组。 -- 这里显示的是分成9组 -- 9出现在两个地方：第二行，最后的计算公式中，还有就是出现在ntile之后，分成9组的时候。...-- 而且上面的文章中也提到：分成了n组的情况下，1至n-1的w是需要加和的，而第n的w是不加入计算的。...，在python上精确的求曲线下方面积的结果是相等的。

1.5K2 0

条件随机场（CRF）的详细解释

条件随机场模型让我们假设一个马尔可夫随机场并将其分为两组随机变量 Y 和 X。...Evidence structure and domain：假设集合 X 中的随机变量是大小为 F 的实值向量，即∀ Xᵢ ϵ X, Xᵢ ϵ Rˢ。...请注意，参数的总数是 M x M + M x S，即每个标签转换有一个参数（M x M 个可能的标签转换）和每个标签（M 个可能的标签）的 S 个参数，这些参数将乘以该标签处的观察变量（大小为 S 的向量...数据集中的一些单词可视化结果如下：- 经过分析，我发现整个数据集中的唯一词数量只有 24 个。我们希望 CRF 模型能够学习标记观察值 (xᵢ)，这些观察结果是同时出现的字符像素向量。...为了解决这个问题，我决定使用所有字符向量表示来创建一个新的数据集。我为字典中的每个字符捕获了数据集中可用的所有不同字符像素向量变体。

1.3K3 0

【涨姿势】统计名词和数据挖掘术语大盘点

【顺序变量】是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量，具有等级性和次序性的特点。【等距变量】除能表明量的相对大小外，还具有相等的单位。...【比率变量】除了具有量的大小、相等单位外，还有绝对零点。...【众数】一个次数分布中出现次数最多的那个数，众数不唯一可有一个或多个。用符号Mo表示。【离中趋势】数据具有偏离中心位置的趋势，它反映了一组数据本身的离散程度和变异性程度。...【测验信度】测验在测量它所测特质时得到的分数（测值）的一致性。它是对测验控制误差能力的量度，是反映测验性能的一个重要质量指标【观察分数】如果从测验实施过程中实际得到的被试分数叫观察分数。...【真分数】被试在所测特质上客观具有的水平值。【测量误差】观察分数与真分数的差就是测量误差。

1.4K6 0

Unsupervised Learning of Latent Physical Properties Using

与先前仅使用关系网络预测具有已知属性值的对象状态的神经关系架构不同，我们使用关系网络来创建感知网络，其从观察中导出属性值，以及预测网络，它预测给定属性值的对象位置。...PPN能够纯粹通过观察由具有不同属性值的对象组成的系统的动态来导出与物理模拟相关的潜在属性的无监督表示。这些学到的表征可以直接转化为人类可解释的属性，例如质量和恢复系数。...， x （ N ） } 成为一组特定于对象的输出特征 { y （ 1 ）， ... ， y （ N ） } ，其中 Ñ 是在一个系统中的对象的数量。...3.3感知网络感知网络产生特定于对象的属性向量， Ž ，从观察到的状态的序列 Ó 。如图2所示，我们的感知网络是一个循环神经网络，它使用交互网络作为其核心重复单元。...为了测试我们的感知网络的泛化属性，我们在使用感知网络（在6个对象动力学上训练）和PCA来预测具有不同数量的对象的测试集的属性值时计算样本外的 R 2 ，如如表2所示。

9423 0

ESWC 2018 | R-GCN：基于图卷积网络的关系数据建模

对于R-GCN来讲，一个关键问题是如何在卷积过程中考虑到不同类型节点间的不同之处，也就是多关系间如何进行交互。...观察上式我们可以发现，R-GCN在将不同关系的节点特征进行聚合后，还需要加上自身节点的特征，最后通过一个激活函数就能得到更新后的节点特征。...正则化 R-GCN中需要为每一种类型的边指定一个转换函数 W ，如果一个网络拥有很多种关系，那么R-GCN中参数的数量也会急剧增长，造成巨大的计算开销。...具体来讲就是：可以发现，每个线性转换函数都是通过一组低维矩阵 Q_{br} 的和来定义，即：基函数分解可以看作是不同关系类型之间的有效权值共享形式，而块对角分解可以看作是对每种关系类型的权值矩阵的稀疏性约束...块对角分解结构编码了一种直觉，即潜在的特征可以被分为一组变量，这些变量在组内比在组间耦合更紧密。这两种分解都减少了高度多关系数据(如现实的知识库)需要学习的参数数量。 3.

7353 0

MATLAB数学建模之画图汇总

含多个输入参数的plot函数 plot函数可以包含若干组向量对，每一组可以绘制出一条曲线。...1e-2 ); %取y1与y2相等点的x坐标 x1 = x(k); % 求y1与y2值相等点的y坐标 y3 = 0.2 * exp(-0.5 * x1) .* cos(4 * pi * x1);...双纵坐标函数plotyy 在Matlab中，如果需要绘制出具有不同纵坐标标度的两个图形，可以使用plotyy函数，它能把具有不同量纲，不同数量级的两个函数绘制在同一个坐标中，有利于图形数据的对比分析...subplot（m，n，p）该函数把当前窗口分成m×n个绘图区，m行，每行n个绘图区，区号按行优先编号。其中第p个区为当前活动区。每一个绘图区允许以不同的坐标系单独绘制图形。...饼图 – pie(x)：绘制数据 x 的饼图，x 可以是向量或者矩阵，x 中的每一个元素将代表饼图的一个扇区，同时饼图中显示各元素总和的比例。

3K1 0

数学建模之MATLAB画图汇总

含多个输入参数的plot函数 plot函数可以包含若干组向量对，每一组可以绘制出一条曲线。...（近似相等）的下标 k = find( abs(y1-y2) < 1e-2 ); %取y1与y2相等点的x坐标 x1 = x(k); % 求y1与y2值相等点的y坐标 y3 = 0.2 *...双纵坐标函数plotyy 在Matlab中，如果需要绘制出具有不同纵坐标标度的两个图形，可以使用plotyy函数，它能把具有不同量纲，不同数量级的两个函数绘制在同一个坐标中，有利于图形数据的对比分析...饼图 – pie(x)：绘制数据 x 的饼图，x 可以是向量或者矩阵，x 中的每一个元素将代表饼图的一个扇区，同时饼图中显示各元素总和的比例。...– pie(x, explode)：绘制数据 x 的饼图，其中参数 explode 可以用来设置饼图中某个重要的扇区进行抽取式重点显示，这里需要注意的是，explode 向量的长度与 x 中的元素个数相等

2.8K3 0

GJR-GARCH和GARCH波动率预测普尔指数时间序列和Mincer Zarnowitz回归、DM检验、JB检验

矛盾的是，如果截距是0.02，这意味着为了使两边相等，我们在预测中平均增加0.02，所以它一直在低估观察值。斜率应该是1，也就是说，你的预测完全 "解释 "了观察值。 2....假设您有两个模型，它们产生两组预测。因此，您有两组误差。调用这些误差在两种方法相同的情况下，这两个向量的差平均为零（或这些向量的函数，例如 e1^2 – e2^2）。...如果不知道 2 的结果的可能性有多大，就不可能测量 0 和 2 之间的距离。在 {-3,3} 之间均匀分布的 2 的结果并不像具有标准正态分布的 2 的结果那样不可能。...实证研究中，前两个方案对一般的预测评估是有效的，然而，波动率是不可观察的，所以我们用什么作为观察值并不清楚。我们所做的是用一个替代物来代替 "观察到的"，通常是收益率的平方。...在这里你可以找到更准确的替代方法，但是，它们是基于日内信息的，所以你需要获得日内数据源。我们看看在 R 中是如何工作的。

9261 0

r语言求平均值_r语言计算中位数

平均值是通过取数值的总和并除以数据序列中的值的数量来计算，函数mean()用于在R中计算平均值，语法如下： mean(x, trim = 0, na.rm = FALSE, ...)...当我们提供trim参数时，向量中的值进行排序，然后从计算平均值中删除所需数量的观察值，例如，当trim = 0.3时，每一端的3个值将从计算中删除以找到均值。...na.rm – 用于从输入向量中删除缺少的值。众数是指给定的一组数据集合中出现次数最多的值，不同于平均值和中位数，众数可以同时具有数字和字符数据。...R没有标准的内置函数来计算众数，因此，我们将创建一个用户自定义函数来计算R中的数据集的众数。该函数将向量作为输入，并将众数值作为输出，来分别看下实例：输出结果为：好啦，本次记录就到这里了。...如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

2.1K1 0

遮挡人脸问题 | 详细解读Attention-Based方法解决遮挡人脸识别问题（附论文下载）

Aggregate模块将这些中间特征向量映射到联合特征空间中，得到最终特征向量$f\in R^{256}。...这样，每个attention maps的每个像素分别归一化为(0,1);此外，先使用Global Average Pooling (GAP)，然后使用，计算一个向量$s\in R^K}表示每个attention...对于CE损失添加一个全连接层到每个特征向量匹配训练数据集中类的数量。通过这种方法得到了K CE损失。...需要注意的是，由于最后一个全连接层的权值是共享的，所以每个的转换是相等的，因此，要保证它们同样编码身份信息，即位于相同的特征空间。...当考虑一个ResNet-50(没有微调)，它在训练期间从未暴露于部分脸，可以观察到标准FR模型非常容易受到partial faces的影响。

1.9K2 0

放弃反向传播后，Geoffrey Hinton参与的前向梯度学习重磅研究来了

该方法计算对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法，用来更新权值以最小化损失函数。...：「我通过让神经网络学习词向量表征，使之基于之前词的向量表征预测序列中的下一个词实现了这一点。」...研究团队通过设计具有大量局部贪心损失函数的架构，解决了前向梯度学习的可扩展性问题，其中将网络隔离为局部模块，从而减少了每个损失函数的可学习参数量。...限制可学习维度数量的一种方法是将网络划分为子模块，每个子模块都有一个单独的损失函数。因此，该研究通过增加局部损失函数的数量来抑制方差，具体包括： 1）Blockwise 损失。...为了创建多个损失，该研究将通道分成多个组，每个组都附加到一个损失函数（Patel et al., 2022）。为了防止组之间相互通信，通道仅连接同一组内的其他通道。

2072 0

「Workshop」第三十八期 Bootstrap

如图，如果不知道总体分布（或叫理论分布），那么，对总体分布的最好猜测便是由样本数据提供的（经验）分布。自助法的要点是：①假定观察值便是总体；②由这一假定的总体抽取样本，即再抽样。...相关R包boot的应用 boot扩展了自助法和重抽样的相关用途，可以借助它实现对一个统计量（如单个均值、单个中位数等，为一个数值）或多个统计量（如多变量间的相关系数、一列回归系数等，为一个数值向量）使用自助法...基本有三个步骤：(1) 写一个能返回待研究统计量值的函数。如果只有单个统计量（如中位数），函数应该返回一个数值；如果有一列统计量（如一列回归系数），函数应该返回一个向量。...##统计量将根据所选样本进行计算，结果存储在bootobject中，其中返回元素有： ##t0:从原始数据得到的k个统计量的观测值/t:一个R*k的矩阵，每行即k个统计量的自助重复值。...问题：假设有一个鱼塘有1000条鱼，但人们不知道该鱼数量。

1.7K2 0

大模型微调新范式：当LoRA遇见MoE

在该框架下，模型的某个模块（如Transformer的某个FFN层）会存在多组形状相同的权重（称为专家），另外有一个路由模块（Router）接受原始输入、输出各专家的激活权重，最终的输出为： • 如果是软路由...回顾下 IA3 的适配模块设计，即在Transformer的K、V和FFN的第一个全连接层的输出，各自点乘上一个可训练的向量 lk,lv,lff ： softmax(dkQ(lk⊙KT))(lv⊙V);...那么，MOV就是将这些可训练向量各自复制 n 份参数（n为专家个数），并加入一个路由模块接受K/V/FFN原本输出的隐向量 xhidden 、输出各专家的激活权重，过softmax之后得到各专家的激活概率...这样设计loss的用意是，对任意一种训练样本，两组LoRA专家组内的 I 值是相等的，优化 Llbc 即降低组内路由权重的方差，使得组内负载均衡；两组专家之间，设专家组A对当前类型的数据更擅长，则其 I...这样一来，即使推理阶段没有数据类型 I的信息，A对这种数据的路由值 Q 也会显著大于B的相应值，这就实现了两组专家各司其职的目标。

1.5K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云