使用抽样权重计算观察值的数量_通过matlab组计算观察值的数量_计算观察值的数量和变化的次数 - 腾讯云开发者社区

我在Stata中有一个time-id调查数据集，其采样权重如下： ID time var1 var2 weight1 1998 2 12002 1997 2 . 13.2 2 1998 3 5 150 我想计算所有每年有var1==1或var1==2的人，考虑到上面给出的采样重量。我知道如何在不考虑权重的情况下计算观察<e

浏览 17提问于2021-08-14得票数 0

回答已采纳

1回答

使用测量包对堆叠估算的观测值进行加权

、、、

我正在探索模型变量在估算数据中的选择。一种技术是以长格式堆叠计算(其中M个加密数据集中的n个观测值创建了一个数据集number )，并使用加权回归来减少每个观测值对估算数的贡献。我试图使用svyglm中的svyglm参数来解释堆叠的数据，由此产生的use是你期望的n个观测量，而不是n×M值。0.076955 0.032265 2.385 0.0171

浏览 2提问于2021-09-14得票数 1

回答已采纳

2回答

创建一个带有权重的表

、

我正在使用Stata创建一个表，按权重汇总观察值的数量。Education1 Education2Gender2 0 4.3 因此，我将相应条目中第三列加权的观测值求和例如，对于Gender2和Education2，我有两个观察值，它们的权重分别为3.0和1.3。因此，我只<e

浏览 6提问于2016-11-19得票数 0

1回答

h2o中随机森林概率标定的几个问题

、

我正在阅读h2o文档中校准概率的示例。如果是的话，这些重量是做什么的？

浏览 0提问于2019-05-01得票数 0

1回答

在蟒蛇种群取样时，如何创建一个“权重”字段？

、、

我正在对一个群体进行抽样，我想知道是否有一种简单的方法来生成一个名为“权重”的列，该列表示抽样数据中的样本权重。import pandas as pd Age1 203 565 57我随

浏览 3提问于2021-03-20得票数 2

回答已采纳

2回答

随机梯度下降中的随机部分是什么？

、、

根据我的理解，一个随机过程，其值在某一时刻取决于先前采取的值，而且每次运行该过程时，所选择的路径可能是不同的。在一定的初始播种值之后，我们只能知道这个过程的限制和限制。利用随机梯度下降法对神经网络的权值进行更新。它的随机部分是什么？在对变量进行某些初始化之后，如果在每次测试初始化后提供相同的输入数据集，则累积的错误函数将是相同的

浏览 0提问于2017-09-28得票数 3

1回答

在MATLAB中如何选择RELIEFF算法中的k值

、、

我使用relieff算法来研究各种输入的排序，以解决一个分类问题。我有五个输入和大约500个观察。我用MATLAB来解决这个问题。我想知道如何为

浏览 5提问于2016-03-13得票数 2

1回答

在R中使用hclust进行加权观测频率聚类

、、、

我有一个包含500K观察值的大型矩阵，需要使用分层聚类进行聚类。由于大小，我没有计算距离矩阵的计算能力。为了克服这个问题，我选择聚合我的矩阵来合并那些相同的观察值，从而将我的矩阵减少到大约10K个观察值。我有这个聚合矩阵中每一行的频率。我现在需要将此频率作为权重合并到我的分层聚类中。这些数据是

浏览 15提问于2017-07-25得票数 1

1回答

无替换和负权重的加权抽样

、、、、

我有一个不寻常的采样问题，我试图为蒙特卡洛技术实现它。我知道关于完全肯定的问题有相关的问题和答案。p(s_1，.... + w_s_k| / P_total 其中P_total是归一化因子(所有可能的p(s，...)之和)没有P_total)。我并不真正关心元素是如何按照我的目的排序的。

浏览 3提问于2015-02-26得票数 0

2回答

支持加权协方差计算的Python包

、、、、

是否有python统计包支持计算加权协方差(即，每个观察值都有一个权重)？不幸的是，numpy.cov不支持权重。最好在numpy/scipy框架下工作(即，能够使用numpy数组来加速计算)。

浏览 0提问于2012-07-12得票数 11

回答已采纳

2回答

计算人口均值协方差的NumPy矢量化方法(用于调查数据)

、、、、

为了克服这一问题，经常会对地层进行过采样，因此您希望正确和有效的答复的数量至少将与您所期望的样本大小相同。当将响应放在一起进行分析时，需要对响应进行加权，这样分析就可以根据样本估计整个人口的样子。由于抽样本身是如此复杂，而且抽样本身是基于其他调查，因此存在调查的缺点，所以权重并不是一个单一的数字。权重有自己的分布。如果一个人只想计算数据的中心趋

浏览 1提问于2015-12-12得票数 2

回答已采纳

1回答

sample()命令在R中太慢

、

我想创建一个非常大(大约200万行)的data.table df的随机子集。数据表有一个权重列wgt，它指示每行代表多少个观察值。为了生成我想要提取的行号的向量，我按照以下步骤进行：ns<- length(df$wgt)lines<-round(0.3*ns)pr

浏览 2提问于2015-07-21得票数 1

1回答

复杂测量设计(nhanesIII)的估算

、

我想为一个复杂的调查设计计算数据。我有复制重量(大约50)和抽样重量。虽然我找到了一个如何在R中进行计算的例子(见下文)，但它有一个抽样权重的位置(weight=~WTPFQX6，参见下面带有“设计”的一行)，但是没有复制权重的位置。你能帮我弄清楚如何用复制权来计算数据吗？

浏览 0提问于2014-12-04得票数 2

回答已采纳

1回答

熊猫:加权聚合

、、

就目前而言，我正在计算我的时刻，使用的是 moments = df_sum.groupby(level=[0,1])['myCol'].agg([np.min, np.median, np.mean,也就是说，如果一个列的权重是2，那么在计算平均值、std等时，观察应该计算两次。我想使用weights列重复我的计算。一种蛮力的方法是使用

浏览 1提问于2015-02-01得票数 1

1回答

网格发射器的PDF？

、

我正在尝试学习多重重要性抽样(MIS)，我需要根据每种抽样技术的PDF来计算样本的权重。我理解来自BRDF的PDF，以及基于光的半径命中特定球面光的PDF。但是对于网格发射器，我如何计算命中发射器的PDF？只是发射三角形的立体角度吗？

浏览 1提问于2016-09-03得票数 0

1回答

在Matlab中计算大数据集和不同均值的协方差

、、

我现在陷入了M步，因为我不知道如何计算协方差矩阵。有没有办法调整cov()以使用我想要的均值？或者有没有其他方法可以在没有for循环的情况下做到这一点？编辑:忘记解释数据矩阵是什么样子的。它是一个nx3，其中每一行都是一个数据点。从技术上讲，它

浏览 2提问于2017-11-29得票数 0

1回答

在one-hot编码期间/之后，是否可以使用另一列的值来代替binary标志？

、、

我想知道是否有任何方法可以在one-hot编码后将我的分类列转换为来自另一列的值，而不是其中一个类别中的二进制"1“？我的数据帧如下所示：1 TEXAS 12342 1在标签和one-hot0 12342 1 2 0 1 23423 4

浏览 20提问于2019-07-24得票数 0

回答已采纳

3回答

采样组的算法以匹配预期的比例

、、

我需要找到一种方法来对组进行抽样，以便观察到的比例与预期的比例相匹配。我希望在每组中保留尽可能多的观察结果。简单示例:A组= 302 (60.3%) B组= 199 (39.7%)有没有办法在SAS或R中编写一条规则，为

浏览 8提问于2013-03-08得票数 3

回答已采纳

2回答

如何创建基于两个数组的多数票？

、、

设想情况：因此，M观察者将从3个类(1,2,3)中选择关于N观测的猜测。对于每一个观察，每个观察者都有一个与之相关的权重。定义： W：每个观测/观察者的权重</em

浏览 2提问于2021-01-27得票数 1

回答已采纳

2回答

线性回归的时间复杂度是多少？

、、、、

我的工作是线性回归，我想知道时间复杂性的大-O表示法。没有优化算法(如梯度下降)的线性回归的代价函数需要在权重组合的迭代中计算(作为蛮力方法)。这使得计算时间取决于权重的数量，并且明显地取决于训练数据的数量。如果$n$是训练数据的数量，则$W$是权重的数量，而权重<

浏览 0提问于2018-07-20得票数 10

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云