腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
抽样
权重
计算
观察
值
的
数量
stata
我在Stata中有一个time-id调查数据集,其采样
权重
如下: ID time var1 var2 weight1 1998 2 12002 1997 2 . 13.2 2 1998 3 5 150 我想
计算
所有每年有var1==1或var1==2的人,考虑到上面给出
的
采样重量。我知道如何在不考虑
权重
的
情况下
计算
观察
<e
浏览 17
提问于2021-08-14
得票数 0
回答已采纳
1
回答
使用
测量包对堆叠估算
的
观测
值
进行加权
glm
、
survey
、
imputation
、
weighted
我正在探索模型变量在估算数据中
的
选择。 一种技术是以长格式堆叠
计算
(其中M个加密数据集中
的
n个观测
值
创建了一个数据集number ),并
使用
加权回归来减少每个观测
值
对估算数
的
贡献。我试图
使用
svyglm中
的
svyglm参数来解释堆叠
的
数据,由此产生
的
use是你期望
的
n个观测量,而不是n×M
值
。0.076955 0.032265 2.385 0.0171
浏览 2
提问于2021-09-14
得票数 1
回答已采纳
2
回答
创建一个带有
权重
的
表
dataset
、
stata
我正在
使用
Stata创建一个表,按
权重
汇总
观察
值
的
数量
。Education1 Education2Gender2 0 4.3 因此,我将相应条目中第三列加权
的
观测
值
求和例如,对于Gender2和Education2,我有两个
观察
值
,它们
的
权重
分别为3.0和1.3。因此,我只<e
浏览 6
提问于2016-11-19
得票数 0
1
回答
h2o中随机森林概率标定
的
几个问题
python
、
h2o
我正在阅读h2o文档中校准概率
的
示例。 如果是的话,这些重量是做什么
的
?
浏览 0
提问于2019-05-01
得票数 0
1
回答
在蟒蛇种群取样时,如何创建一个“
权重
”字段?
python
、
pandas
、
sample
我正在对一个群体进行
抽样
,我想知道是否有一种简单
的
方法来生成一个名为“
权重
”
的
列,该列表示
抽样
数据中
的
样本
权重
。import pandas as pd Age1 203 565 57我随
浏览 3
提问于2021-03-20
得票数 2
回答已采纳
2
回答
随机梯度下降中
的
随机部分是什么?
neural-network
、
optimization
、
gradient-descent
根据我
的
理解,一个随机过程,其
值
在某一时刻取决于先前采取
的
值
,而且每次运行该过程时,所选择
的
路径可能是不同
的
。在一定
的
初始播种
值
之后,我们只能知道这个过程
的
限制和限制。利用随机梯度下降法对神经网络
的
权
值
进行更新。它
的
随机部分是什么?在对变量进行某些初始化之后,如果在每次测试初始化后提供相同
的
输入数据集,则累积
的
错误函数将是相同
的
浏览 0
提问于2017-09-28
得票数 3
1
回答
在MATLAB中如何选择RELIEFF算法中
的
k
值
algorithm
、
matlab
、
machine-learning
我
使用
relieff算法来研究各种输入
的
排序,以解决一个分类问题。我有五个输入和大约500个
观察
。我用MATLAB来解决这个问题。我想知道如何为
浏览 5
提问于2016-03-13
得票数 2
1
回答
在R中
使用
hclust进行加权观测频率聚类
r
、
cluster-analysis
、
hierarchical-clustering
、
hclust
我有一个包含500K
观察
值
的
大型矩阵,需要
使用
分层聚类进行聚类。由于大小,我没有
计算
距离矩阵
的
计算
能力。为了克服这个问题,我选择聚合我
的
矩阵来合并那些相同
的
观察
值
,从而将我
的
矩阵减少到大约10K个
观察
值
。我有这个聚合矩阵中每一行
的
频率。我现在需要将此频率作为
权重
合并到我
的
分层聚类中。这些数据是
浏览 15
提问于2017-07-25
得票数 1
1
回答
无替换和负
权重
的
加权
抽样
algorithm
、
math
、
statistics
、
probability
、
random-sample
我有一个不寻常
的
采样问题,我试图为蒙特卡洛技术实现它。我知道关于完全肯定
的
问题有相关
的
问题和答案。p(s_1,.... + w_s_k| / P_total 其中P_total是归一化因子(所有可能
的
p(s,...)之和)没有P_total)。我并不真正关心元素是如何按照我
的
目的排序
的
。
浏览 3
提问于2015-02-26
得票数 0
2
回答
支持加权协方差
计算
的
Python包
python
、
numpy
、
statistics
、
scipy
、
covariance
是否有python统计包支持
计算
加权协方差(即,每个
观察
值
都有一个
权重
)?不幸
的
是,numpy.cov不支持
权重
。 最好在numpy/scipy框架下工作(即,能够
使用
numpy数组来加速
计算
)。
浏览 0
提问于2012-07-12
得票数 11
回答已采纳
2
回答
计算
人口均值协方差
的
NumPy矢量化方法(用于调查数据)
python
、
algorithm
、
performance
、
numpy
、
vectorization
为了克服这一问题,经常会对地层进行过采样,因此您希望正确和有效
的
答复
的
数量
至少将与您所期望
的
样本大小相同。 当将响应放在一起进行分析时,需要对响应进行加权,这样分析就可以根据样本估计整个人口
的
样子。由于
抽样
本身是如此复杂,而且
抽样
本身是基于其他调查,因此存在调查
的
缺点,所以
权重
并不是一个单一
的
数字。
权重
有自己
的
分布。如果一个人只想
计算
数据
的
中心趋
浏览 1
提问于2015-12-12
得票数 2
回答已采纳
1
回答
sample()命令在R中太慢
r
、
random-sample
我想创建一个非常大(大约200万行)
的
data.table df
的
随机子集。数据表有一个
权重
列wgt,它指示每行代表多少个
观察
值
。为了生成我想要提取
的
行号
的
向量,我按照以下步骤进行:ns<- length(df$wgt)lines<-round(0.3*ns)pr
浏览 2
提问于2015-07-21
得票数 1
1
回答
复杂测量设计(nhanesIII)
的
估算
r
、
survey
我想为一个复杂
的
调查设计
计算
数据。我有复制重量(大约50)和
抽样
重量。虽然我找到了一个如何在R中进行
计算
的
例子(见下文),但它有一个
抽样
权重
的
位置(weight=~WTPFQX6,参见下面带有“设计”
的
一行),但是没有复制
权重
的
位置。你能帮我弄清楚如何用复制权来
计算
数据吗?
浏览 0
提问于2014-12-04
得票数 2
回答已采纳
1
回答
熊猫:加权聚合
python
、
numpy
、
pandas
就目前而言,我正在
计算
我
的
时刻,
使用
的
是 moments = df_sum.groupby(level=[0,1])['myCol'].agg([np.min, np.median, np.mean,也就是说,如果一个列
的
权重
是2,那么在
计算
平均值、std等时,
观察
应该
计算
两次。我想
使用
weights列重复我
的
计算
。一种蛮力
的
方法是
使用
浏览 1
提问于2015-02-01
得票数 1
1
回答
网格发射器
的
PDF?
graphics
、
raytracing
我正在尝试学习多重重要性
抽样
(MIS),我需要根据每种
抽样
技术
的
PDF来
计算
样本
的
权重
。我理解来自BRDF
的
PDF,以及基于光
的
半径命中特定球面光
的
PDF。但是对于网格发射器,我如何
计算
命中发射器
的
PDF?只是发射三角形
的
立体角度吗?
浏览 1
提问于2016-09-03
得票数 0
1
回答
在Matlab中
计算
大数据集和不同均值
的
协方差
matlab
、
classification
、
covariance
我现在陷入了M步,因为我不知道如何
计算
协方差矩阵。 有没有办法调整cov()以
使用
我想要
的
均值?或者有没有其他方法可以在没有for循环
的
情况下做到这一点? 编辑:忘记解释数据矩阵是什么样子
的
。它是一个nx3,其中每一行都是一个数据点。从技术上讲,它
浏览 2
提问于2017-11-29
得票数 0
1
回答
在one-hot编码期间/之后,是否可以
使用
另一列
的
值
来代替binary标志?
python
、
machine-learning
、
one-hot-encoding
我想知道是否有任何方法可以在one-hot编码后将我
的
分类列转换为来自另一列
的
值
,而不是其中一个类别中
的
二进制"1“?我
的
数据帧如下所示:1 TEXAS 12342 1在标签和one-hot0 12342 1 2 0 1 23423 4
浏览 20
提问于2019-07-24
得票数 0
回答已采纳
3
回答
采样组
的
算法以匹配预期
的
比例
r
、
sas
、
frequency
我需要找到一种方法来对组进行
抽样
,以便
观察
到
的
比例与预期
的
比例相匹配。我希望在每组中保留尽可能多
的
观察
结果。简单示例:A组= 302 (60.3%) B组= 199 (39.7%)有没有办法在SAS或R中编写一条规则,为
浏览 8
提问于2013-03-08
得票数 3
回答已采纳
2
回答
如何创建基于两个数组
的
多数票?
python
、
numpy
、
matrix
设想情况:因此,M
观察
者将从3个类(1,2,3)中选择关于N观测
的
猜测。对于每一个
观察
,每个
观察
者都有一个与之相关
的
权重
。定义: W:每个观测/
观察
者
的
权重</em
浏览 2
提问于2021-01-27
得票数 1
回答已采纳
2
回答
线性回归
的
时间复杂度是多少?
machine-learning
、
regression
、
statistics
、
linear-regression
、
cost-function
我
的
工作是线性回归,我想知道时间复杂性
的
大-O表示法。没有优化算法(如梯度下降)
的
线性回归
的
代价函数需要在
权重
组合
的
迭代中
计算
(作为蛮力方法)。这使得
计算
时间取决于
权重
的
数量
,并且明显地取决于训练数据
的
数量
。 如果$n$是训练数据
的
数量
,则$W$是
权重
的
数量
,而
权重<
浏览 0
提问于2018-07-20
得票数 10
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用磁性斯格明子实现高效计算的飞跃,功耗可能降低3个数量级
深度学习之卷积神经网络
贝叶斯神经网络系列教程(二):背景知识
随机森林概述
非平衡数据的处理方法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券