腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(227)
视频
沙龙
1
回答
使用
两个
人口统计
变量
(
性别
和
年龄
)
重新
采样
数
据以
匹配
人口
概况
(
使用
R
)
r
、
loops
、
sampling
、
resampling
、
sample-data
我正在为
R
中的多级
采样
过程而苦苦挣扎。比方说,我有一个由非常有偏差的
采样
方法组成的数据集。因此,与参与者一起获得的结果是有偏见的。我想调整数据集以
匹配
两个
人口统计
变量
(
性别
和
年龄
),这
两个
变量
编码为数据集中的因子。下图描述了这种情况。 ? 我假设我将需要执行一个“循环”计算。举个例子:为了调整第一个
年龄
间隔(15-19)的样本大小,我需要定义一个新的总数,
浏览 43
提问于2021-09-17
得票数 1
回答已采纳
1
回答
我怎样才能把男性
和
女性的
人口
相加在一起,将
性别
作为一个
变量
移除在
人口统计
表中。在
R
工作室
r
、
pivot
、
demographics
我对
R
是新手,喜欢
使用
dplyr或tidyverse,因为这些是我们到目前为止
使用
的包。我确实搜索了一个类似的问题,但大多数与
性别
/
性别
相关的问题都是围绕着分离数据,或者对每个问题分别执行操作。我有一个
人口统计
表,以
年龄
、
年龄
和
性别
为
变量
(因素),以
人口
为因
变量
。我想创造一个图来显示
人口
是否正在老龄化,也就是说,显示不同
年龄</
浏览 2
提问于2020-09-07
得票数 0
回答已采纳
1
回答
R
从列中提取多个
变量
r
、
extract
、
tidyr
这一栏载有一段所列的
人口统计
资料,包括
年龄
(20、80)、
性别
(男性、女性)、就业(就业、未就业、退休)等。每个人都收到了一份关于
年龄
(20或80)、
性别
(男性或女性)、就业(就业、未就业、退休)的数据,等等。 (e.x.第一人收到:一名20岁男子失业。第二人收到:一名80岁女性退休。我尝试
使用
tidyr:提取(b)上的以提取其余的
人口统计
信息,并创建几个新的
变量
列,标记为“
年龄
”、“
性别
”、“就业”等。到目前为止,
浏览 2
提问于2020-05-24
得票数 2
回答已采纳
1
回答
用Pearson
r
检验回归两组
变量
的相关积分
和
p值
python
我正在做一个基本的python类的作业,我很困惑.有人能帮我计算皮尔逊
r
检验,返回两组
变量
的相关分数
和
p值吗?您将
使用
预先加载的DataFrame,其中包含有关全国不同地区的医疗费用以及其他
人口统计
数据的信息,包括
年龄
、
性别
、体重指数( BMI )、儿童人数、吸烟者与不吸烟者之间的信息。在这个挑战中,你将重点关注
年龄
和
收费、体重指数
和
收费之间的关系。 在开始之前,我们将向您介绍一个新的Python概念,以帮助您完成这
浏览 17
提问于2022-10-17
得票数 0
2
回答
保持行名的
r
中的chisquare测试
r
、
matrix
、
statistics
、
chi-squared
、
rowname
我正在用两次浪潮建立一项员工调查,我想确保每一波都在一些
人口
变量
(如种族
和
性别
)上得到平衡。sample_data) all entries of 'x' must be nonnegative and finiteIn chisq.test(sample_data_count) : Chi-squared approxima
浏览 3
提问于2020-02-19
得票数 2
回答已采纳
1
回答
ttest返回值在by,sort: in Stata中
static-analysis
、
stata
我有一个包含大约40个
变量
的数据集。其中大约一半是测量数据,另一半是关于该观测数据的
人口统计
学信息。每个id都有
两个
观察值: entry
和
exit。我正在比较入口
和
出口的测量均值。现在我需要根据
人口统计
变量
进行一些分组。by var1, sort: ttest var2 by stage stage是定义观察是进入还是退出的
变量
。var1是
人口统计
学
变量
之一(例如
性别
浏览 0
提问于2013-01-28
得票数 1
回答已采纳
1
回答
计算t-测试返回测试值
和
p-值。
python
我需要计算一个t检验,返回两组
变量
的测试值
和
p值。与上一次挑战一样,您将
使用
预先加载的DataFrame,其中包含关于全国不同地区的医疗费用以及其他
人口统计
数据的信息,包括
年龄
、
性别
、体重指数( BMI )、儿童数量、吸烟者与非吸烟者之间的信息。对于这一挑战,你将重点评估设定的
性别
和
收费,以及
性别
和
bmi。您还将从预加载的代码开始,该代码创建
两个
单独的DataFrames,每个代码包含
性别<
浏览 9
提问于2022-10-17
得票数 0
1
回答
32位
R
和
64位
R
:输出不同
r
我制作了一个脚本,根
据以
下
变量
预测工资:
性别
、
年龄
和
教育程度。我
使用
rpart函数。当我在32位
R
中运行代码时,输出与64位
R
版本不同。差别不是很大,但我不能决定哪一个输出是正确的。这是我
使用
的代码:tree <-rpart(wage ~ gender + age + education, method='class', data=Data, control=rpart.co
浏览 7
提问于2019-08-16
得票数 1
回答已采纳
1
回答
固定效应分组::etable()
r
0.30324> > etable(est_1, group = list("Origin and Destination and Product FEs"如果我试图通过在fixest中重复
变量
标签来欺骗se
浏览 4
提问于2021-03-23
得票数 2
3
回答
使用
R
绘制数据集中的对比图
r
、
graph
、
dataset
我有一组来自
两个
季节(冬季
和
夏季)的数据(1000+动物),我想展示这
两个
季节中妊娠长度(天数)模式的差异。
浏览 2
提问于2010-10-23
得票数 1
回答已采纳
2
回答
如何在亚马逊上模拟用户的购买行为?
machine-learning
、
data-mining
、
dataset
、
recommender-system
(我们可以用这个信息构造一个图,其中包括已查看
和
购买的信息),它还给出了14年来与每个产品相关的评论。利用所有这些信息,我们将在亚马逊上对产品进行评级。与第一跳或第五跳相比,一些用户
使用
also_bought
和
also_viewed链接到第三跳的频率更高。用户的行为是正态分布的。其他一些用户很难在第一跳之后导航。这组用户的行为呈指数分布。我们的教授说-无论用户遵循什么分布,用户都在
使用
类似产品的链接导航。您的排序算法还考虑了相似的b/w2产品排序产品。所以
使用
这个验证算法是有点cheating。
浏览 0
提问于2015-11-05
得票数 9
2
回答
使用
将等式应用于引用表的函数填充dataframe列。
r
、
dataframe
、
dplyr
、
purrr
假设你想用Z评分来计算一个病人的体重指数离
人口
中位数有多远。这是根据患者的BMI加上三个
年龄
和
性别
的因
变量
计算的。这三个
变量
是在一个表中查找的。 因此,我创建了一个以
年龄
、
性别
和
体重指数为输入的函数。它
使用
性别
来找到合适的表(男性或女性),
年龄
在该表中找到合适的行,然后在计算中
使用
BMI,其中包含了您刚刚查找到的特定
年龄
和
<em
浏览 3
提问于2021-06-23
得票数 1
回答已采纳
1
回答
SAS用PROC SQL INSERT语句
和
do循环填充表
loops
、
sas
、
insert-into
、
sas-macro
、
proc-sql
我想计算1961年至2013年不同人群的疾病频率:所有
年龄
的男性、50岁以上的男性
和
女性的
两个
病例。首先,我导入了一个名为“pop_compl”的
人口
表,该表包含了上述时间跨度中的男性(
性别
= 1)
和
女性(
性别
= 0,无意冒犯)的不同
年龄
段的
人口
数
。crude_incidence num(10), esr num(10), esr_95CI_ll num(10), esr_95CI_ul num(10)); 现在,我
浏览 3
提问于2014-12-16
得票数 0
回答已采纳
1
回答
调查权重
和
boostrap权重以获取计数
和
CI
r
、
statistics
、
survey
我的任务是创建特定
年龄
-
性别
组细分内的各种统计表。例如,有多少17岁到24岁的男性在服用处方药。对于每种类型的计算,我需要一个计数N
和
95%的CI。我对调查方法一点也不熟悉。据我所知,我不能简单地将每个类别的人数相加,以获得每个问题/类别的最终计数N(即,不能简单地将正在
使用
处方药的17至24岁的所有男性相加)。相反,在构建最终计数N
和
置信区间时,我必须考虑测量权重
和
自举权重。然后在STATA中我被告知这是一个单行命令: svyset [pw=SURV_WGT], br
浏览 5
提问于2017-08-12
得票数 0
回答已采纳
1
回答
如何在
R
中
使用
样本权重
r
、
r-lavaan
、
structural-equation-model
我将比较比利时瓦隆尼亚
和
佛兰德地区的人。我的
两个
样本需要进行加权,以便在
年龄
、
性别
、教育和政党选择方面代表他们的
人口
。我是
R
新手,阅读关于lavaan.survey
和
svydesign的文档来了解代码。然而,我还没有成功地写出正确的东西。显然,程序不能正确地读取抽样权重
变量
。 下面是我
使用
的
浏览 5
提问于2014-05-25
得票数 1
回答已采纳
4
回答
根据行中的值筛选
和
选择数据集
r
、
dplyr
、
tidyr
我研究过dplyr
和
tidyr,甚至是基
R
,但我似乎不知道如何根据行值子集我的数据。我尝试过
使用
dplyr filter()
和
select()函数,但是由于gender、language
和
age在id列中,所以不能只键入data %>% filter(gender == 1)进行筛选。我有183行,包括每个问题的评分者的答案,最后三行都有
人口统计
数据,比如
年龄
、
性别
以及某人是母语还是非母语人士。我将在这里以6行为例进行说明。我想要做的是找到一种方
浏览 5
提问于2019-10-22
得票数 1
回答已采纳
1
回答
在函数中,如何引用用户输入的列名post join (当后缀已被联接追加)?
r
、
function
、
dataframe
、
reference
我正在编写一个函数,用于处理用户提供的任意数量的列或行的
人口
数据。作为输入的一部分,用户必须提供person ID
变量
和
Age
变量
的数据帧
和
列号。,将样本数据帧与
使用
年龄
的工作数据帧相
匹配
(一些摆弄以确保与工作数据帧
匹配
的是1到-1
匹配
,而不是1-)。让我们调用输入数据帧Input、工作数据帧Working
和
示例数据帧Sample。Input包含
两个
列,ID (第1列)
和<
浏览 4
提问于2020-07-27
得票数 0
回答已采纳
1
回答
熊猫:如何计算来自其他地方的
人口
百分比
python
、
pandas
、
multi-index
、
population
Pfizer-BioNTech A 1我对按地区
和
日期划分的数字特别感兴趣所以我用df.groupby(['REGION','DATE']).sum()
重新
组合REGION DATE Brussels我发现一些帖子解释了如何在这样的多索引数据中计算百分比,但问题是,我想把每个计数除以一个不
浏览 3
提问于2021-06-23
得票数 2
回答已采纳
2
回答
基于数字
和
分类混合数据的无监督异常检测
cluster-analysis
、
data-mining
、
data-analysis
选择了几个属性来描述用户(例如,雇员角色、部门、邮政编码)
和
病人(例如
年龄
、
性别
、邮政编码)。目前正在考虑的
变量
约为13-15个。我读过,可以扩展分类数据,让
变量
中的每个类别都为0或1来进行聚类,但是
R
/Python将如何处理这些高维数据呢?(简单地扩大雇主角色会带来100个
变量</em
浏览 2
提问于2015-07-09
得票数 5
2
回答
使用
R
中不同数据的过滤信息从数据帧中的列中随机抽样
r
、
matching
本质上,我的问题是:我有
两个
数据集(为了简单起见,我们称它们为dataset A
和
dataset B),它们由一系列公共列组成,其中包括每个个人/观察/行的社会-
人口
特征。我需要的是,对于数据集A中的每一个观察/行,我必须从数据集B中选择一个随机观测,该数据集具有与关键的社会-
人口
变量
相
匹配
的特征。,所以我尝试创建一个函数,并
使用
apply在每个观察上运行它。假设我们希望
匹配
来自B的随机观察ID,其
性别
<
浏览 3
提问于2020-10-21
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
科技:使用物联网,人工智能和云技术推进基于家庭的综合护理
食谱、维基百科、自动生成西英混合语……AI研究人员为获得数据也是拼了
城市环境风险感知和城市绿色基础设施对人类福祉的影响——以广州四个公共绿地为例
统计学最常用的“数据分析方法”清单(一)
使用自组织映射神经网络(SOM)进行客户细分
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券