腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
根据
不同
日期
变量
的
观测
值
的
存在
或
缺失
生成
新
的
因子
变量
r
、
dataframe
、
dplyr
、
stata
-03-25, 2004-03-26), date3 = c(2005-05-11, 2005-05-12, 2005-05-12, NA)) 我想做一些我在Stata中做过
的
事情,就像我在Stata中做
的
那样 Stata代码 gen xvisit=1 if date1 !我
的
目标是得到像这样
的
东西 Stata Output 输入图像描述 ? ription在这里
浏览 21
提问于2021-02-25
得票数 0
回答已采纳
2
回答
用
缺失
因子
设置数据帧
r
我有一个约13,000个级别
缺失
的
因素(在我
的
因子
中有大约13,00个
缺失
值
/ NAs )。如何将数据子集为只包含某个级别
缺失
的
特定列?dat$xyz <- as.factor(dat$xyz)这将返回所有原始
变量
均为零
观测
的
新
数据。
浏览 4
提问于2017-04-25
得票数 1
回答已采纳
1
回答
SAS转换与
缺失
数据
sas
、
transformation
、
normalization
我正在使用SAS中
的
boxcox转换和proc transreg过程,我想知道SAS如何处理丢失
的
数据。我有一个数据集,每个参与者每月包含一行,每个月都有一个连续
变量
。几个月以来,这个
变量
丢失了。Box-Cox变换
的
公式不使用
变量
的
分布
或
其他什么。SAS是如何工作
的
,它是否排除了丢失
的
数据?下面是将boxcox转换应用于我
的
变量
的
代码: PROC TRANSREG
浏览 4
提问于2021-11-09
得票数 0
回答已采纳
3
回答
删除与某个
因子
级别匹配
的
数据框中
的
行(然后绘制排除该
因子
级别的数据)
r
我有一个包含251个
观测
值
和45个
变量
的
数据框架。数据框中间有6个观察
值
,我希望从我
的
分析中排除它们。所有6个都属于一个
因子
的
一个级别。很容易
生成
一个
新
的
数据框,当打印时,它似乎排除了6个
观测
值
。然而,当我使用
新
的
数据框按相关
因子
绘制
变量
时,假设排除
的
水平仍然包括在绘图中(s
浏览 1
提问于2010-08-18
得票数 4
回答已采纳
2
回答
在
生成
新
变量
时忽略缺少
的
值
stata
我想在Stata中创建一个
新
变量
,即3
的
一个函数--
不同
的
变量
,X、Y和Z,例如:所有的
观测
都缺少一个
或
两个
变量
的
值
当我运行上述命令时,它
生成
的
所有
值
都是
缺失
的
值
,因为没有观察到
变量
浏览 3
提问于2019-02-23
得票数 1
回答已采纳
2
回答
更改
值
标签
或
删除特定
值
标签
spss
我有一个SPSS文件,有600个
变量
,每个
变量
可以有0到4个
不同
的
缺失
值
。我试图
根据
以下模式更改
缺失
的
值
:997 -> -7999 -> -9 996为“无对象”,997为“不知道”,998为“拒绝”,999为“未申报”。我需要改变号码才能有相同
的
标签。
变量
中还有其他
的
值
标签,因
浏览 3
提问于2016-01-28
得票数 3
回答已采纳
1
回答
从R中
的
多个二进制
变量
创建
新
的
条件
因子
变量
r
我需要创建一个
新
的
3级分类
变量
来反映受试者是否死于过量服药
的
某一类药物。级别将类似于:“仅限A类”、“仅限B类”、“A类+B类”。在数据框内,有许多(约90)个
不同
的
个体药物
变量
,它们是二元
变量
(0/1),表明该药物是否在受试者
的
毒理学中被发现。我需要做
的
是找到一种方法来创建这个
新
的
因子
变量
,它会告诉我们,如果在单个受试者中发现了25种
浏览 96
提问于2020-01-06
得票数 0
1
回答
在dataframe中找到长度为1
的
唯一元素
r
我想运行函数glmnet(),但是我得到了以下错误:data<- data %>% droplevels() 对于glmnet(),我使用了83个
变量
,因此我不想检查所有
变量
是否包含1
的
观察
浏览 2
提问于2019-11-13
得票数 0
回答已采纳
1
回答
带有
缺失
值
的
错误中
的
未定义
变量
r
、
winbugs
、
r2winbugs
我正在通过R运行一个BUGS模型,我遇到了一个问题,BUGS说我
的
一个数据集是一个“未定义
的
变量
”。它遇到问题
的
数据集中有相当多
的
NA,但为什么这会造成问题?当NA替换为0时,它工作得很好,所以我知道使用NAs
的
BUGS有问题。使用0而不是NA不是一个可接受
的
解决方案,因为我需要对数转换得到
的
量。有没有人遇到过类似的问题并找到了解决方案?这是我正在努力解决
的
模型
的
一部分:lib
浏览 5
提问于2014-08-06
得票数 1
1
回答
SMOTE如何从分类数据中创建
新
数据?
r
我在R中使用了SMOTE来创建
新
的
数据,而且效果很好。当我进一步研究SMOTE是如何工作
的
,我找不到答案,SMOTE是如何处理分类数据
的
。这是到论文
的
链接:
浏览 0
提问于2018-12-06
得票数 2
回答已采纳
1
回答
在ape中运行PGLS时出错:“未指定协
变量
”
ape-phylo
我只是重新看了一本旧
的
r脚本,以反复核对我
的
分析。当我尝试运行PGLS时,我会得到这个
新
错误:gls(Diet_PC1~
浏览 4
提问于2020-07-28
得票数 1
3
回答
如何将
缺失
的
值
压缩到向量中
r
假设我有两个
变量
a和b。(runif(20, min = 0, max = 10))b <- as.data.frame(a[c(-7, -11, -15),]) 所以b有17个
观测
值
,是a
的
一个子集,其中有20个
观测
值
。我
的
问题是:我将如何使用这两个
变量
生成
第三个
变量
c,它像a一样有20个
观测
值
,但缺少
观测</em
浏览 1
提问于2014-05-01
得票数 6
回答已采纳
2
回答
不完全数据下
的
机器学习
machine-learning
、
regression
、
data-science
、
bigdata
我有上百万
的
样品,大约有1000个特征。但是,对于每个样本,只测量了一组特征。我想要执行机器学习,
根据
特性预测结果,但是,我不知道如何处理丢失
的
数据。由于数据是按随机顺序丢失
的
,所以我不能
根据
丢失
的
特性对数据进行分类,因为类
的
数量会很大,而且每个类中只有很少
的
样本。处理这类问题
的
最佳解决办法是什么?
浏览 2
提问于2016-09-08
得票数 1
回答已采纳
2
回答
R中gbm
的
缺失
数据和分层k折交叉验证
r
、
missing-data
、
cross-validation
、
gbm
我有一个相对较大
的
数据集,关于美国几个市场
的
房屋销售。对于每个市场,我想建立一个梯度提升回归模型来预测销售价格。我
的
大多数自
变量
(特性)都有
缺失
值
,这对于R中
的
gbm来说应该没问题。caret中
的
gbm算法要求您指定超参数(n.trees、shrinkage、interaction.depth、n.minobsinnode等)
的
值
。shrinkage = tuner$bestTune$shrinkage n_mino
浏览 2
提问于2016-09-29
得票数 0
1
回答
Numpy,观察
值
中
变量
对
的
频率
python
、
arrays
、
numpy
我有一个MxN 2dnumpy数组"A",其中M是观察
值
的
数量,N是要检查
的
变量
的
数量。 A中
的
每个条目可以是1
或
0,1表示该观察中
存在
该
变量
,而0表示不
存在
该
变量
。我想创建一个相互频率
的
NxN矩阵,"B",
根据
变量
的
存在
。"B“中
的
索引i,j
浏览 13
提问于2019-06-28
得票数 1
回答已采纳
1
回答
如果SAS为first.variable,则进行赋值
sas
我有一个按6个
变量
排序
的
数据集。 我想使用first.variable (在我
的
例子中是第六个
变量
)为数据集
的
一个
新
变量
(第七个、第八个
变量
)设置初始
值
。组中
的
第一列具有硬编码
的
日期
值
'3-20-2017‘。因此,只有一个组,第一列由所有200K观察
值
组成。问题是,当我执行上面的代码时,我希望得到分配给
观测
值<
浏览 0
提问于2017-03-28
得票数 1
1
回答
R标记中每个
变量
的
描述与绘图
r
、
ggplot2
、
markdown
我有一个数据data
的
n
观测
数个数值和
因子
变量
。我希望
生成
一个html报告,其中报告class和describe,并为每个
变量
绘制直方图(qplot
或
ggplot)。 科拉多
浏览 2
提问于2013-02-19
得票数 0
回答已采纳
1
回答
正确
的
数据准备步骤顺序?
machine-learning
、
data-cleaning
假设您有一个二进制分类问题,以及一个包含20,000条
观测
和20列
的
数据集。目标
变量
非常不平衡,
存在
缺失
值
、倾斜分布、离群点等。 我
的
问题是,在一般意义上,应该执行这些数据预处理步骤
的
顺序是什么?填写
缺失
值
,规范化/标准化数据,处理偏斜,处理异常值,平衡目标
变量
类
浏览 0
提问于2017-03-16
得票数 2
1
回答
根据
日期
范围创建添加
因子
的
函数
r
我正在公寓楼中运行各种测试,并且需要添加一个
因子
(Etapp <i>)来指示这些观察属于哪个测试阶段。我已经创建了一个矩阵与测试阶段和相应
的
开始和结束
日期
。t1,t2,.包含测试阶段
的
断点,如POSIXct我
的
计划是为此创建一个
浏览 3
提问于2016-02-23
得票数 0
回答已采纳
1
回答
合并具有
不同
数据
的
行
stata
"CAN"它包含
不同
行中
不同
条目的
不同
数据。
浏览 2
提问于2018-09-20
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据清洗——是时候把自己从繁重的体力劳动中解救出来了
R语言笔记11:两个重要函数——用来分解数据框的split和用来查看对象的str
通过环境影响因子预测生物种群数量
缺失值处理详解
Stata常用命令100条
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券