腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
r
:
随机
替换
一定
数量
的
缺失
值
r
我有一个有很多
缺失
值
的
列。我想
随机
替换
这些
缺失
值
中
的
一部分(不是全部!)用一个数字,其他人用另一个数字。 示例:包含10000个
值
的
列,其中一些
值
丢失。从这些
缺失
值
中
随机
选择50个,从NA更改为1。另外,
随机
选择另外30个
缺失
值
,从NA更改为5。我尝试过
的
: rows<
浏览 22
提问于2021-02-11
得票数 1
回答已采纳
1
回答
用分类列中
的
随机
值
填充丢失
的
数据- Python
python
、
pandas
、
data-cleaning
、
fillna
在数据帧中,有一个名为“agent”
的
离散数字列,它有13.7%
的
缺失
值
。我
的
直觉是只删除
缺失
值
的
行,但考虑到
缺失
值
的
数量
并不那么小,现在我想使用
随机
抽样计算,用现有的分类变量按比例
替换
它们。,inplace=True)) 前3行是nan,但现在在0x7ffa2c53d700>中
替换
为<functio
浏览 2
提问于2021-03-03
得票数 1
回答已采纳
4
回答
我想根据熊猫数据中
的
某些条件
替换
丢失
的
值
。
python
、
pandas
、
dataframe
下面是我正在处理
的
数据集如您所见,在某些条件下,需要
替换
一些
缺失
的
值
(NaN):如果Solar.
R
< 100,则臭氧
的
缺失
值
需要
替换
为
值
=21.181818 如果Solar.
R</
浏览 6
提问于2021-10-02
得票数 1
回答已采纳
3
回答
使用
R
中
的
ID数
随机
引入
缺失
值
r
我有一个数据集,它有一个唯一
的
设施ID和聚集在设备ID上
的
变量,我想选择一些
随机
选择
的
ID,然后在这个设备中引入一个给定
数量
的
报告
值
的
缺失
值
。数据有5个方便ID,变量X1
的
每个ID都报告了12个
值
浏览 6
提问于2020-11-16
得票数 3
回答已采纳
2
回答
随机
数据
缺失
与无
随机
数据
缺失
有什么区别?
machine-learning
、
r
、
data-mining
、
missing-data
、
data-imputation
我一直在处理一个数据集,其中缺少
的
数据似乎遵循了一些特定
的
模式。我已经浏览了很多网站和文章,与
缺失
的
数据,但我没有能够理解MAR和MNAR之间
的
区别。 首先,我想给出数据集
的
描述和
缺失
数据
的
模式。因此,您可以更容易地解释这两种模式之间
的
差异,并且能够识别我
的
数据集中
的
这些模式。
缺失
数据中
的
模式:基本上有四种不同
的
缺失
数据模式是我
浏览 0
提问于2018-09-12
得票数 4
2
回答
模拟
r
中数据丢失和错误
的
x%。
r
、
loops
、
missing-data
colnames(xmat) <- paste ("M", 1:10000, sep ="")在数据中5%
的
随机
位置生成
缺失
值
上面的矩阵
值
为0到4。所以我想做
的
是: (1)我想用另一个不是x
的
数值代替x
值
(例如,0可以用一个不是0
的
随
浏览 1
提问于2014-08-29
得票数 0
回答已采纳
3
回答
如何使用菜谱包将
缺失
的
值
替换
为常量
r
、
missing-data
、
r-recipes
我不知道如何使用菜谱包来用常量
替换
缺少
的
数值变量。例如,我有一些实验室变量,比如乳酸,这是经常丢失
的
。我想用一个极值
替换
缺失
浏览 0
提问于2018-06-20
得票数 2
2
回答
R
data.table:根据组中
缺失
值
的
数量
,按组
替换
缺失
值
r
、
data.table
我希望为每个组
替换
我
的
data.table中丢失
的
值
,并根据组中
的
所有
值
是否丢失,或者组中
的
一些
值
是否丢失来填充值。我希望将其按列grouping_1和grouping_2分组,并
替换
value_1和value_2列中缺少
的
值
。如果给定组(例如组grrouping_1==
浏览 0
提问于2020-07-24
得票数 1
1
回答
随机
森林回归中
缺失
分类特征
值
处理指南
scikit-learn
、
random-forest
在使用
随机
森林回归器(或任何集成学习者)时,处理丢失
的
分类特征
值
的
一般准则是什么?我知道scikit学习有归并函数(如mean...strategy或邻近)来推断
缺失
的
值
(数字)。但是,一个人如何处理
缺失
的
分类价值:比如工业(石油、计算机、汽车、None)、专业(学士、硕士、博士、None)。 如有任何建议,将不胜感激。
浏览 2
提问于2016-05-13
得票数 1
3
回答
R
:如何在没有
替换
和没有连续
值
的
情况下进行采样
r
、
loops
、
sample
我花了一天
的
时间来完成一件似乎很简单
的
事情。我必须创建300个“
随机
”序列,在这些序列中,数字1、2、3和4都出现了12次,但同一数字从未被“连续地”使用过两次。我最好
的
尝试(我猜)是: 有rle 48项,无需
替换
,测试rle是否有连续
的
值
,然后只使用不包含连续
值
的
序列。问题:几乎没有符合这一标准
的
随机
序列,因此需要花费很长时间。有
R
创建序列,没有连续
的
值
浏览 4
提问于2019-10-24
得票数 10
回答已采纳
1
回答
在MATLAB中用保持标准差
的
随机
变量
替换
NaN
matlab
、
random
我有一个包含一些
缺失
值
NaN
的
行向量
的
矩阵A。中创建了一个相同大小
的
随机
向量B我将一个上界ub和一个下界lb定义为lb = A_mean * (-5);B= ub + (lb-ub) * rand(1, 10);idx = isnan(A);对这个新定义
浏览 0
提问于2017-11-18
得票数 1
1
回答
基于类
的
缺失
值
替换
machine-learning
、
random-forest
、
missing-data
我一直在阅读一篇关于
随机
森林
的
文章,在
缺失
值
替换
部分()中,他们说: 如果mth变量不是范畴变量,则该方法计算j类中该变量所有
值
的
中值,然后使用该
值
替换
j类中mth变量
的
所有
缺失
值
。如果某个列中
的
大多数值都丢失了,那么在这个过程之后,可以使用新
的
值
来轻松地识别类,并且得到
的
分类器将是无用
的
。
浏览 2
提问于2015-04-15
得票数 1
1
回答
在对
缺失
值
进行建模后,使用列表/序列填充
缺失
值
(na)
python
、
list
、
pandas
、
missing-data
、
fillna
我正在尝试将预测
的
缺失
值
插入到原始df中(当然是插入有
缺失
值
的
列)。我怎么能这样做呢? 预测
的
缺失
值
基本上存储在列表/序列中,该列表/序列
的
长度是原始df中
缺失
值
的
数量
。列表中
的
顺序与缺少
的
值
在df中出现
的
顺序相匹配,因为我在缺少
的
序列上
浏览 0
提问于2018-04-05
得票数 0
1
回答
Numpy将一个数组
的
特定行和列
替换
为另一个数组
的
特定行和列。
python
、
arrays
、
numpy
、
indexing
、
scipy
我正在尝试
替换
Numpy数组
的
特定行和列,如下所示。数组a和b
的
值
最初如下: [1 1 1 1] [6 7 8 9]现在,基于
一定
的
概率,我需要用a
的
值
来代替b (例如,在生成一个
随机
数,
r
,对于每个元素在0到1之间,如果
r
>0.8,我将用b
浏览 0
提问于2018-06-09
得票数 4
回答已采纳
4
回答
替换
R
中
的
缺失
值
r
、
na
我必须用ID将
缺失
值
替换
为最大
值
( value )。
浏览 0
提问于2016-06-20
得票数 0
2
回答
如何比较C#中
的
字符串
值
c#
、
sql
我正在从SQL数据库中提取数据,我正在使用以下语句填充空白或
缺失
的
缺失
数据。string.Join( from select我也想用空
值
替换
-9999
的
值
。
浏览 0
提问于2016-04-01
得票数 4
2
回答
Weka中
的
值
处理
machine-learning
、
weka
、
missing-data
我如何
替换
'?‘Weka中
的
值
。 带有?符号
的
值
的</em
浏览 28
提问于2021-10-26
得票数 0
1
回答
替换
r
中
的
缺失
值
r
、
excel
、
statistics
、
missing-data
在
替换
以下虚拟文件中缺少
的
值
时,我需要帮助。
替换
缺失
值
时需要遵循以下规则。 如果该
值
在单元格缺少
值
的
列
的
两侧相同,则应将
缺失
值
替换
为两边
的
值
。如果该
值
在两个相邻单元格有
缺失
值
的
列
的
两侧相同,则应将
缺失
值
<
浏览 2
提问于2022-05-07
得票数 0
2
回答
不完全数据下
的
机器学习
machine-learning
、
regression
、
data-science
、
bigdata
我有上百万
的
样品,大约有1000个特征。但是,对于每个样本,只测量了一组特征。我想要执行机器学习,根据特性预测结果,但是,我不知道如何处理丢失
的
数据。由于数据是按
随机
顺序丢失
的
,所以我不能根据丢失
的
特性对数据进行分类,因为类
的
数量
会很大,而且每个类中只有很少
的
样本。处理这类问题
的
最佳解决办法是什么?
浏览 2
提问于2016-09-08
得票数 1
回答已采纳
1
回答
在dataset中放置固定
数量
的
缺失
值
- Azure ML
python
、
r
、
azure
、
machine-learning
、
dataset
我正在处理Azure,我
的
目标是看看如果我
的
数据集中有固定
数量
(百分比)
的
缺失
值
会发生什么。我
的
想法可能是:从数据集(例如成人数据集)开始,复制原始数据集并调用它作为约定X。数据集X将包含20%
的
百分比中
随机
丢失
的
值
。一旦我们有了原始数据集和重复数据集X,我们就可以使用神经网络algo,创建训练和测试集,然后用数据集X训练这个神经网络。值得注意
的
是所产生
的
全局错误
浏览 1
提问于2017-02-14
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
数据预处理——数据清洗
问卷数据中的缺失值插补方法
处理缺失值的三个层级的方法总结
机器学习算法原理系列详解-机器学习基础与实践(一)-数据清洗
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券