r:随机替换一定数量的缺失值_替换R中时间序列数据中的缺失值_用R中的随机值替换1 - 腾讯云开发者社区

我有一个有很多缺失值的列。我想随机替换这些缺失值中的一部分(不是全部！)用一个数字，其他人用另一个数字。示例:包含10000个值的列，其中一些值丢失。从这些缺失值中随机选择50个，从NA更改为1。另外，随机选择另外30个缺失值，从NA更改为5。我尝试过的： rows<

浏览 22提问于2021-02-11得票数 1

回答已采纳

1回答

用分类列中的随机值填充丢失的数据- Python

python、pandas、data-cleaning、fillna

在数据帧中，有一个名为“agent”的离散数字列，它有13.7%的缺失值。我的直觉是只删除缺失值的行，但考虑到缺失值的数量并不那么小，现在我想使用随机抽样计算，用现有的分类变量按比例替换它们。,inplace=True)) 前3行是nan，但现在在0x7ffa2c53d700>中替换为<functio

浏览 2提问于2021-03-03得票数 1

回答已采纳

4回答

我想根据熊猫数据中的某些条件替换丢失的值。

python、pandas、dataframe

下面是我正在处理的数据集如您所见，在某些条件下，需要替换一些缺失的值(NaN)：如果Solar.R < 100，则臭氧的缺失值需要替换为值=21.181818 如果Solar.R</

浏览 6提问于2021-10-02得票数 1

回答已采纳

3回答

使用R中的ID数随机引入缺失值

我有一个数据集，它有一个唯一的设施ID和聚集在设备ID上的变量，我想选择一些随机选择的ID，然后在这个设备中引入一个给定数量的报告值的缺失值。数据有5个方便ID，变量X1的每个ID都报告了12个值

浏览 6提问于2020-11-16得票数 3

回答已采纳

2回答

随机数据缺失与无随机数据缺失有什么区别？

machine-learning、r、data-mining、missing-data、data-imputation

我一直在处理一个数据集，其中缺少的数据似乎遵循了一些特定的模式。我已经浏览了很多网站和文章，与缺失的数据，但我没有能够理解MAR和MNAR之间的区别。首先，我想给出数据集的描述和缺失数据的模式。因此，您可以更容易地解释这两种模式之间的差异，并且能够识别我的数据集中的这些模式。缺失数据中的模式:基本上有四种不同的缺失数据模式是我

浏览 0提问于2018-09-12得票数 4

2回答

模拟r中数据丢失和错误的x%。

r、loops、missing-data

colnames(xmat) <- paste ("M", 1:10000, sep ="")在数据中5%的随机位置生成缺失值上面的矩阵值为0到4。所以我想做的是： (1)我想用另一个不是x的数值代替x值(例如，0可以用一个不是0的随

浏览 1提问于2014-08-29得票数 0

回答已采纳

3回答

如何使用菜谱包将缺失的值替换为常量

r、missing-data、r-recipes

我不知道如何使用菜谱包来用常量替换缺少的数值变量。例如，我有一些实验室变量，比如乳酸，这是经常丢失的。我想用一个极值替换缺失

浏览 0提问于2018-06-20得票数 2

2回答

R data.table:根据组中缺失值的数量，按组替换缺失值

r、data.table

我希望为每个组替换我的data.table中丢失的值，并根据组中的所有值是否丢失，或者组中的一些值是否丢失来填充值。我希望将其按列grouping_1和grouping_2分组，并替换value_1和value_2列中缺少的值。如果给定组(例如组grrouping_1==

浏览 0提问于2020-07-24得票数 1

1回答

随机森林回归中缺失分类特征值处理指南

scikit-learn、random-forest

在使用随机森林回归器(或任何集成学习者)时，处理丢失的分类特征值的一般准则是什么？我知道scikit学习有归并函数(如mean...strategy或邻近)来推断缺失的值(数字)。但是，一个人如何处理缺失的分类价值:比如工业(石油、计算机、汽车、None)、专业(学士、硕士、博士、None)。如有任何建议，将不胜感激。

浏览 2提问于2016-05-13得票数 1

3回答

R:如何在没有替换和没有连续值的情况下进行采样

r、loops、sample

我花了一天的时间来完成一件似乎很简单的事情。我必须创建300个“随机”序列，在这些序列中，数字1、2、3和4都出现了12次，但同一数字从未被“连续地”使用过两次。我最好的尝试(我猜)是：有rle 48项，无需替换，测试rle是否有连续的值，然后只使用不包含连续值的序列。问题:几乎没有符合这一标准的随机序列，因此需要花费很长时间。有R创建序列，没有连续的值

浏览 4提问于2019-10-24得票数 10

回答已采纳

1回答

在MATLAB中用保持标准差的随机变量替换NaN

matlab、random

我有一个包含一些缺失值NaN的行向量的矩阵A。中创建了一个相同大小的随机向量B我将一个上界ub和一个下界lb定义为lb = A_mean * (-5);B= ub + (lb-ub) * rand(1, 10);idx = isnan(A);对这个新定义

浏览 0提问于2017-11-18得票数 1

1回答

基于类的缺失值替换

machine-learning、random-forest、missing-data

我一直在阅读一篇关于随机森林的文章，在缺失值替换部分()中，他们说：如果mth变量不是范畴变量，则该方法计算j类中该变量所有值的中值，然后使用该值替换j类中mth变量的所有缺失值。如果某个列中的大多数值都丢失了，那么在这个过程之后，可以使用新的值来轻松地识别类，并且得到的分类器将是无用的。

浏览 2提问于2015-04-15得票数 1

1回答

在对缺失值进行建模后，使用列表/序列填充缺失值(na)

python、list、pandas、missing-data、fillna

我正在尝试将预测的缺失值插入到原始df中(当然是插入有缺失值的列)。我怎么能这样做呢？预测的缺失值基本上存储在列表/序列中，该列表/序列的长度是原始df中缺失值的数量。列表中的顺序与缺少的值在df中出现的顺序相匹配，因为我在缺少的序列上

浏览 0提问于2018-04-05得票数 0

1回答

Numpy将一个数组的特定行和列替换为另一个数组的特定行和列。

python、arrays、numpy、indexing、scipy

我正在尝试替换Numpy数组的特定行和列，如下所示。数组a和b的值最初如下： [1 1 1 1] [6 7 8 9]现在，基于一定的概率，我需要用a的值来代替b (例如，在生成一个随机数，r，对于每个元素在0到1之间，如果r>0.8，我将用b

浏览 0提问于2018-06-09得票数 4

回答已采纳

4回答

替换R中的缺失值

r、na

我必须用ID将缺失值替换为最大值( value )。

浏览 0提问于2016-06-20得票数 0

2回答

如何比较C#中的字符串值

c#、sql

我正在从SQL数据库中提取数据，我正在使用以下语句填充空白或缺失的缺失数据。string.Join( from select我也想用空值替换-9999的值。

浏览 0提问于2016-04-01得票数 4

2回答

Weka中的值处理

machine-learning、weka、missing-data

我如何替换'?‘Weka中的值。带有?符号的值的</em

浏览 28提问于2021-10-26得票数 0

1回答

替换r中的缺失值

r、excel、statistics、missing-data

在替换以下虚拟文件中缺少的值时，我需要帮助。替换缺失值时需要遵循以下规则。如果该值在单元格缺少值的列的两侧相同，则应将缺失值替换为两边的值。如果该值在两个相邻单元格有缺失值的列的两侧相同，则应将缺失值<

浏览 2提问于2022-05-07得票数 0

2回答

不完全数据下的机器学习

machine-learning、regression、data-science、bigdata

我有上百万的样品，大约有1000个特征。但是，对于每个样本，只测量了一组特征。我想要执行机器学习，根据特性预测结果，但是，我不知道如何处理丢失的数据。由于数据是按随机顺序丢失的，所以我不能根据丢失的特性对数据进行分类，因为类的数量会很大，而且每个类中只有很少的样本。处理这类问题的最佳解决办法是什么？

浏览 2提问于2016-09-08得票数 1

回答已采纳

1回答

在dataset中放置固定数量的缺失值- Azure ML

python、r、azure、machine-learning、dataset

我正在处理Azure，我的目标是看看如果我的数据集中有固定数量(百分比)的缺失值会发生什么。我的想法可能是:从数据集(例如成人数据集)开始，复制原始数据集并调用它作为约定X。数据集X将包含20%的百分比中随机丢失的值。一旦我们有了原始数据集和重复数据集X，我们就可以使用神经网络algo，创建训练和测试集，然后用数据集X训练这个神经网络。值得注意的是所产生的全局错误

浏览 1提问于2017-02-14得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云