腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用
KNN
,
SoftImpute
进行
数据
填充
、
、
我想使用鼠标、
KNN
和Soft Impute对fancyimpute包中的预测值
进行
比较,然而,当我运行我的代码时,
KNN
和
SoftImpute
对我的值只给出了0,而不是由鼠标给出的更有意义的值。Age']].select_dtypes(include='number']).as_matrix() Age_
KNN
=
KNN
(k=3).complete(imputed_nu
浏览 50
提问于2018-07-31
得票数 1
1
回答
如何找到missing_mask?
、
、
missing_mask] - X[missing_mask]) ** 2).mean()print("
SoftImpute
MSE: %f" %
softImpute
_mse)
knn
_m
浏览 25
提问于2019-03-14
得票数 0
4
回答
用
KNN
计算python中的缺失值
、
、
我有一个像这样的
数据
集1908 February 7.3 1.91908 April14.7 4.81909 July 17.3 10.8我想用
KNN
对于如何使用
KNN
替换最后两列中的NaN,有什么想法吗? 编辑:由于我需要在另一个环境中运行代码,所以我没有机会安装软件包。我唯一
浏览 10
提问于2017-07-26
得票数 21
1
回答
如何将数值列转换为R中的因子
、
、
我正在尝试使用
softImpute
命令(来自
softImpute
包)来
填充
缺少的值,并且在使用
softImpute
之前,我正在尝试将大型
数据
框中的分类变量转换为因子类型。这里的a是一个类似于:c(1:92)的向量 我也尝试过as.character,但
softImpute
命令不会将变量识别为字符,而会将它们视为数字,从而导致分类/指示符变量的十进制值。
浏览 0
提问于2013-12-02
得票数 4
2
回答
如何在python中为机器学习处理丢失的NaNs
、
、
、
如何在应用机器学习算法之前处理
数据
集中的缺失值??这里有一个非常重要的问题。
数据
集中丢失值的最佳处理方法是什么?例如,如果您看到此
数据
集,只有30%的
数据
具有原始
数据
。
浏览 4
提问于2015-01-07
得票数 8
回答已采纳
1
回答
用
fancyimpute对测试集
进行
软分配
、
、
、
python包fancyimpute提供了几种
数据
填充
方法。我尝试使用软归因法;但是,软归因法不提供用于测试
数据
集的转换方法。另一方面,
SoftImpute
提供了唯一的fit_transform,它允许我对训练
数据
进行
拟合,但不会将其转换为测试集。我理解在训练集和测试集上拟合推定会导致
数据
从测试集泄漏到训练集。为此,我们需要适应训练,并在测试中
进行
转换。有没有办法将我从训练集中拟合的测试集以软推算的方式
进行
推算?我很感谢你的想法。]
浏览 18
提问于2020-04-14
得票数 0
1
回答
同时处理几个特性中丢失的
数据
、
日安, 一次处理几个功能(分类和连续)中丢失的
数据
的方法是什么?我浏览了每一个特征,并绘制了它们分布的几个直方图,我认为简单地
用
一些常量值(均值、模式或其他东西)替代值并不是最好的选择。我想构建几个模型(连续值的分类和回归模型),以便对
数据
进行
归并,但我不知道正确的方法。如果我只使用非空行来训练我的模型,那么我就无法预测带有空值的值。我有615739行* 49列
数据
集(经过一个热编码过程)。如果我删除至少包含一个空值的所有行,那么我将得到451063行。谢谢你提前给我建议。
浏览 0
提问于2020-11-08
得票数 1
回答已采纳
4
回答
用
fancyimpute和pandas
进行
数据
填充
、
、
、
、
我有一个大熊猫的
数据
成名df。它有相当多的遗漏。删除row/或col不是一种选择。中位数、均值或最频繁的值也不是一个选项(因此,不幸的是,
用
pandas和/或scikit来估算并不能解决这个问题)。df_numeric)) 然而,df_filled在某种程度上是一个单一的向量,而不是
填充
的
数据
帧。如何获得带有估算的
数据
帧? 更新 我意识到,fancyimpute需要一个numpay array。因此,我使用as_matrix()将df_numeric转换为一个数组。(df_numeri
浏览 68
提问于2017-07-21
得票数 16
回答已采纳
1
回答
fancyimpute的
SoftImpute
是否需要标准化
数据
?
、
、
、
、
nuclear norm objective directly, insteadX_filled_
softimpute
=
SoftImpute
().complete(X_incomplete_normalized) 这就意味着我需要对输入
数据
进行
标准化。我必须事先对我的
数据
进行
标准化吗?具体是什么?
浏览 18
提问于2017-02-08
得票数 3
2
回答
如何处理
数据
集中的缺失值
、
、
有一个数值
数据
集,大小为26000 *17。但问题是,
数据
集中有很多缺失值(空值)。
数据
是非常敏感的,所以我既不能忽略所有包含空值的行,也不能用average、mean或任何标准数字替换
数据
中的空值。还存在不使用
KNN
补偿来替换丢失的条目的限制。处理这样的
数据
集的最佳方式是什么?
浏览 0
提问于2018-12-27
得票数 4
2
回答
Sklearn中的fit方法。使用KNeighborsClassifier时
、
、
、
from sklearn.neighbors import KNeighborsClassifier
knn
_clf.fit(x_train[:92000],y_train[:92000]) #1st method call
knn
_clf.fit(x_train[92000:123000],y_train[92000:123000]) #2nd我试图实现的是批量训练,因为如果我一次使用完整的
数据
集,笔记本电脑就不能处理
数据
!提前感谢:-
浏览 1
提问于2018-09-03
得票数 0
回答已采纳
1
回答
在缺少功能的
数据
集上执行EDA
、
、
我想在这样的
数据
集上执行EDA,这些
数据
集是我的火车和测试集缺少的特性统计
数据
:我的火车上总共有3616条
数据
线我如何决定哪些功能需要“丢弃”,哪些是“人工
填充
”(以及如何
填充
--我读了一些关于
浏览 0
提问于2022-05-14
得票数 0
3
回答
如何在python中用
KNN
填充
缺失值
、
、
、
、
我试图
用
python中的
KNN
来
填充
缺失的值,所以我写了这段代码,但它不起作用。我得到这个错误"ValueError:无法将字符串转换为浮点数:'normal'“.what我应该怎么做?
浏览 8
提问于2021-05-14
得票数 0
2
回答
在dataframe中将数字标志设置为字符串
、
我对熊猫很陌生,我想知道处理字符串
数据
的最好方法是什么?我正在考虑
用
旗子对字符串编号,但我确信有更好的方法来做到这一点?字符串值将作为特性合并到
KNN
中。假设以下
数据
并对我的类型
进行
编号:举个例子:这显然会给我一个could not convert string to float
knn
.fit(df['Type'], df['Quantity
浏览 1
提问于2016-12-19
得票数 1
回答已采纳
1
回答
是否应该规范或标准化
knn
的
数据
集?
、
、
、
、
我尝试使用
knn
进行
分类任务,我的
数据
集包含分类特征,这些特征是一个热门的编码、数字特征(如价格等).以及文本列的向量。 我知道
knn
受缩放的影响。所以我搞不懂这里
用
什么?
浏览 0
提问于2019-03-09
得票数 4
回答已采纳
2
回答
对于K的偶数值和领带的情况,
KNN
的预测类是什么?
、
、
、
在
KNN
(K nearest neighbour)分类器中,如果选择K的偶数值,那么多数投票规则或欧氏距离规则中的预测值是多少。
浏览 19
提问于2017-10-06
得票数 0
回答已采纳
1
回答
当我们将.fit()方法应用于Scikit中的
kNN
模型时会发生什么-了解
kNN
是否没有训练阶段?
、
、
、
由于
kNN
在内存级别处理训练和预测,并且不需要显式的训练过程,因此当拟合
knn
模型时到底会发生什么?我认为这一步与训练模型有关。谢谢。 如果我跳过拟合步骤,这是我将得到的错误。city_development_index"]].values
knn</e
浏览 104
提问于2020-12-28
得票数 2
回答已采纳
1
回答
KNeighborRegressor fit函数卡在一个大DB上
、
、
我只是尝试用sklearn构建一个
KNN
Regressor,但是执行要花费很长时间,而在调试时,fit函数的执行似乎要花费很长时间。我应该指出,
数据
集很大(大约有25,000条记录,有10个特性),但是--我现在还在等一个小时,没有结果。 是什么导致的?
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
1
回答
多类分类准确率50%
、
我试图对大量输出标签(1000)
进行
多类分类。 我
用
KNN
建立了一个模型。accuracy =
knn
.score(X_test, y_test)给出的精度为0.5。这是否意味着给定一个输入,该模型能够预测
数据
所属标签的50%的时间?如果是的话,我会直觉地说这是好的,因为随机选择标签的概率是0.1%。
浏览 0
提问于2020-02-26
得票数 1
1
回答
如何使用不同的技术在
填充
熊猫或蟒蛇的缺失值后添加“
填充
数据
”的列?
、
、
、
、
如何在
填充
熊猫或蟒蛇的缺失值后,使用不同或几种技术,如各种统计技术或机器学习技术,添加“
填充
数据
”列。我想做的是,在用平均值、中位数或标准差值或其他机器学习算法(如
KNN
或XGBoost或其他一些技术)
填充
数据
之后,我想在csv或excel文件的末尾添加或追加这些或那个列,但不低于实际
数据
,我指的是文件的右侧例如,我已经使用统计技术和其他ML技术
填充
了某一列中丢失的
数据
,然后我希望将这些“
填充
值”与原始值一起添加到一
浏览 2
提问于2019-09-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用 KNN 来进行验证码识别
用KNN来进行验证码识别
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
用LUA字典进行IP数据去重操作
用WGCNA进行数据挖掘发高分文章
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券