腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
0
回答
计算
特征
变量
的
相关性
和
特征
选择
之间
的
区别
?
、
、
使用
相关性
和
使用
特征
选择
来
选择
重要
的
/高度相关
的
变量
有什么
区别
?在研究
特征
选择
时,我看到它使用包括皮尔逊
相关性
在内
的
统计测试。 作为一个大学项目的一部分,我们
的
团队希望在进行数据挖掘时确定重要
的
变量
。一个合作伙伴用R Studio做了
相关性
分析,我用Sci-kit Learn做了递归
浏览 10
提问于2017-12-07
得票数 0
2
回答
特征
选择
对决策树算法有影响吗?
、
、
背景:目前,我正在从事我
的
论文项目,即建立基于树
的
集成方法,用于在一个大数据集上进行分类。在我开始建模之前,我花了大量
的
时间在
特征
选择
上,使用基于
相关性
的
标准来
选择
一个
特征
子集,这样这些
选择
的
特征
与响应
变量
有很高
的
相关性
,并且彼此
之间
的
相关性
很低。然而,我
的
浏览 0
提问于2019-05-08
得票数 9
1
回答
高基数
特征
的
方差分析
、
、
、
我有多个高基数分类
特征
和
低基数
特征
。目标
特征
是数值
特征
。我可以用下面的代码知道低基数
特征
和
目标
变量
之间
的
相关性
print(F) 在这里,上面的
特征</
浏览 13
提问于2020-02-13
得票数 1
回答已采纳
3
回答
非数值
特征
的
相关矩阵
、
、
目前,我有数据集
的
数值以及非数值属性.我试图使用R编程语言删除dataset中
的
冗余特性。注意:不能将非数字属性转换为二进制属性。Caret R包提供了findCorrelation,它将分析可以删除
的
属性
的
数据属性报告
的
关联矩阵。但是,它只工作'x‘
的
数值。我一直无法找到用于非数字属性
的
包。如果没有,有什么方法/包可以帮助我实现同样
的
目标?
浏览 0
提问于2019-11-12
得票数 1
1
回答
数据集
特征
之间
没有关联
、
我正试图建立一个分类模型来预测纽约出租车出行
的
价格(2018年)。数据源页面 由于原始文件非常大(112 234 626行),所以我构建了较小
的
示例文件(1000行)来进行第一次探索性分析。通过使用这个示例文件,我构建了热图图来显示数据集
特征
之间
的
相关性
。发现模型
的
因
变量
(fare_amount)仅与trip_distance
变量
相关。其他独立
变量
之间
没有明显
的
相关性</e
浏览 0
提问于2019-06-04
得票数 0
1
回答
如何在回归模型中识别合适
的
预测因子
、
我有一个大
的
数据,并希望执行一些预测模型(如回归,决策树,..)但我有个问题。由于
变量
太多,是否有任何方法可以确定在模型中使用哪些
变量
作为预测
变量
来预测某个特定
变量
?任何帮助都将不胜感激。
浏览 0
提问于2017-08-17
得票数 2
2
回答
互信息概念
、
我想在虹膜数据集中获取相互信息以
选择
最佳特性,但我对互信息感到困惑。除非你能向你祖母解释,否则你不会真正理解什么。阿尔伯特·爱因斯坦
浏览 0
提问于2018-11-22
得票数 2
2
回答
关于KL-散度
和
特征
选择
的
直觉
、
我在理解KL-散度以及如何使用它进行
特征
选择
时有点困难。因此,假设我有一组观察值(例如,0
和
1),并为每个观察值生成2个
特征
。我现在
的
问题是:为什么特性是“最好
的
”?我
的
直觉告诉我,P是
特征
1,Q是真正
的
分布(所以是0
和
1
的
集合),但我
的
理解也是,一个好
的
特征
可以最大化KL散度。但是如果Q是类
的
实际分布,那么你想最小化它,对吗?
浏览 4
提问于2016-06-04
得票数 0
3
回答
在包含字符串和数值
的
数据集中进行
特征
选择
?
、
、
、
、
我有大约200个这样
的
专栏。谢谢
浏览 1
提问于2013-04-08
得票数 3
2
回答
是否在只有案例
的
数据集中进行功能
选择
?
是否可以在这样
的
数据集中进行
特征
选择
。最后,我想建立一个预测模型来预测情况。
浏览 0
提问于2022-03-10
得票数 0
1
回答
分类数据-如何处理
、
、
很少有关于分类数据
的
问题。需要建议/指示:cat
和
num
特征
之间
的
相关性
如何?我们如何找到目标依赖于组合
的
分类
特征
,但可能不显示与个别
特征
的
相关性
的
情况? 我们能否处理测试数据具有训练数据中不存在
的<
浏览 0
提问于2020-04-28
得票数 0
2
回答
我们如何区分相关
的
和
不相关
的
特征
/
变量
?这与回归分析有关吗?
、
、
、
相关术语
和
非相关术语在数据科学中经常使用,并被理解为它们代表相关系数。这条路对吗?
浏览 0
提问于2023-03-15
得票数 0
1
回答
特征
选择
:如果在简历拆分之前泄露信息?
、
目前,我正在做一些简单
的
特征
选择
,基于
特征
和
方差在一个
特征
之间
的
相关性
。在创建交叉验证之前,我将此应用于用于建模
的
整个数据集。我现在
的
问题是,这是否是可以接受
的
工作流程,或者是否会显著影响简历统计数据,从而提出一个比实际更好
的
模型? 技术上更好
的
做法是进行简历分割,然后在培训集上
选择
功能,以避免泄露信息?
浏览 0
提问于2017-05-10
得票数 1
1
回答
随机森林
特征
选择
的
Pearson相关或
特征
重要性
、
我有一个数据集,其中一个
特征
显示了与目标
变量
的
最小显着性关系;然而,在评估了
特征
重要性之后,它显示了与目标
变量
的
最显著关系,如图像所示。在下面的图像中,名为"diff“
的
变量
是目标,称为”小时“
的
变量
是独立
的
特征
。基于Pearson
相关性
的
特征
是否有可能表现出最小
的
显着性关系,而基于
特征</e
浏览 3
提问于2022-02-03
得票数 0
1
回答
相关评分
的
使用
、
、
我们如何使用两个
变量
之间
的
相关评分来分析数据?那么,我们如何在分析中使用相关得分呢?
浏览 0
提问于2015-10-04
得票数 1
回答已采纳
3
回答
特征
应该是相关
的
还是不相关
的
,用多元回归分析进行
特征
选择
?
、
、
、
我见过研究人员使用Pearson相关系数来找出相关
特征
--保留与目标相关值较高
的
特征
。这意味着在分类问题中,相关
特征
为发现目标提供了更多
的
信息。然而,我们删除了一些冗余
的
特征
,相关值可以忽略不计。( Q1)与目标
变量
高度相关
的
特性应该包括还是从分类问题中删除?对这一步有更好
的
解释吗? Q2)当涉及多个
变量
时,我们如何知道数据集是线性
的
?数据集是线性
的
是什么意思?(
浏览 0
提问于2019-11-21
得票数 6
回答已采纳
1
回答
两个矩阵
之间
的
余弦相似度
、
、
、
我有两个256x256
的
数组,其中
的
信息有两个不同
的
单位(一个是米,另一个是度)当我用色彩映射表绘制它们时,图像看起来非常相似,但我知道它们里面的信息在大小
和
单位上都是完全不同
的
。因为图像看起来像,所以我想
计算
它们彼此相似程度
的
百分比。(我知道这样说有些含糊,但我愿意接受如何比较它们
的
想法) 到目前为止,我在两个矩阵
之间
使用了scikitlearn cosine_similarity函数,但我在理解结果矩阵
的
含义时遇
浏览 0
提问于2020-07-08
得票数 1
1
回答
特征
之间
的
相关性
、
在python中,我有以下问题: 我只想在一个
特征
上打印多个
特征
的
相关性
<0.9 (这里:'Volume'):在这种情况下,示例指的是我
的
数据帧 代码: correlation=example.corrmy_features=pd.DataFrame(my_feature) my_feature['Feature']=my_feature.index 因此,我现在有了一个dataFrame,它具有我
的
特征
,即
变量</
浏览 16
提问于2020-01-29
得票数 0
1
回答
特征
选择
、聚类、降维算法
的
区别
、
、
、
有人能指出
特征
选择
和
聚类以及降维算法
之间
的
区别
吗?聚类帮助我们指出哪些
变量
簇清楚地定义了输出。
特征
选择
+聚类不是
和
降维算法一样吗?
浏览 4
提问于2015-10-27
得票数 0
2
回答
相关
特征
和
分类精度
、
、
、
我想问大家一个关于相关
特征
(
变量
)如何影响机器学习算法
的
分类精度
的
问题。对于相关
特征
,我指的是它们
之间
的
相关性
,而不是与目标类
之间
的
相关性
(即几何图形
的
周长和面积,或者教育水平和平均收入)。在我看来,相关
特征
对分类算法
的
准确性有负面影响,我想说
的
是,因为
相关性
使其中之一变得无用。真的是这样吗?问题会随着分类算法
浏览 2
提问于2013-02-11
得票数 38
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一文教你如何计算变量之间的相关性
R语言逻辑回归分析连续变量和分类变量之间的“相关性“
7,特征的选择
降维和特征选择的对比介绍
Featurewiz-Polars:基于XGBoost的高性能特征选择框架,一行代码搞定特征选择
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券