腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(285)
视频
沙龙
1
回答
带有
用户反馈
的
稀疏IR
、
、
我正在考虑在信息检索上下文中构建框架
的
问题。B: 0 1 0 0 1 0D: 0 1 0 0 0 1F: 0 0 1 0 0 1然而,这些只是偏好。仅仅因为我们知道问题
的
“答案”,并
浏览 0
提问于2018-07-06
得票数 3
回答已采纳
2
回答
互信息
概念
、
我想在虹膜数据集中获取相
互信息
以
选择
最佳特性,但我对
互信息
感到困惑。除非你能向你祖母解释,否则你不会真正理解什么。阿尔伯特·爱因斯坦
浏览 0
提问于2018-11-22
得票数 2
1
回答
带有
互信息
的
最小
冗余
最大
相关性
(
mRMR
),
用于
使用
scikit
学习
进行
特征
选择
、
、
、
我正在做一个ML分类项目,它需要执行
mRMR
作为管道中
的
一个步骤。我在网上试过几个,但它们似乎与Python3.7不兼容。我想知道是否有与python 3.7和当前版本
的
scikit
-learn兼容
的
软件包?谢谢!
浏览 24
提问于2020-02-05
得票数 1
1
回答
在R中
使用
mRMRe
、
、
我目前正在做一个项目,我必须做一些功能
选择
,以建立一个预测模型。我被领到了一个叫做mRMRe
的
R包。我只是试着用这个例子,但做不到。这个例子可以在这里找到- 。这是我
的
密码-data <- data.frame(target=cgps.ic50, cgps.ge)# Update data <-
浏览 7
提问于2016-04-08
得票数 3
回答已采纳
2
回答
用于
特征
选择
的
最小
冗余
最大
相关性
(
MRMR
)
我在
特征
选择
中
使用
了一种名为(
MRMR
)
最小
冗余
最大
相关性
的
过滤器度量。在我运行以下代码之后FeaturesFilei) = mutualinfo(d(:,i), f); Error in
mrmr
(line 9
浏览 1
提问于2017-01-09
得票数 0
1
回答
基因表达数据集
的
特征
选择
、
、
我正在搜索一种
特征
选择
算法,该算法
选择
以下
特征
:所有样本
的
差异都很大基于随机森林分类器
特征
重要性结果
的
特征
选择
使用
最小
冗余
最大
浏览 0
提问于2016-06-28
得票数 1
回答已采纳
4
回答
特征
选择
与分类精度关系
、
为分类器
选择
可用
特征
子集
的
方法之一是根据标准(例如信息增益)对它们
进行
排序,然后
使用
分类器和排序
特征
的
子集计算精度。例如,如果您
的
特性是A, B, C, D, E,如果它们按照D,B,C,E,A排序,那么您可以
使用
D、D, B、D, B, C、D, B, C, E来计算精度.直到你
的
准确度开始下降。📷 在example1 (上面)中,您将
选择
特性F, C, D, A并删除其他特性,因为它们降低了您<
浏览 0
提问于2016-10-24
得票数 11
回答已采纳
1
回答
如何
选择
假设函数
的
度数?
、
、
、
在正常
的
机器
学习
问题中,你会得到许多
特征
(例如:-如果你正在制作一个图像识别器),所以当有很多
特征
时,你不能可视化数据(你不能绘制图形)。在不绘制图形
的
情况下,有没有一种方法来确定我们应该
使用
多大程度
的
假设函数来解决这个问题?如何确定
使用
的
最佳假设函数?例如:-w(0) + x(1)*w(1) + x(2
浏览 0
提问于2012-10-11
得票数 3
回答已采纳
2
回答
关联与相
互信息
与让模型决定
、
、
、
我最近遇到了
互信息
的
概念,并开始阅读它。由于我看到它可以得到非线性关系,在我看来,与相关系数相比,
选择
在ML模型中保留哪些
特征
可能是一种更有力
的
方法。y_vals, alpha=0.25) plt.xticks([])plt.show()然后,我计算了x
特征
和这些y
特征
之间
的
相关系数和MI分数。因此,我
的
问题是:当做一个ML项目(所以关系不
浏览 0
提问于2022-10-14
得票数 2
2
回答
群套索与
特征
选择
、
、
我有一个包含大量分类变量和二进制目标变量
的
数据集,我想把它放到svm中。我将分类变量转换为虚拟变量,因为我
的
观察结果比我想要执行
的
特性
选择
的
变量少得多。因为我把分类变量转换成虚拟变量,所以我知道我不能
使用
简单
的
lasso,因为它会删除部分虚拟变量。 我正在寻找一个包来实现具有二进制目标的python上
的
群lasso,但是我找不到任何。据我所知,稀疏套索是组合套索和套索
的
组合。我尝试将它与参数值一起
使用
到group_r
浏览 0
提问于2022-08-17
得票数 1
2
回答
特征
冗余
、
、
为什么
特征
是相互依赖
的
,具有高度
相关性
的
特性,意味着它们是多余
的
?另外,PCA是否有助于去除
冗余
/不相关
的
特征
,还是在我们
的
数据集上运行PCA之前,必须去除
冗余
/无关
的
特征
?
浏览 0
提问于2016-06-17
得票数 2
回答已采纳
3
回答
特征
选择
、
特征
提取、
特征
权重
的
差异
、
、
、
我有点搞不懂“
特征
选择
/提取器/权重”意味着什么以及它们之间
的
区别。当我读文献
的
时候,我发现这个词
使用
得很松散,有时我觉得很失落,我最关心
的
是-- 如果我训练分类器--通过一个
特征
集要求分类器注意文档中单词<e
浏览 2
提问于2010-01-29
得票数 14
3
回答
如何评价
特征
选择
方法?
、
、
、
你好,我
的
猜测:在应用
特征
选择
筛选器之
浏览 4
提问于2013-01-08
得票数 2
2
回答
如何
选择
特征
选择
方法?是按数据还是按某些规则?
、
我一直在
使用
一些单独
的
特征
选择
方法,e.g.RFE或Select K best,
用于
多标签分类。是否有一种技术或方法可以
用于
动态
选择
特征
选择
方法?例如,根据测试数据
的
统计还是基于规则
的
方法?
浏览 6
提问于2015-04-18
得票数 0
4
回答
将数字列转换为0到1之间
的
列是很好
的
做法吗?
对数据科学来说是比较新
的
。我听说了一些关于将包含整数
的
列转换为0到1之间
的
范围
的
事情,我认为原因是,这样所有的列在它们
的
范围内都会更相似。我认为,还有一个步骤是移除离群值(非常高
的
整数),这样就不会导致所有其他结果都被扭曲为一个低分数。如果是的话,是否有一个简单
的
命令可以使其在Pandas数据集中实现?
浏览 0
提问于2020-03-05
得票数 3
回答已采纳
2
回答
盲
特征
工程
、
、
、
我收到了一个分析数据集,其中有~100个
带有
匿名列名
的
数字列(X1、X2、X3等.)并要求
进行
二进制分类。基于SVM
的
分类算法具有较好
的
分类精度(> 95%),但由于对列没有直觉,除了标准标度、零值替换等外,我无法在
特征
工程或
特征
生成方面做更多
的
工作。对于如何
进行
某种自动特性生成,即各种列
的
简单数学组合以创建新
的
、有用
的
特性,是否有任何标准逻辑?这类东西对线性或基于树
浏览 0
提问于2019-07-30
得票数 3
1
回答
我应该
使用
一个热编码
的
特征
选择
吗?
、
、
、
我进退两难,我
使用
的
是一个热编码,我需要
进行
特征
选择
(对于分类和数值特性),我有一些不太重要
的
特性,但我不想
使用
一些算法来完成,而不是手动
的
。我
的
问题是双重
的
- 我是在一次热编码之后还是之前做
的
?
浏览 2
提问于2020-10-08
得票数 0
回答已采纳
3
回答
PCA或SVD在机器
学习
中
的
重要性
、
在这段时间里(特别是在Netflix竞赛中),我总是会遇到这个博客(或排行榜论坛),他们提到如何通过对数据应用简单
的
SVD步骤来帮助他们减少数据
的
稀疏性,或者总体上提高他们手头算法
的
性能。一般来说,我手中
的
数据是非常嘈杂
的
(这也是bigdata
的
有趣部分),然后我确实知道一些基本
的
特征
缩放东西,比如对数变换东西,平均归一化。但是像SVD这样
的
东西有什么用呢?假设我有一个巨大
的
用户评分movies..and矩阵,然后在
浏览 1
提问于2012-03-07
得票数 36
回答已采纳
2
回答
scikit
-learn fit函数错误
、
、
、
我正在尝试为CIFAR-10数据创建一个简单
的
分类器,但是当我尝试执行这段python代码时:from sklearn.multiclass import OneVsRestClassifier, dicts[i]['labels']))只要x和y
的
大小不是太大但是当我尝试了2个批次
的
20000个样本(或全部5个批次
的
50000
浏览 1
提问于2017-12-13
得票数 0
4
回答
主成分分析与
特征
选择
的
区别
、
、
机器
学习
中
的
主成分分析(PCA)和
特征
选择
有什么不同?PCA是
特征
选择
的
一种手段吗?
浏览 0
提问于2013-04-27
得票数 20
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Featurewiz-Polars:基于XGBoost的高性能特征选择框架,一行代码搞定特征选择
利用scikit-learn进行机器学习:特征工程(二)特征选择
机器学习之特征工程(一)
机器学习-特征选择
7,特征的选择
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券