腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3495)
视频
沙龙
2
回答
单
标签
多
类
分类
随机
森林
蟒蛇
、
、
、
、
我是机器学习的新手,目前正在处理由
分类
数据组成的csv文件格式的数据集。作为预处理的一种手段,我对数据集中的所有变量进行了热编码。 目前,我正在尝试应用
随机
森林
算法将条目
分类
为4个类别中的一个。
浏览 19
提问于2019-10-02
得票数 0
回答已采纳
1
回答
对于不同大小的集合,最好的机器学习方法是什么?
我有以下问题:我有两组不同的
标签
(用N.E.R提取),并且给出了第一组
标签
(a、b、c或d)的组合,我有一组监督的第二组(x,y,z)的最佳组合作为“答案”。问题是,两者的大小都可能不同。
浏览 0
提问于2021-03-18
得票数 0
2
回答
随机
森林
分类
器中的
单
热编码
、
、
是否需要对python中的
随机
森林
分类
器进行一次热编码?我想从逻辑上理解,
随机
林中是否可以用
标签
编码来处理
分类
特性,而不是
单
热编码。
浏览 4
提问于2021-01-14
得票数 0
1
回答
我如何使用一个热编码
标签
与一些滑雪
分类
器?
、
我有一个有10个
类
的
多
类
分类
任务。因此,我使用sklearn的将单列
标签
转换为10列
标签
。我在试着适应训练数据。虽然我能够在中做到这一点,但在与进行匹配时,我得到了以下错误消息我知道在这两个
分类
器中,y的允许形状是不同的: GaussianNB
浏览 3
提问于2016-11-13
得票数 3
回答已采纳
1
回答
为sckit-learn中的
多
类
问题编码
标签
、
、
、
当使用scikit的
分类
器-学习
多
类
问题时,是否需要用一种热编码对
标签
进行编码?例如,我有3个
类
,在将这些数据输入不同的
分类
器以进行培训时,简单地将它们标记为0、1和2。据我所知,它似乎运转正常。有些算法,如
随机
森林
,本机处理
分类
值。对于logistic回归、多层感知器、高斯朴素Bayes和
随机
森林
等方法,如果我没有弄错的话,这些方法似乎是本机处理
分类
值。这个评估是正确的吗?谁的科
浏览 1
提问于2018-07-25
得票数 3
回答已采纳
2
回答
如果不为每个单独的
类
构建
分类
器,您如何获得所有要预测的
类
的概率?
、
、
给定一个
分类
问题,有时我们不仅要预测一个
类
,还需要返回它是一个
类
的概率。如果不构建新的
分类
器来预测y=0、y=1、y=2...y=C。因为训练C
分类
器(比方说C=100)可能相当慢。 要做到这一点,可以做些什么?什么
分类
器自然可以很容易地给出所有的概率(我知道的一个是使用100个输出节点的神经网络)?但是如果我使用传统的
随机
森林
,我就无法做到这一点,对吧?我使用Pyth
浏览 3
提问于2016-09-28
得票数 1
2
回答
如何将
随机
林
分类
器应用于未标记的数据集?
、
、
、
使用sklearn,我刚刚完成了训练,调优超参数和测试一个
随机
森林
多
类
分类
器使用RandomizedSearchCV。我得到了最好的参数,最好的分数等等。所有这些都是用
标签
数据集完成的。现在,我想将这个
分类
器应用到一个没有
标签
的数据集上(这意味着只有特性而没有
类
)来进行
类
/
标签
预测。我还没试过什么,因为我被卡住了。
浏览 12
提问于2022-11-29
得票数 -2
2
回答
对于这个问题,合适的机器学习算法是什么?
我有一个数据集,其中每个示例包含一个用户id、一个日期和与该特定用户关联的状态(活动、过期和停用)。dataset包含一整年的记录,但是有几天会丢失,该项目的目标是预测用户在这些缺失日期的状态。下面是一个记录的例子: "date": "20190101", "status": "active"由于我要预测的变量的值是绝对的,并且有3种可能的值,所以我的研究给我带来了多项Logistic回归。我想用Python来解决这个问题
浏览 0
提问于2021-10-26
得票数 1
1
回答
多
类
逻辑回归在SciKit学习中的应用
、
、
、
对于
多
类
情况,我对Scikit的Logistic回归的正确调用有问题。我使用的是lbgfs解算器,并且将multi_class参数设置为multinomial。我不清楚如何在拟合模型时传递真实的
类
标签
。我曾假设它与
随机
森林
分类
器
多
类
类似/相同,其中您可以传递n_samples、m_classes数据帧。ValueError:错误的输入形状( 20,5) --在这个小示例中,有5个
类
,20个样本。在检查时,f
浏览 0
提问于2016-04-10
得票数 4
回答已采纳
1
回答
文本
分类
:
多
文本
分类
与
多
类
文本
分类
、
、
在文献综述的基础上,我发现最常用的方法之一是问题转换方法.它将
多
标号问题转化为多个
单
标号问题,
分类
结果只是每个
单
标签
分类
器的简单结合,采用二进制相关的方法。由于单个
标签
问题可以被描述为二进制
分类
(如果有两个
标签
)或
多
类
分类
问题(如果有多个
标签
,即labels>2),目前的转换方法似乎都将
多
标签
问题转化为多个二进制问题。在这
浏览 5
提问于2016-03-02
得票数 1
1
回答
在“标准”
随机
森林
中使用哪一种决策树模型?
、
也许还有一个更普遍的问题: 既然C5.0树通常比CART有更好的性能,为什么人们仍然使用CART来构建
随机
森林
(或者人们已经在这样做了)?
浏览 0
提问于2020-02-15
得票数 1
1
回答
支持
多
标签
分类
的算法
、
、
在sklearn的文档中,它指出有几种算法固有地支持
多
标签
分类
,例如RandomForest或MLP:https://scikit-learn.org/stable/modules/multiclass.html
浏览 0
提问于2019-06-06
得票数 2
回答已采纳
1
回答
增加管道:
多
标签
分类
器预测的修正器
我已经创建了一个管道,在结束时使用
随机
森林
分类
器进行
多
标签
预测。所以我想做的就是修改
随机
森林
分类
器的预测。
浏览 0
提问于2020-03-03
得票数 0
1
回答
样本
随机
森林
分类
的特征重要性
、
使用
随机
森林
,是否可以确定哪些特征是驱动特征,以便将特定样本
分类
为A
类
?问一个
随机
森林
的问题有意义吗?
浏览 0
提问于2015-09-25
得票数 2
1
回答
使用具有多种结果的C4.5
分类
器
我在看C4.5
分类
器的机器学习任务。随后,一旦经过训练,我想在大型数据集上运行
分类
器。 在我发现的所有例子中,结果只有两个状态(在这个例子中,打或不打)。c4.5
分类
器能否将伦敦(加拿大)、伦敦(英格兰)、伦敦(法国)作为结果类处理,或者我是否需要为伦敦(加拿大)、真假等设置不同的
分类
器?
浏览 4
提问于2013-06-10
得票数 0
1
回答
Spark中使用梯度提升树的
多
类
分类
:仅支持二
分类
、
、
、
、
同时尝试在Spark mllib中使用梯度增强树运行
多
类
分类
。但是它给出了一个错误“只支持二进制
分类
”。因变量有8个水平。数据有276列和7000个实例。
浏览 1
提问于2016-03-07
得票数 1
2
回答
为非线性
分类
器寻找特定于
标签
的顶部特征
、
、
、
、
在
随机
森林
/ XG Boost
分类
器中,是否有给出每个
标签
顶部特征的函数?classifier.feature_importances_只提供
分类
器作为一个整体的顶级特性。寻找一些类似的classifier.coef_,为支持向量机和朴素贝叶斯
分类
器提供
标签
特定的顶级特征在学习。
浏览 3
提问于2019-01-21
得票数 2
回答已采纳
1
回答
随机
森林
多
类
分类
、
、
目前,我们正在使用产品名称作为功能,产品类别作为
标签
我创建了一个小的数据集,其中包括20个类别和100个记录为每个
标签
。所以总记录是2000。问题: 因此,我继续创建了一个包含1800个类别的
标签
模型,每个类别的记录从500-1500个不等。当我使用新的数据集运行相同的模型时,我的准确率只有19%,预测值的50%以上指向同一
标签
。
浏览 0
提问于2018-02-09
得票数 1
回答已采纳
1
回答
多个
分类
算法总是以相同的分数准确地预测。这正常吗?如果没有,我应该怀疑什么?
、
我一直在研究一个
多
标签
分类
问题。我正在使用Python机器学习库来实现
分类
算法。对于交叉验证,我使用重复的K-交叉验证.对支持向量机、Logistic回归、
随机
森林
、决策树、K-邻域和朴素贝叶斯等方法进行了实验,并采用了二值相关、
分类
链和
标签
幂集变换等方法。我注意到,对于
分类
链,支持向量机,Logistic回归,
随机
森林
,和K-邻居总是达到相同的子集准确性和hamming损失。对于
标签</e
浏览 0
提问于2018-12-03
得票数 0
1
回答
R中使用H2O的平衡
随机
森林
、
、
、
由于我目前正在研究一个高度不平衡的
多
类
分类
问题,我正在考虑平衡
随机
森林
()。您是否有使用H2O实现平衡
随机
森林
的经验?若有,可否请你详述以下问题: 是否有可能改变在H2O中创建引导样本的默认过程,以得出平衡子样本(对于
随机
森林
中的每次迭代,从少数
类
中提取一个引导样本。从大多数
类
中
随机
抽取相同数量的案例(通过替换)为每个树增长原始数据集?
浏览 16
提问于2018-08-23
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习100天-Day1403多类分类&多标签分类&多输出分类
人工智能–AdaBoost算法
随机森林
随机森林random forest
机器学习三人行-手写数字识别实战
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券