腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(565)
视频
沙龙
1
回答
比较
来自
多个
模型
的
回归
模型
系数
的
森林
小区
刻
面
网格
、
、
、
、
我目前正在使用30个数据集,它们具有相同
的
列名,但不同
的
数字数据。我需要将线性混合
模型
和广义线性
模型
应用于数据集
的
每个实例,并在
森林
地块上绘制产生
的
固定影响
系数
。当前数据
的
结构如下(为简单起见,对每个列表元素使用相同
的
数据集): library(lme4) # There's definitely a better way这需要大量
的
时间,
浏览 18
提问于2021-11-11
得票数 0
回答已采纳
1
回答
如何为分类
模型
选择正确
的
预测器?
、
、
、
、
我有两个模特:随机
森林
模型
So,应该使用哪些方法来选择正确
的
预测器,以便
比较
这两个
模型
? 谢谢
浏览 0
提问于2021-08-19
得票数 0
1
回答
随机
森林
回归
中
的
树木数量
、
我正在学习随机
森林
回归
模型
。我知道它形成了许多树(
模型
),然后我们可以通过平均所有树
的
结果来预测我们
的
目标变量。我对决策树
回归
算法也有一定
的
了解。我们怎样才能形成最佳
的
树木数量呢?例如,我有一个数据集,其中我正在预测人员工资,而我只有两个输入变量,分别是“经验年限”和“绩效得分”,那么使用这样
的
数据集我可以形成多少随机树?随机
森林
树依赖于输入变量
的
数量吗?任何好
的
浏览 127
提问于2019-06-08
得票数 1
1
回答
如何使用插入符号
比较
不同
的
模型
,调整不同
的
参数?
、
、
、
、
我试图实现一些函数来
比较
五种不同
的
机器学习
模型
来预测
回归
问题中
的
一些值。 我
的
意图是做一套功能,可以训练不同
的
代码,并将它们组织成一系列
的
结果。通过实例选择
的
模型
有: Lasso
模型
、随机
森林
模型
、SVM
模型
、线性
模型
和神经网络
模型
。为了调优某些
模型
,我打算使用Max:
的
引用
浏览 1
提问于2019-02-11
得票数 1
1
回答
如何
比较
监督学习算法及其技术集成学习算法?
、
、
、
、
我不得不
比较
支持向量机和随机
森林
算法,但是我搞不懂如何
比较
它,比如支持向量机是监督学习算法,随机
森林
是集合学习算法。帮助我如何
比较
它在哪一点上像-在分类,在
回归
。
浏览 0
提问于2020-04-17
得票数 0
回答已采纳
1
回答
编辑Stata coefplot中
的
置信区间
、
我在Stata中使用coefplot命令来绘制
来自
多个
回归
模型
的
系数
和置信区间。我绘制了4个不同型号规格
的
相同
系数
(X)。有一个
模型
规范(替代标准误差),我不知道如何在Stata中估计,但可以使用R进行估计。这意味着对于一个
模型
规范,我在R中有标准误差,但在Stata中没有。有没有一种简单
的
方法来手动修改coefplot中
的
标准误差?我
的
代码是: coefplot
浏览 472
提问于2021-04-29
得票数 2
回答已采纳
1
回答
我应该使用哪个Scikit学习应用程序来处理我
的
数据?(Python)
、
、
我正在编写一个程序,将需要大量
的
数据,如叶绿素水平,水温,氮/磷水平等,以预测藻类在水体中
的
生长。影响藻类生长
的
因素很多。因此,我不知道我应该在Scikit学习库中使用哪个应用程序来容纳所有不同
的
列。具体来说,还有17列我想说明(其中一半是标识符,如果数据可能是不正确
的
)。我应该使用什么来解释所有的列?
浏览 0
提问于2021-11-30
得票数 2
1
回答
学习特征选择停止准则(SelectFromModel)
、
、
Sklearn有几个用于特征选择
的
功能,可以让用户确定所选子集
的
大小。这方面的一个例子是SelectKBest,其中用户确定"k“
的
值,这是性能最好
的
特性
的
数量。
浏览 0
提问于2016-07-15
得票数 0
回答已采纳
2
回答
属性对Python中特定目标的预测能力,使用Sklearn中
的
特性选择
、
、
、
、
Scikit-Learn (或一般
的
algos )中是否有任何特征选择方法给出了属性预测特定目标的能力/预测能力/重要性
的
权重?例如from sklearn.datasets import load_iris,将4个属性
的
权重分别排序以分别预测3个虹膜物种,但对于更为复杂
的
数据集w/ ~1k-10k属性进行排序。我正在寻找类似于feature_importances_
的
。然而,RandomForestClassifer为整个预测过程
的
每个属性赋予权重。首先,
浏览 3
提问于2016-11-23
得票数 9
1
回答
gridSearch性能测量效应
、
、
我有一个任务,它要求我: 使用超参数调优从前面的步骤中改进
模型
的
性能,并根据您选择
的
度量(或度量)使用
网格
搜索来选择最终
的
最优
模型
。选择一个给定任务
的
最优
模型
(在特定领域上
比较
多个
回归
者)需要选择性能度量,例如,R2(确定
系数
)和/或RMSE (根均方误差)来
比较
模型
的
性能。cv=2,scoring='r2
浏览 0
提问于2019-03-14
得票数 0
3
回答
超参数整定与分类算法
的
比较
、
、
、
、
对于分类算法
的
比较
,我有一个疑问。 我正在做一个关于数据集
的
超参数调优和分类
模型
比较
的
项目。我们
的
目标是为我
的
数据集找出最适合我
的
超参数
的
模型
。例如:我有两个分类
模型
(支持向量机和随机
森林
),我
的
数据集有1000行和10列(9列是特性),最后一列是可分层
的
。在此基础上,利用CV = 10
的
网格
浏览 0
提问于2020-12-31
得票数 0
回答已采纳
1
回答
R中随机
森林
回归
模型
的
corr.bias参数
、
、
、
我在R中使用随机
森林
的
回归
模型
,我发现参数corr.bias根据手册是“实验性
的
”,我
的
数据是非线性
的
,我只是想知道将这个参数设置为true是否可以增强结果,另外我不知道它对非线性数据是如何工作
的
,所以如果有人能解释一下这个校正偏差在随机
森林
包中是如何工作
的
,以及它是否可以增强我
的
回归
模型
,我真的很感激。
浏览 3
提问于2013-07-24
得票数 3
1
回答
GLMMadaptive (R)中
的
零膨胀两部分
模型
:关于固定效应零部分?
、
、
我使用R中
的
GLMMadaptive包运行一个障碍对数正态
模型
,连续部分和零部分都有固定效果中定义
的
范畴变量。我想对这些分类变量进行一次方差分析,以判断是否存在主要影响。我已经看到,使用glmmTMB包,您可以分别对条件
模型
和零部分
模型
分别运行ANOVA,就像演示
的
那样。 是否有类似的策略可用于GLMMadaptive包?(据我所知,glmmTMB不支持障碍对数
模型
)。也许使用
来自
emmeans包
的
joint_tests函数?如果是这
浏览 7
提问于2021-02-10
得票数 1
回答已采纳
1
回答
元from提供了与原始值不同
的
95%CI。
、
我使用元数据包组合线性
回归
模型
中
的
β
系数
。我使用了以下代码。我为rma函数提供了报告
的
se和beta值。但是,当我看到
森林
地块时,95%
的
置信区间与研究报告中
的
不同。我还通过运行三个
模型
并结合
系数
,使用mtcar数据集进行了尝试。尽管如此,我们在
森林
地块上看到
的
95%CI仍与原始
模型
不同。这些偏差远非四舍五入
的
误差。下面是一个可重复
的</
浏览 8
提问于2022-02-24
得票数 1
回答已采纳
1
回答
coefplot:几个
模型
,每个
模型
在一个图中有几个
系数
、
我想要显示两个
回归
的
系数
(以及它们
的
置信区间)。使用Ben Jann
的
nice coefplot (ssc install coefplot),我可以创建一个只有一个子图
的
图,其中包含
来自
所有
模型
的
所有
系数
,但我不能成功地按
模型
而不是按
系数
对
系数
进行排序或者,我可以通过
系数
创建一个包含
多个
子图
的
图,这不是我所需
浏览 10
提问于2017-04-20
得票数 2
1
回答
特征中
的
共线性和多重共线性?
、
、
、
数据科学家/ML工程师最常用
的
检测特征之间共线性(或)多重共线性
的
一些先进或基本方法是什么?
浏览 0
提问于2019-03-18
得票数 0
5
回答
从K折交叉验证中选择哪个
模型
、
、
、
、
我读到了关于交叉验证以及如何使用它来选择最佳
模型
和估计参数
的
内容,我并不真正理解它
的
含义。假设我建立了一个线性
回归
模型
,并进行了10折交叉验证,我认为这10个
模型
中
的
每一个都会有不同
的
系数
值,现在我应该选择10个不同
的
系数
值作为我
的
最终
模型
或估计参数。或者,我们使用交叉验证
的
目的只是为了找到平均误差(在我们
的
情况下,平均为10个
浏览 3
提问于2017-08-03
得票数 2
1
回答
如何计算ML问题上
的
概率而不是实际分类
、
、
每一行由4个以布尔值表示
的
列(特性)组成。第5列表示类,它还接受布尔值。下面是一个例子(它们几乎是随机
的
):0,1,1,0,10,0,0,0,00,0,0,0,0 现在,我想要做
的
是建立一个
模型
,这样对于任何给定
的
输入(新行),系统都不会返回类本身(就像在常规分类问题中那样),而是这个特定输入属于0类或1类
的
概率。更重要
的
是,如何生成与该计算相关
的
置信区间或错误率?
浏览 4
提问于2014-06-17
得票数 0
回答已采纳
2
回答
Logistic
回归
模型
&R中范畴变量
的
多重性
、
、
、
我创建了一个逻辑
回归
模型
如下:然而,我想减少进入
模型
的
自变量
的
数量,也许减少到20个左右有人能解释一下如何确定哪些范畴变量是共线性
的
,以及我在从
模型
中删除变量时应该使用
的
阈值吗? 谢谢!
浏览 0
提问于2014-05-04
得票数 0
1
回答
在对
回归
算法进行特征选择时,我选择了多少个特征?R2和RMSE是衡量过度适应成功
的
好方法吗?
、
、
、
、
上下文:我目前正在制作和
比较
机器学习
模型
,以预测住房数据。我有大约32000个数据点,42个特征,我正在预测房价。我
比较
随机
森林
回归
,决策树
回归
和线性
回归
。我可以看出存在一些过度拟合
的
情况,因为我
的
初始值与交叉验证值之间
的
关系如下: RF: 10倍R平方= 0.758,neg RMSE = -540.2 vs未验证
的
R平方为0.877,RMSE为505.6LR: 10倍R平方= 0.695,neg
浏览 0
提问于2021-01-14
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
无线AI应用的经典Case-流量预测
交叉验证和超参数调整:如何优化你的机器学习模型
决策树的相关概念以及实现(3)
【视频讲解】CatBoost、LightGBM和随机森林的海域气田开发分类研究|数据分享
数据分享|python分类预测职员离职:逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM交叉验证可视化
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券