腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4497)
视频
沙龙
1
回答
我
应该在
SMOTE
之前
还是
之后
执行
GridSearch
(
用于
调整
超
参数
)?
、
、
、
、
我
使用不平衡数据通过scikit-learn
执行
分类并提高模型的准确性,
我
使用
SMOTE
技术创建了更多的合成数据。
我
想知道用
GridSearch
实现
超
参数
优化的最佳时机。
我
应该只使用原始数据
还是
使用original+synthetic数据?
浏览 12
提问于2019-10-30
得票数 0
1
回答
利用随机森林搜索具有不同特征的
超
参数
、
、
、
、
我
有一个数据集,
我
想在其中
执行
一个分类模型,所以我决定使用随机森林。
我
拥有的功能数量大约是200个,
我
想测试哪些功能集给我一个更好的结果。为了进行实验,
我
不想使用任何特性重要性方法。因此,
我
所做的就是将我的特性分成20,40,60,80和100个功能,而不需要替换。
我
正在使用
GridSearch
来
调整
我
的射频的
超
参数
。
我
要问的问题是,如果
浏览 0
提问于2020-01-26
得票数 5
回答已采纳
1
回答
改变卡雷特k倍交叉验证分类内的平滑
参数
、
、
我
有一个分类问题需要预测(例如,90% / 10%的不平衡二进制变量需要预测)。当我使用插入符号包
执行
我
的分析时,
我
指的是这个链接()。
我
把一切都完美地取消了,但最后一部分解释了如何更改
SMOTE
参数
: smotest <- list(name =
浏览 1
提问于2015-11-23
得票数 5
回答已采纳
2
回答
如何避免ML中的多
参数
调优?
、
假设
我
开发了一个动态系统来预测一些特定股票的未来。随着时间的推移,火车将动态变化。对于每一轮,
我
使用一个RandomSearchCV来调优Random Forest的
超
参数
,以使用特定的特性来预测某些股票的回报。
我
的重点是在这个问题中
调整
超
参数
。正如我所提到的,
我
在每一轮中都会
执行
一个
超
参数
调优,这需要花费大量的时间!(特别是当火车是巨大的),所以我正在寻找一种方法,以避免这个<e
浏览 0
提问于2022-06-29
得票数 2
2
回答
如何确定最佳的基线模型,以
执行
超
参数
调优在科学知识?
、
、
我
正在研究数据,在这些数据中,
我
尝试了不同的分类算法,并看看哪种算法作为基线模型的性能最好。
我
通常会选择最好的基线模型并在其上
执行
一个GridSearchCV,以进一步提高其基线性能。然而,如果假设作为基线模型(在本例中为AdaBoost)的模型仅通过
超
参数
调优提高1%,而最初
执行
得不太好的模型(例如SCV())具有更大的“潜力”,通过
超
参数
调整
来改进(例如,会改进4%),并且在
调整
之后</
浏览 2
提问于2021-08-08
得票数 1
回答已采纳
5
回答
scikit学习的不平衡
、
我
在Python程序中使用scikit-learn来
执行
一些机器学习操作。问题是
我
的数据集存在严重的不平衡问题。 有没有人熟悉scikit-learn或python中不平衡的解决方案?在Java中有
SMOTE
机制。在python中有类似的东西吗?
浏览 1
提问于2013-02-25
得票数 40
1
回答
利用损耗曲线进行模型
调整
、
我
想根据以下模型来
调整
激活函数:身份、逻辑、tanh和relu。
我
所做的是:📷在那
之后
,
我
得到了"adam“和"relu”作为
超
参数
,
我
用训练和测试集对它们进行了测试,所以我大致是这样做
浏览 0
提问于2020-10-03
得票数 1
回答已采纳
1
回答
超
参数
调谐阶数
、
、
我
试图对随机森林回归模型进行
超
参数
调整
。
我
的问题是-有什么命令我应该去做吗?比如从特定的
参数
开始,然后转移到另一个
参数
上?
我
应该每次只用一个
参数
来检查模型,
还是
对
我
正在检查的每个
参数
添加我已经找到的
参数
?Exmaple:如果
我
运行的模型只有n_job -1和min_sample_leaf,并且得到了min_sample_leaf的最佳值,现在<e
浏览 0
提问于2020-12-24
得票数 1
回答已采纳
1
回答
在随机森林回归中进行剪枝的正确方法是什么?
、
、
、
、
我
的问题的上下文:既然
我
在寻找随机森林(GRidSeachCV)的最佳
参数
,
我
应该如何输入ccp_alpha值?<e
浏览 2
提问于2020-08-13
得票数 0
1
回答
包含代码的机器学习模型的流程
、
、
、
我
将完成
我
的第一个数据科学项目,这个项目将进入
我
的GitHub投资组合。
我
试图跟随不同的项目,然而,因为每个项目都有自己的方式,
我
迷失了什么是正确的方式,什么是可选的。0.765 (0.027)>LR 0.837 (0.029)>SVM 0.766 (0.040) Logistic回归多
参数
整定或者,
我
是否需要将数据分割成训练/测试子集,并以最佳
参数
浏览 0
提问于2023-04-29
得票数 0
回答已采纳
4
回答
调整
参数
或选择模型
、
、
、
我
一直在阅读我们如何将我们的数据分成3部分;通常,我们使用验证集来帮助我们
调整
参数
和测试集,以便对我们的模型的表现有一个无偏的估计,这样我们就可以根据测试集的结果来比较模型。然而,
我
也读过模型选择
应该在
调优
参数
之前
完成。
我
有点糊涂了。哪一个必须先做另一个?验证集是否
用于
调优?如果是这样的话,我们应该如何在
调整
参数
之前
进行模型选择?
浏览 0
提问于2018-11-27
得票数 10
回答已采纳
3
回答
在R中有哪一个包可以做多类,过采样,在抽样下,两者都可以,并且可以被击打?
、
我
正在寻找包,可以做多类过度抽样,欠采样或这两种技术。
我
尝试使用ROSE包,但它只适
用于
二进制类。
我
的目标变量有4个类,其中%是。"
浏览 1
提问于2018-01-11
得票数 0
回答已采纳
1
回答
重写成员和懒惰的val
、
、
我
找到了关于如何使用惰性val将过激成员值传播到
超
类构造函数的。不幸的是,这篇文章并没有解释为什么这样做。
我
理解非惰性值不能被分配两次,因此,在超级构造函数中没有可用的值,因为必须跳过
超
类构造函数中的值分配,这样才不会将变量锁定到另一个值。但是,println语句(它在超级构造函数中
执行
,即在对新的延迟值进行签名
之前
)如何知道这个新值?
我
是不是把
执行
令搞糊涂了?
还是
println只是在构造对象
之后
才计算它的
参
浏览 1
提问于2013-08-04
得票数 2
回答已采纳
1
回答
随机森林工作流?
、
、
、
我
有一个数据集,它由相当多的列(超过1000)组成,相对于我目前正在运行随机森林回归的行数(370)。
我
有点困惑于处理各种任务的最佳方法,比如特性选择和交叉验证。目前,
我
所做的工作如下:用五重交叉验证对模型进行评价考虑到我所拥有的大量特性,以及
我
的模型的低性能,
我<
浏览 0
提问于2020-02-18
得票数 4
回答已采纳
1
回答
在每个fab调用上调用一个任务/函数
我
目前正在处理一个
用于
部署的fabric文件,
我
希望有一个总是被调用的任务或函数,而不管命令行中给出了哪些fab任务。这个函数
应该在
环境中设置一些默认值,并且
应该在
根据
参数
更新主机列表
之后
调用,但是在
之前
执行
任何“真正”任务
之前
的。 这是可能的吗?
还是
必须在每个任务开始时手动调用此函数?
浏览 1
提问于2014-12-22
得票数 0
回答已采纳
1
回答
如何将外部功能添加到我的管道?
、
、
、
、
我
也有同样的问题。在构建Pipeline和
执行
GridSearch
以找到最佳
超
参数
之前
,
我
想在稀疏矩阵(来自TfidfVectorizer)中添加新的数据列,在
我
的例子中,3列
用于
虚拟变量。目前,
我
可以使用下面的代码在没有
GridSearch
和Pipeline的情况下按模型
执行
此模型。add dummies to tvec sparse matrix X_train_tvec_du
浏览 38
提问于2020-11-01
得票数 1
回答已采纳
1
回答
整个模型开发过程的优化
、
、
、
我
想对整个模型开发管道
执行
全局优化。
我
有几个开发阶段,每个阶段都可以自动
执行
:预处理,去除异常/异常,过采样,特征选择,
超
参数
调整
。这些步骤中的每一个都有许多不同的实现。例如,您可以调优
超
参数
,删除10%未使用的函数,重复对
超
参数
的搜索。训练几个模型,并将它们组合成一个整体。用1种算法去除异常,然后再用另一种算法。在特征选择
之后
或
之前
删除异常。
我
浏览 0
提问于2022-12-11
得票数 0
2
回答
低分类精度
、
、
、
、
在预测
之前
,
我
通过winsorization (1%和99 %)减少了异常值的数量,并通过Yeo变换和数据集减少了大于1且小于-1偏斜度的特征中的偏度: https://i.stack.imgur.com对于这个问题,数据集是否太小(
我
是否应该像
SMOTE
这样的方法添加更多的示例?)课堂上的样本太少,不能做好吗?在
调整
超
参数
(例如,通过GridSearchCV之类的方法)
之后
,是否有可能获得至少60%的精度?
我
将补
浏览 0
提问于2022-04-25
得票数 2
1
回答
如何在Sklearn中使用管道时应用数据集平衡技术?
、
、
、
我
是机器学习的新手,并试图构建符合良好实践且不受偏见影响的机器学习模型。
我
已经决定使用Sklearn的Pipeline类来确保
我
的模型不容易发生数据泄漏。
我
正在构建一个ML模型,试图预测趋势Buy,持有,销售下个小时。 但是,
我
的多类分类数据集非常不平衡。虽然不一定要担心测试集是不平衡的,但重要的是,火车组是平衡的。然而,
我
已经进行了适当的研究,但是
我
找不到一个关于数据集再平衡步骤
应该在
哪里
执行
的答案。
应该在
缩放<e
浏览 0
提问于2020-04-04
得票数 4
1
回答
神经网络交叉验证:如何处理历元数?
、
、
、
我
使用交叉验证,因为
我
有x个测量数据库,
我
想评估
我
是否能够用x数据库的子集来训练一个神经网络,并将神经网络应用到看不见的数据库中。因此,
我
还介绍了一个测试数据库,它不
用于
超
参数
识别阶段。对于如何处理交叉验证中的历元数,
我
感到困惑,例如,
我
有许多历元= 100。有两种选择: 划时代数是一个需要
调整
的
超
参数
。在每个时代,跨越所有交叉验证迭代的平均误差被确定。在使用所有
浏览 1
提问于2020-04-29
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券