腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(454)
视频
沙龙
1
回答
Optuna
lightgbm
集成
给出
分类
特征
错误
、
、
、
我正在使用
optuna
lightgbm
集成
创建一个模型,我的训练集有一些
分类
特征
,我使用lgb.Dataset类将这些
特征
传递给模型,这里是Im使用的代码(注意: X_train,X_val,y_trainimport
lightgbm
as lgb 'boosting': 'gbdt',我相信lighgbm没有以它应该的方式
浏览 94
提问于2021-02-20
得票数 0
回答已采纳
1
回答
如何利用金枪鱼训练LGBMClassifier
、
、
我试图将lgbm与
optuna
一起用于
分类
任务。import
optuna
.integration.
lightgbm
as lgbm但我得到了以下
错误
<clas
浏览 10
提问于2022-06-02
得票数 0
1
回答
Lightgbm
vs xgboost与catboost
、
、
、
、
我的问题是:什么时候你宁愿使用xgboost而不是
lightgbm
呢?那卡波普呢?
浏览 0
提问于2019-04-19
得票数 22
回答已采纳
2
回答
为什么
lightgbm
的`categorical_feature`不工作?
、
、
我想用
LightGBM
来预测房子的tradeMoney,但是当我在lgb.Dataset of
LightGBM
中指定了categorical_feature时,我会遇到麻烦。int64hospitalNum int64我使用
LightGBM
print("CV Score: {:<8.5f}".format(r2_score(target, oof_lgb))) 但是,
浏览 0
提问于2019-05-10
得票数 8
回答已采纳
2
回答
如何将数据采集的重点放在提高持久测试集的准确性上?
、
、
我的任务是为一个
分类
问题提出一个95%精度的模型。我有训练数据和坚持数据集。为了实现这一目标,我有机会请求具有期望特性的特定类的数据。还请注意,这是一个多类
分类
问题。
浏览 0
提问于2021-09-12
得票数 1
3
回答
对于具有变量间交互作用的大型、噪声数据集,最佳的机器学习算法是什么?
、
、
我最初的想法是神经网络,但我看不出一个神经网络如何能够正确地预测变量之间的交互作用(即。x1 * x2),因为每个节点都只是先前输入的总和?我的数据集很大,有400个特性和5,000,000个实例。所有数据都是百分位数,标签也是百分位数。数据集也相当嘈杂(客户数据,预测成为返回客户的可能性)。
浏览 0
提问于2020-12-23
得票数 3
2
回答
使用
集成
投票
分类
器查找前3个
特征
重要性
、
、
、
、
我有一个
分类
问题,我必须使用投票
分类
器方法找到前3个
特征
,其中包含PCA,xgboost,随机森林,逻辑注册和决策树。例外:它应该给我使用投票
分类
器的变量的
特征
重
浏览 0
提问于2019-10-30
得票数 1
1
回答
从
特征
集中选择
集成
特征
、
、
、
我有一个关于集合
特征
选择的问题。 我的数据集由1,000个样本和大约30000个
特征
组成,它们被
分类
为标签A或标签B。我想做的是挑选一些可以有效地对标签进行
分类
的
特征
。我使用了三种方法,单变量方法(皮尔逊系数),套索回归和SVM-RFE(递归
特征
消除),所以我从它们中得到了三个
特征
集。我使用python scikit-learn进行特性选择。然后我在考虑
集成
特征
选择方法,因为
特征
的大小太大了。在这种情况下,如何制作具
浏览 2
提问于2015-12-11
得票数 3
1
回答
在
LightGBM
python API中调用feature_importance时遇到分段
错误
、
我使用的是
LightGBM
2.0.6 Python API。我的训练数据有大约80K个样本和400个
特征
,我正在训练一个大约2000次迭代的模型,该模型用于多类
分类
(#classes = 10)。当训练模型时,当我调用model.feature_importance()时,我遇到了分段
错误
。我尝试生成用于测试的人工数据(具有相同数量的样本、类、迭代和超参数),并且我可以成功地获得
特征
重要性列表。因此,我怀疑问题是否会发生取决于训练数据。
浏览 1
提问于2017-08-28
得票数 1
2
回答
改进boosting模型,降低均方根误差
、
、
、
、
您好,我正在解决一个由13个
特征
和550068行组成的回归problem.My数据集。我尝试了不同的不同模型,发现boosting算法(即xgboost,catboost,
lightgbm
)在大数据set.here上执行得很好gbm = lgb.LGBMRegressor我如何对这些算法(xgboost,catboost,
lightgbm
)进行超参数调整?我使用的是Windows10 os和英特尔i5 7代。
浏览 3
提问于2018-06-05
得票数 0
1
回答
SHAP不使用
LightGBM
分类
特性
、
、
然而,Shap在
分类
特征
上给了我
错误
。例如,我有一个功能“吸烟者”,其价值包括“是”和“否”。我从Shap那里得到了一个
错误
:我错过任何设置了吗?顺便说一句,我知道我可以使用一次热编码来转换
分类
特性,但我不想这样做,因为LGBMClassifier不需要一次热编码就可以处理
分类
特性。下面是示例代码:(shap版本为0.40.0,
lightgbm</em
浏览 3
提问于2022-05-14
得票数 2
回答已采纳
3
回答
LightGBM
-为什么独家功能捆绑?
、
、
、
、
我目前正在学习GBDT,并开始阅读
LightGBM
的研究论文。问:如果我们有一个单一热编码的
分类
特性,这个算法不是简单地将一个热编码逆转为一个数字编码,从而取消我们以前编码的所有优点吗?
浏览 0
提问于2018-11-30
得票数 10
回答已采纳
1
回答
包装方法的
集成
分类
器
、
、
、
、
我正在尝试组合多个
分类
器(ANN,SVM,kNN,.等)使用
集成
学习(viting,堆栈...etc.)。如果在matlab或R中可
浏览 4
提问于2012-11-17
得票数 0
2
回答
不平衡数据集评价指标的解释
、
、
我目前正在处理一个严重不平衡的数据集的
分类
问题。更具体地说,它是一个包含大约290 k行数据的欺诈检测数据集,0类(非欺诈)的分布率为99.8%,1类(欺诈)的分布率为0.17%。
浏览 0
提问于2023-04-04
得票数 0
1
回答
LightGBM
on Numerical+Categorical+Text Feature >> TypeError:未知类型parameter:boosting_type,got:dict
、
、
、
、
我试图在一个由数值、
分类
和文本数据组成的数据集上训练一个
lightGBM
模型。但是,在培训阶段,我会遇到以下
错误
:'num_class':5,'num_leaves':200, ('lgbm', clf)pip
浏览 14
提问于2021-02-20
得票数 3
回答已采纳
1
回答
我们能否使用经过图像
分类
训练的模型来帮助tensorflow中的目标检测?
、
、
、
、
我用Tensorflow-for-poets建立了一个图像
分类
模型。但是,我现在想在对象检测模型中使用经过训练的模型。我可以直接导入.pb文件吗?还是必须重新训练模型?当我尝试这个
错误
时,我会收到这个
错误
。 KeyError:“名称'image_tensor:0‘指的是不存在的张量。
浏览 0
提问于2019-06-17
得票数 1
1
回答
这个算法属于哪一类?
、
、
在Sklearn
分类
中的类中,Catboost似乎属于
集成
方法。那么,与AdaBoost、套袋等相比,Catboost的优势是什么?
浏览 0
提问于2018-10-05
得票数 2
回答已采纳
1
回答
Weka特性选择(InfoGainAttributeEval,ChiSquaredAttributeEval)
我是新来的Weka,我有两类数据要
分类
。我可以用加权来
分类
它(词的出现,TFIDF或单词的存在)。我希望使用在Weka中
集成
的
特征
选择机制来提高
分类
器的准确性,如下所示: BufferedReader trainReader = new BufferedReader(因为我觉得
特征
选择方法和加权方法是一样的。我还必须
给出
我应该拥有的
特征
的"n“号吗?这对
分类
器的结果影响很大,这是如何设置的,例
浏览 0
提问于2014-01-15
得票数 1
回答已采纳
1
回答
LightGBM
fit抛出带有pd.cut
分类
功能的"ValueError:检测到循环引用“
、
、
、
、
我一直在非常满意地使用
lightGBM
模型,因为我拥有具有数千万个
特征
和数百万行的大型数据集,以及大量的
分类
列。我很喜欢
lightGBM
获取pandas数据帧的方式,该数据帧具有简单的astype('category')定义的
分类
特征
,而无需任何一次性编码。我还有一些浮动列,我正在尝试将它们转换为
分类
存储箱,以加快收敛并强制决策点的边界。5列是整型数字,我将其转换为具有astype类型的
分类
5列是浮点型数字。保持浮点型数字为浮点型一
浏览 71
提问于2019-04-29
得票数 3
回答已采纳
1
回答
如何处理
分类
中基于时间持续时间的列?
、
、
、
我专门问
集成
模型,但是将这个问题扩展到其他场景,持续时间列最好的格式是什么?(例如毫秒、秒、分钟(整数)、分钟(浮点数)、一列为分钟、一列为秒等)
浏览 0
提问于2022-03-21
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
SPA 大赛:win10 python3.5.X 下开启 lightgbm 支持
三行代码,AutoML性能提高十倍!微软开源FLAMA,比sota还要sota
流行于机器学习竞赛的Boosting,一文讲透足够了
数据分享|python分类预测职员离职:逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM交叉验证可视化
【视频讲解】CatBoost、LightGBM和随机森林的海域气田开发分类研究|数据分享
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券