腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
用于
处理
cat
boost
的
不平衡
数据
python-3.x
、
catboost
catboost包中有没有像我们过去在python
的
xgboost包中一样
的
"scale_pos_weight“参数?
浏览 8
提问于2017-08-12
得票数 5
回答已采纳
2
回答
宏作为预
处理
指令
的
参数
c++
、
macros
、
c-preprocessor
面对是否有可能在预
处理
器中选择#include
的
问题,我立即认为不可能。参数化宏是否允许
用于
任何预
处理
指令?(#define/#undef除外) 有人能参考哪些地方允许这样做并进行总结吗?对于好奇的人来说,为了简单起见,可以使用
Boost
.Prepr
浏览 2
提问于2009-11-15
得票数 3
回答已采纳
1
回答
建立一个基于
不平衡
数据
的
模型可以吗?
machine-learning
、
scikit-learn
、
imbalanced-data
背景-我正在
处理
的
数据
集是高度
不平衡
的
,类
的
数量是543。
数据
以日期为界。经过5年
的
研究,我发现这种
不平衡
是固有的,而且是持久
的
。模型将得到
的
测试
数据
也将以一个日期范围为界,并且也会出现类似的
不平衡
。 造成
数据
不平衡
的
原因是消费金额不同,产品受欢迎程度不同。
处理
不平衡
会对企业
浏览 0
提问于2020-07-10
得票数 3
1
回答
Sagemaker XG-
Boost
(objective=reg:logistic)无法
处理
高度
不平衡
的
数据
集
machine-learning
、
logistic-regression
、
xgboost
、
amazon-sagemaker
我正在AWS Sagemaker上
处理
信用欺诈
数据
集。
数据
集高度
不平衡
。它只有0.1732%
的
欺诈交易。我想使用来自sagemaker
的
XG-
Boost
来预测一个给定
的
交易是欺诈性
的
(1)还是非欺诈性
的
(0)。当我将超参数中
的
目标函数设置为'multi:softmax‘和类别数= 2时,它给出了很好
的
结果,召回率为85%。当我将目标函数设置为'reg:logis
浏览 8
提问于2019-11-13
得票数 1
6
回答
Python:
处理
python机器学习中
的
不平衡
类
machine-learning
、
python
、
data-mining
、
dataset
、
pandas
,但我
的
数据
以类似的方式分发了数以千计
的
记录。为了使我
的
模型具有普遍性,我随机删除了相同百分比
的
数据
,这些
数据
属于1,2和3值。我按Col5中
的
每个值分组,然后删除某些百分比,从而减少了记录
的
数量。现在,我可以看到一定程度
的
提高
的
准确性,也合理地增加了预测值4在混淆矩阵。 这是否是正确
的
处理
方法(从模型有偏见
的
组中随机删除
数据
)
浏览 0
提问于2016-04-25
得票数 11
2
回答
带有分类
数据
的
随机森林只预测一个类别内
的
数据
python
、
scikit-learn
、
regression
我使用
的
数据
有分类
数据
,我用LabelBinarizer编码,所以我
的
数据
看起来像这样:123 0 1 0 0 每行只能有一个给定
的
类别。我想根据X中
的
项目
数据
数组来预测新项目的评级y。用户
的
最佳拟合项目的结果如下所示: Id Name Categ
浏览 0
提问于2019-12-12
得票数 1
2
回答
不平衡
类
的
离群点检测
python
、
class-imbalance
、
anomaly-detection
、
outlier
我必须建立一个预测模型,根据其他一些数值
数据
来预测一个布尔变量韩元/丢失变量,并进一步找出“Won”观测值
的
特征。 然而,在我
的
数据
集中‘韩元’
的
数量是0.05%。我试过过抽样和过抽样,但都没成功。即使我取了等量
的
“韩元”和“失落
的
”,这个模型对于其余
的
“丢失”值也是不准确
的
。我也试过举重,但效果不太好。理想情况下,我认为我必须把一个非常高
的
重量'Won‘。所以现在我试着用另一种方式来看待它,并对
浏览 0
提问于2016-05-05
得票数 3
回答已采纳
4
回答
C
处理
器前字符串串接
c
、
c-preprocessor
如何组合预定义
的
C值来生成字符串。#define ICON_FILE "../icons/"##APP_NUMBER##".ico" 1000 ICON ICON_FILE我刚得到
的
最接近
的
就是这样做: #define STR(x) #x
浏览 7
提问于2012-11-22
得票数 4
1
回答
非平衡
数据
集上
的
双向方差分析
r
、
anova
aov是否适
用于
不平衡
的
数据
集。...provides a wrapper to lm for fitting linear models to balanced or unbalanced experimental designs
的
说法但后来它说
的
是aov is designed for balanced designs, and the results can be hard to interpret without balance我应该如何对R中
不平衡
的<
浏览 2
提问于2010-04-13
得票数 8
回答已采纳
1
回答
在
数据
不平衡
的
管道中进行交叉验证
的
正确方法
machine-learning
、
scikit-learn
、
cross-validation
、
imbalanced-data
、
smote
对于给定
的
不平衡
数据
,我创建了一个不同
的
标准化管道&一个热编码。ColumnTransformer( ('num', numeric_transformer, numeric_features), ('classifie
浏览 5
提问于2020-06-10
得票数 2
回答已采纳
1
回答
变异变元
c
、
c-preprocessor
我想要一个函数/定义,它使用各种参数包来扩展在某种模式中
的
每个参数
的
变异,例如:foo(1,2,3,4,5);bar(modifier_1,modifier_2,如果是这样的话,是怎么做
的
?
浏览 0
提问于2017-11-16
得票数 2
回答已采纳
1
回答
头文件序列
的
预
处理
器循环
c++
、
boost-preprocessor
是否可以在预
处理
器循环中包含一个文件序列:file1,file2,file3?#include <
boost
/preprocessor/iteration/local.hpp> /**/ #d
浏览 6
提问于2013-12-18
得票数 3
1
回答
LibSVM
的
降采样技术
weka
、
libsvm
我有一个
不平衡
的
训练
数据
,我将使用它来训练SVM分类器。我已经尝试了几种
处理
不平衡
数据
的
技术,例如对成本敏感
的
学习和采样技术。对于采样技术,我需要找到向上采样和向下采样
的
方法,而不是随机方法。可
用于
上采样和下采样
的
技术有哪些?我使用weka和LibSVM进行分类。
浏览 3
提问于2014-12-10
得票数 0
3
回答
用宏构造#include指令
的
路径
c++
、
macros
、
include
、
boost-preprocessor
我希望包含由宏动态创建
的
文件路径,
用于
程序中与目标配置相关
的
部分。不起作用
的
例子:#include <
boost
/preprocessor.hpp> #define File filename.h#define MakePath(f)
BOOST
_PP_STRINGIZE(
BOOST
_PP_
CAT
(Dir,f)) #de
浏览 8
提问于2015-08-18
得票数 15
回答已采纳
1
回答
克利夫兰
数据
集分类
的
平衡问题
machine-learning
、
scikit-learn
、
classification
、
multilabel-classification
、
multiclass-classification
我质疑过著名
的
克利夫兰心脏病
数据
集将其对象命名为
的
方式 此
数据
集非常
不平衡
(“无疾病”类
的
许多对象)。我注意到,使用此
数据
集
的
许多论文
用于
组合所有其他类,并将其简化为二进制分类(疾病与无疾病)。是否有其他方法来
处理
这个
不平衡
的
类问题,而不是减少类
的
数量以获得一个分类器
的
好结果?
浏览 0
提问于2019-07-23
得票数 0
回答已采纳
1
回答
当使用过抽样和简历对模型进行培训时,我是否需要使用AUPRC报告
不平衡
数据
集
的
分类结果?
machine-learning
、
classification
、
class-imbalance
、
performance
、
imbalanced-learn
我正在研究一个二进制分类问题,其中
数据
集有大约5%
的
正类样本。我拆分了
数据
集,70%
用于
培训,30%
用于
测试。我只使用了一次测试
数据
来报告模型
的
性能。由于这种
不平衡
,我在培训
数据
集中使用了SMOTE对少数族裔类进行重采样。此外,我还根据如何提升样本、简历和网格搜索
的
建议,使用CV和网格搜索来优化模型性能,以避免
数据
泄漏。假设我正确地
处理
了培训过程,我想知道如何在测试
数据</
浏览 0
提问于2022-08-17
得票数 0
1
回答
如何用分隔符/分隔符连接/加入__VA_ARGS__?
c++
、
macros
、
c++17
我希望将变量宏扩展到另一个宏,该宏接受单个参数,这是通过将变量参数与分隔符/分隔符(例如"_")联接而形成
的
。就像这样:它扩展到我知道有
用于
处理
变量参数
的
__VA_ARGS__,以及
用于
级联
的
##。我如何在一起使用它们来实现我想要
的
(最好使用C++17和旧
的
语言特性,而没有诸如
Boost
浏览 9
提问于2022-11-20
得票数 0
1
回答
不平衡
数据
集分类
的
步骤是什么?
python
、
machine-learning
、
classification
我需要任何熟悉我面临
的
问题的人
的
帮助。 我想使用SVM、随机森林和深度神经网络(DNN)对两个不同
的
数据
集进行分类。我
的
一个
数据
集是平衡
的
,另一个
数据
是高度
不平衡
的
。下面是我
的
数据
集
的
图像,它对于分类是
不平衡
的
。 ? 我想要比较
用于
这两个
数据
的
所有机器学习
的<
浏览 20
提问于2019-04-12
得票数 0
3
回答
在机器学习中
数据
集
不平衡
的
情况下,AUC是比准确性更好
的
指标吗?如果不是,那么哪个是最好
的
指标?
python
、
machine-learning
、
artificial-intelligence
、
roc
、
auc
auc在
处理
不平衡
数据
方面是否更好。在大多数情况下,如果我
处理
的
是
不平衡
的
数据
,那么准确性并不能给出正确
的
想法。尽管准确率很高,但模型
的
性能很差。如果不是auc,这是
处理
不平衡
数据
的
最好方法。
浏览 146
提问于2019-02-26
得票数 0
回答已采纳
2
回答
处理
多数类丢失
的
数据
classification
、
dataset
、
class-imbalance
、
missing-data
我正在使用一个
不平衡
(10:1)
的
数据
集进行分类。我还在某些列中丢失了一些
数据
。如果我把它们全部丢弃,我仍然有5:1
的
比率,所以我想我有能力抛弃它们?丢弃缺少值
的
行,因为
数据
集已经
不平衡
。使用其余行进行欠采样。 很抱歉问你这个问题,低年级学生。
浏览 0
提问于2021-12-18
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券