腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
保存
随机
欠
采样
的
数据
?
、
、
我试图通过使用多数类
的
随机
欠
采样
来平衡
数据
帧。它已经成功了,但是,我也想将从
数据
帧(
欠
采样
)中删除
的
数据
保存
到一个新
的
数据
帧中。我该
如何
做到这一点?这是我用来对
数据
帧进行
欠
采样
的
代码 from imblearn.under_sampling import RandomUnde
浏览 29
提问于2021-08-09
得票数 0
回答已采纳
1
回答
列车试验分裂后不平衡
数据
的
欠
采样
、
、
我是机器学习
的
新手,目前正在从事一个
数据
不平衡
的
项目。我想用
随机
抽样来平衡
数据
。我很困惑是应该在测试列车分裂后进行
欠
采样
,还是应该先进行
欠
采样
,然后再进行列车测试分割?我
的
方法是: 1.我用火车测试拆分得到: X_train,y_train用于培训,X_test和y_test用于测试。2.将X_train和y_train合并为一个
数据
集,进行
欠
采样
。3.在
浏览 1
提问于2020-05-22
得票数 5
1
回答
在python中使用图像
数据
进行
欠
采样
、
、
、
欠
采样
的
主要思想是
随机
删除具有足够观察值
的
类别,以便两个类别的比较比率在我们
的
数据
中具有显着意义。那么,
如何
在python中对图像
数据
进行
欠
采样
呢?请帮帮我:( 我从Kaggle那里获取了眼底图像
数据
。有5个类别的35127张图片。25810类
数据
,1类: 2443
数据
,2类: 5292
数据
,3类: 873
数据
浏览 4
提问于2020-01-11
得票数 0
1
回答
平衡XGboost仍然倾向于多数类
、
、
、
对于多类分类,我有不平衡
的
数据
集,我尝试在XGboost中使用类权重选项,而分类器仍然倾向于支持大多数类。我不确定我是否需要调整其他
的
东西,或者我应该
如何
处理这个问题。如果阿尔戈预测
的
地方到处都是,我仍然能理解,但不确定为什么它仍然偏向于多数阶级。有什么指示吗? 更新:我
的
意思是大部分
的
预测仍然是针对主修班
的
,在测试和训练中,这个比例大约是30%。
浏览 0
提问于2019-03-11
得票数 2
1
回答
不平衡
的
学习问题-样本外与验证
、
我正在训练三个班级,其中一个占主导地位
的
班级约占80%,其他两个班级甚至。我能够使用
欠
采样
/过
采样
技术来训练模型,以获得67%
的
验证准确率,这对于我
的
目的来说已经相当不错了。问题是这种性能只存在于平衡
的
验证
数据
上,一旦我用不平衡
的
数据
对样本外进行测试,它似乎就偏向于甚至类预测。我也尝试过使用加权损失函数,但在样本之外也没有什么乐趣。有没有好
的
方法来确保验证性能
的
转换?我曾
浏览 6
提问于2019-07-10
得票数 0
1
回答
如何
在非平衡
数据
的
二分类问题中选择合适
的
神经网络?
、
但是我
的
数据
是不平衡
的
。我有2个特征列和1个输出列(1/0)。我有10000
的
数据
。在输出1中只有20个结果中,所有其他结果都是0。然后我将
数据
大小扩展到40000。由于
数据
是不平衡
的
(0支配1),哪个神经网络更适合进行正确
的
预测?
浏览 0
提问于2018-11-01
得票数 0
1
回答
为图表选择代表性样本
的
算法
、
示例: 我有100个特定时间段
的
样本。但是我只能使用10个值来绘制折线图。如果我使用所有100个精确
的
样本来绘制图表,我可以使用什么算法来计算这10个代表值,使图表看起来类似。计算每10个样本
的
平均值
的
朴素算法不能很好地反映图表中
的
峰值。
浏览 5
提问于2012-03-18
得票数 4
回答已采纳
1
回答
在smote之后调整预测概率
、
、
、
我有一个不平衡
的
数据
集,我使用smote对少数类进行过
采样
,而对多数类进行
欠
采样
。现在,我想使用模型
的
predict_proba检查测试AUC。2.我
如何
校正它(
欠
采样
和过
采样
的
组合!)
浏览 40
提问于2019-11-22
得票数 0
1
回答
使用pytorch python
的
欠
采样
和过
采样
的
不平衡分类
、
、
、
我想一起使用过
采样
和
欠
采样
技术我有6个类,样本数如下:类0 250000类1 48000类2 40000类3 38000类4 35000类5 7000我想使用smot来使所有类平衡且大小相等类0 40000类1 40000类2 40000类3 40000类4 40000类5 40000我知道
如何
对所有
数据
进行过
采样
或
欠
采样
,但
如何
将它们与多类分类一起使用
浏览 124
提问于2021-08-24
得票数 0
4
回答
如何
在R中平衡不平衡分类1:1和SMOTE
、
、
我正在做二进制分类,我当前
的
目标类由:坏: 3126好:25038组成示例1:smoted_data <- SMOTE(targetclass~., data,
浏览 3
提问于2016-04-15
得票数 6
1
回答
随机
森林模型
的
训练误差小于测试误差
、
、
我一直在研究机器学习模型,我很困惑该选择哪种模型,或者是否有其他我应该尝试
的
技术。我正在使用
随机
森林来预测使用高度不平衡
的
数据
集进行转换
的
倾向。目标变量
的
类平衡如下所示。UpSampling,然后使用
欠
采样
。下面是我用于上
采样
和
欠
采样
的
代码tra
浏览 3
提问于2018-11-22
得票数 1
1
回答
weka上烟尘与
欠
采样
的
组合
、
、
根据chawla等人(2002)撰写
的
论文,平衡
数据
的
最佳效果是将
欠
采样
与平滑相结合。在weka有重
采样
,以减少多数阶级。在重
采样
的
biasToUniformClass中有一个属性--是否对一个统一
的
类使用偏向。值0使类分布保持原样,值
浏览 4
提问于2015-01-14
得票数 2
2
回答
机器学习分类问题中
如何
处理小而不平衡
的
数据
集
、
、
我正在处理一个非常具有挑战性
的
分类问题,其中我有三个问题:一个小
的
数据
集(大约800个样本),不平衡
的
数据
集(4个类,每个类有1-600个样本,2/3/4-50个样本),以及其中一个特征中缺少
的
数据
。我一直在考虑
的
一些事情: 将这一分类转变为少数群体和多数群体之间
的
二元分类。我打算作为分类器,朴素贝叶斯,支持
浏览 4
提问于2015-11-19
得票数 4
3
回答
Smote无法进行过
采样
我刚刚使用DMwR包中包含
的
Smote在我
的
数据
集中进行了过
采样
。newData <- SMOTE(Score ~ ., data, k=3, perc.over = 400,perc.under=150) 现在,分布是60对72。然而,当我显示'newData‘
数据
集时,我发现SMOTE是
如何
进行过
采样
浏览 5
提问于2014-06-08
得票数 2
2
回答
如何
编写bigquery SQL来对多数类
的
行进行
欠
采样
,同时保留少数类
的
所有样本?
、
我正在尝试为一个二进制分类问题获取
数据
。
数据
集严重不平衡。我可以下载
数据
并执行多数类
的
欠
采样
,但我想知道
如何
使用BigQuery SQL直接执行此操作?换句话说,我希望选择目标列为1
的
所有样本,如果目标列为0,则忽略大量
数据
。样本
数据
集 id feat_1 feat_2 target2 x_2 y_4 1 3
浏览 30
提问于2021-04-05
得票数 0
2
回答
scikit了解用于交叉验证
的
不平衡
数据
的
欠
采样
、
、
如何
在scikit-learn中生成用于交叉验证
的
随机
折叠?假设我们有一个类
的
20个样本,另一个类
的
80个样本,我们需要生成N个训练集和测试集,每个训练集
的
大小为30,在每个训练集中,我们有50%
的
类1和50%
的
类2。我找到了这个讨论(),但我不明白
如何
获得折叠。
浏览 3
提问于2013-12-21
得票数 6
1
回答
python中MLP分类器中
的
不平衡
数据
集
、
、
、
我正在处理不平衡
的
数据
集,我试图建立一个使用MLP分类器
的
预测模型。不幸
的
是,该算法将所有观察值从测试集分类到"1“类,因此分类报告中
的
f1评分和回忆值为0。有人知道怎么处理吗?
浏览 0
提问于2017-06-18
得票数 8
回答已采纳
1
回答
如何
使用Python中
的
"imblearn“库为每个类指定精确
的
欠
采样
/过
采样
数量?
、
、
、
、
我正在使用"imblearn“库进行
欠
采样
。我
的
数据
集中有四个类,每个类有20、30、40和50个样本
数据
(因为它是一个不平衡
的
类)。选择这些样本数是为了方便地描述问题,这些样本数在实际应用中并不是有效
的
数量。 我想对每个有10个样本
数据
的
类进行
欠
采样
。有没有可能我可以用"imblearn“来做呢?目前,我正在使用以下代码对每个类进行
欠
采样
,使
浏览 28
提问于2020-06-01
得票数 1
回答已采纳
1
回答
应用
欠
采样
技术训练和测试
数据
、
假设您对培训
数据
应用了有针对性
的
欠
采样
技术(如TomekLinks ),以使模型能够更好地识别\单独
的
类。问题:如果要使用该模型对测试集进行预测,是否也对测试集执行相同
的
欠
采样
技术,还是仅在培训集上使用
欠
采样
来帮助模型澄清类边界。然后将经过训练
的
模型应用于完整
的
测试集.
浏览 0
提问于2021-11-04
得票数 1
回答已采纳
2
回答
Pytorch -
如何
使用加权
随机
采样
器进行
欠
采样
、
、
、
我有一个不平衡
的
数据
集,并希望对类进行
欠
采样
,即overrepresented.How do I go。我想使用称重
随机
采样
器,但我也对其他建议持开放态度。到目前为止,我假设我
的
代码必须像下面这样
的
结构。但我不知道该怎么做。
浏览 2
提问于2020-02-20
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
条码软件如何随机生成条码并保存条码数据
区块链的存储方式,如何保存个人的信息数据
如何将html中的表格数据保存下来
机器学习之非均衡数据处理
深度解析:区块链的数据存放在哪?如何保存个人的信息数据?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券