腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为
python
中
的
分类
问题
生成
合成
数据
的
适当
起点
python
、
data-science
、
synthetic
我有一个包含9个特征和1300行
的
数据
集。我正在尝试在我拥有的现有
数据
上
生成
合成
数据
。输出分为两个选项。即1和0,即(1-是和0-否)这里
的
问题
是,几乎1100个案例
的
输出
为
"0“,200个案例
的
输出
为
"1”。之前,我尝试过训练,但效果并不好。我
的
教授建议我在
合成
数据
上工作,并增加输出"1“
浏览 11
提问于2019-06-19
得票数 0
1
回答
在使用SMOTE时,验证集
的
性能较差
python
、
machine-learning
、
scikit-learn
然而,当我在验证
数据
上测试这个经过训练
的
模型时(它没有任何
合成
数据
,也没有被用来构造
合成
数据
点)。我用随机决策林来
分类
。更多
的
信息:我没有触及多数阶级。我在
Python
中
为
scik
浏览 6
提问于2013-06-13
得票数 4
4
回答
我们能用
生成
的
对抗性网络
生成
巨大
的
数据
集吗?
deep-learning
、
gan
我正在处理一个
问题
,我找不到足够
的
数据
集(图像)来输入我
的
深层神经网络进行训练。够了吗?
浏览 0
提问于2017-04-04
得票数 15
回答已采纳
1
回答
关于TimeGAN结果重复性
的
几个
问题
time-series
、
metric
、
gan
我正在播放timeGAN模型,使用来自ydata-
合成
回购
的
示例代码。理想情况下,高质量
的
合成
数据
应该与实际
数据
相似.因此,如果我们建立一个自组织
的
真假
数据
分类
器,
分类
器就很难判断
数据
是真实
的
还是
生成
的
,因此
分类
器
的
准确性~ 0.5和判别分数~0。我有两个
问题
: synth_data和stoc
浏览 0
提问于2023-05-13
得票数 1
回答已采纳
1
回答
过采样会产生新
的
数据
点。
python
、
oversampling
、
smote
我试图解决一个不平衡
的
分类
问题
,所有的输入功能都是
分类
的
。创建了一些新值,这些值在X_train
数据
集中不存在。Resampled dataset shape %s' % Counter(y_res)) 重放
数据
集
的
值计数这些新值不存在于测试
数据
集中。示例:X_
浏览 5
提问于2020-03-17
得票数 0
1
回答
生成
序数
数据
python
、
dataset
、
statistics
、
sampling
我想要
生成
的
合成
数据
是顺序
的
,即有序
的
,在
Python
中
。但我该怎么做呢?在
生成
序数
数据
和
分类
数据
方面有什么不同?我正在阅读Valera和Ghahramani
的
论文“
数据
集中变量
的
统计类型
的
自动发现”。在这篇文章
中
,他们写道:“我们通过抽样一个带有$R$类别的多项变量来解释
分类</em
浏览 0
提问于2018-06-18
得票数 0
回答已采纳
2
回答
Highchart -不是从左点开始
的
线条或区域
jquery
、
highcharts
我得到了这个
问题
: 谢谢
浏览 1
提问于2012-03-29
得票数 4
1
回答
批规范化层和演进规范化激活层
的
用途是什么?
python
、
pytorch
、
torch
、
conv-neural-network
我现在使用
的
是PyTorch,我想知道如何决定添加哪一层?
浏览 3
提问于2020-07-03
得票数 0
2
回答
从过度抽样技术
的
预期性能提升
的
粗略想法?
classification
、
class-imbalance
、
imbalanced-data
我试着训练一个
分类
器来完成多类
分类
任务。但是,
数据
集非常不平衡。在大约160个独特
的
标签
中
,大约有一半是这样
的
,只有10个或更少
的
样本对应于每一个稀有标签。大约有20个标签恰好出现一次。因此,
数据
集包含了几个类,这些类很好地表示,并且有非常长
的
和瘦削
的
稀有标签尾。
数据
集中大约有50个特征(包括数字特征和
分类
特征)和大约20000个样本。我简要地查看了这个
python</e
浏览 0
提问于2022-01-16
得票数 0
回答已采纳
1
回答
熊猫
数据
:
合成
数据
的
生成
python
、
python-3.x
、
pandas
、
dataframe
、
scikit-learn
我有一个
数据
框架df,包含3个类(
分类
问题
)。
数据
以
分类
形式包含大多数列,且
数据
集不平衡。我正在尝试
生成
一个综合
数据
集,该
数据
集复制原始
数据
帧
的
特征和特性。Q2。data.make_
浏览 6
提问于2021-03-17
得票数 2
1
回答
开始评分( is )和Fréchet初始距离(FID),哪一个更适合GAN评估?
machine-learning
、
gan
、
metric
、
generative-models
在测量GAN
的
性能时,采用了两个标准:
生成
图像
的
质量和基于
合成
数据
分布熵
的
图像多样性。但是我怎么知道在给定
的
情况下应该使用什么。
浏览 0
提问于2020-03-11
得票数 5
1
回答
在回归模型中使用gps坐标的最佳方法是什么?
python
、
geolocation
、
latitude-longitude
、
transformation
、
geopandas
在我
的
数据
集中,我有两列表示纬度和经度(以小数
为
单位),我想将
数据
拟
合成
一个回归模型来预测价格。我想知道我应该对这两列进行什么样
的
数据
转换?是否可以只将给定
的
十进制值与模型相匹配,或者需要进行转换?我试着把它们转换成
python
地质公园中使用
的
分类
变量,但是我
的
训练和测试
中
的
不匹配
的
分类
变量不允许我去拟合这个模
浏览 2
提问于2018-05-19
得票数 0
1
回答
用GANs
生成
合成
表格
数据
改进监督学习
machine-learning
、
unsupervised-learning
、
supervised-learning
、
gan
、
generative-models
我看到一些人尝试
的
一个主题是使用GANs
生成
用于监督学习
的
合成
表格
数据
。这也是在二进制
分类
中
对少数类进行过采样
的
一种方法。背后有什么理论原因吗?
浏览 0
提问于2020-12-08
得票数 1
1
回答
如何在OpenCV
中
从3d模型训练HAAR
分类
器?
python
、
c++
、
opencv
由于无人机
的
视角,我需要从多个角度检测汽车,因此我需要为此训练
分类
器。我有许多想要检测
的
汽车
的
3d汽车模型,我可以用它们来训练
分类
器而不是从互联网上获取图像吗?
浏览 3
提问于2017-03-29
得票数 0
2
回答
数据
的
综合采样如何帮助
分类
器预测更好
的
结果?
data-mining
、
dataset
、
algorithms
、
data
、
svm
目前,我正在研究
数据
不平衡
问题
,使用SmoteforBinaryand其他算法解决多类
问题
。任何关于上述
问题
的
指导都会很有帮助。我已经在StackExchange
浏览 0
提问于2017-01-17
得票数 0
1
回答
使用Java
的
分类
问题
weka
java
、
weka
找不到失败
的
地方。准确率
为
95%,但多数病例其预测只是成功。就像我们
的
情况一样,我们需要找到真正正在发生
的
失败。 什么是可能
的
值,在韦卡J48树,以更好
的
训练,因为我看到2%
的
失败在每1000条记录我通过。因此,如果我们增加成功
的
情景,就会
浏览 1
提问于2015-11-27
得票数 1
回答已采纳
1
回答
牙线项目是否利用人工输入进行语音
合成
?
open-source
、
text-to-speech
、
speech-synthesis
是否有任何开源
的
开放内容项目使用录制
的
语音
数据
来
生成
合成
的
语音?(以
合成
/模拟某个人
的
讲话
为
目标)。顺便提一句,这个过程、目标或提取
的
数据
有名字吗?“语音签名”?)我想工作流应该是这样
的
: 获取
数据
,使爱丽丝
浏览 4
提问于2012-01-17
得票数 0
回答已采纳
1
回答
Weka
中
的
堆叠算法是什么?它到底是如何工作
的
?
weka
是否投票系统选择了基本
分类
器
的
结果&那么元
分类
器在输入、整个
分类
器或只是误
分类
分类
器时实际得到了什么?如果可以用一个简单
的
例子来解释整个机制,比如这个链接,那将是有帮助
的
。 提前谢谢。
浏览 1
提问于2014-09-27
得票数 3
回答已采纳
1
回答
在两个
数据
集中找到类似的观察结果
machine-learning
、
data-mining
、
predictive-modeling
、
statistics
我有两个
数据
集A和B。我想做
的
是,对于A
中
的
每一个观察,我想从B中找到5个与A最接近和匹配
的
观测
数据
。谢谢你
的
帮助!
浏览 0
提问于2018-01-08
得票数 1
回答已采纳
1
回答
如何防止drupal 7保存节点
7
、
nodes
我有一个虚拟表单,它将作为我所有内容类型
的
主交换机。例如:
分类
然后用户选择任何术语,页面现在重定向到
适当
的
内容类型表单,例如computers_node_f
浏览 0
提问于2011-10-14
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何掌握数据科学界的“黑色黄金”?
Dynamo与Python之间的简单互动
处理不平衡数据的技巧总结
处理不平衡数据的技巧总结!
3,sklearn的一般流程
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券