腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1858)
视频
沙龙
1
回答
如何
按
账号
拆分
训练
数据
和
测试数据
(
单
变量
)
python
、
split
、
logistic-regression
我想
按
帐户划分
训练
和
测试数据
(一个不起作用的
变量
)。我希望将它们
按
帐户
拆分
,并且每个帐户可以有很多
变量
。例如,80%的帐户将进行培训,20%的帐户将进行测试。我尝试过以下方法,但这段代码只给了我80%的
训练
和
20%的随机测试。然后在
训练
数据
中,它会给我一些帐户,但在
测试数据
中,它也会给我准确的帐户,只是不同的
变量
。这不是我想要的。
浏览 12
提问于2019-05-29
得票数 0
回答已采纳
1
回答
CreateDataPartition不工作
r
、
cross-validation
、
r-caret
、
lme4
我正在尝试将
数据
划分为
训练
集
和
测试集,以便进行交叉验证。我使用以下行来
拆分
表示状态的因子
变量
上的
数据
,该
变量
具有多个级别。,并预测
测试数据
的值,但它总是说我在
测试数据
中有新的水平。我比较了
训练
数据
集
和
测试数据
集的状态级别,它们是相同的,因此似乎在
训练
数据
和
测试数据
中都应该存在一个
变量<
浏览 1
提问于2015-02-14
得票数 2
1
回答
TreeBagger() (MATLAB)
和
不同数量的
训练
和
测试集上的
变量
matlab
、
machine-learning
、
random-forest
当
测试数据
的
变量
数量与
训练
数据
的
变量
数量不同时,它会给出错误。 我被告知,
变量
选择应该只在
训练
数据
上进行,而不是在
测试数据
上,这样
测试数据
上就没有偏见。因此,在将初始
数据
集(50个
变量
)
拆分
为
训练
集
和
测试集后,我对
训练
集执行
变量
选择(独立性的卡方检验)。因此,
训练
集由37个<
浏览 0
提问于2015-12-20
得票数 1
2
回答
按
特定
变量
拆分
训练
和
测试数据
python
、
logistic-regression
、
training-data
我正在尝试这个代码,将
数据
拆分
成逻辑回归的
训练
和
测试: ""“ from sklearn.model_selection import train_test_split X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=10) ""“ 在
拆分
列车
和
测试时,我想将其
拆分
浏览 22
提问于2021-01-23
得票数 0
1
回答
如何
在RandomizedSearchCV中使用交叉验证
拆分
数据
scikit-learn
、
cross-validation
、
hyperparameters
我正在尝试使用RandomizedSearchCV将我的模型从
单
次运行转移到超参数调优。这是正确的方法吗?我的问题是:我
如何
访问剩余的33%的train_input以将其提
浏览 6
提问于2018-02-10
得票数 0
回答已采纳
1
回答
训练
和
测试数据
集是否应该使用相同的计算机系数?
scikit-learn
、
imputation
、
train-test-split
我正在学习
如何
准备
数据
,构建估计器,并使用
训练
/
测试数据
拆分
进行检查。 我的问题是
如何
正确地准备
测试数据
集。 我将我的
数据
分成测试
和
训练
集。('imputer', SimpleImputer(strategy="median")), ]) 在
训练</
浏览 19
提问于2019-08-21
得票数 0
1
回答
GATE工具中的机器学习
machine-learning
、
svm
、
gate
在使用GATE工具对
训练
数据
运行机器学习算法(SVM)后,我想在
测试数据
上对其进行测试。我的问题是,我是否应该使用相同的
训练
数据
进行测试,同时,模型
如何
从
测试数据
中提取实体,而
测试数据
没有使用
训练
数据
中学习到的注释进行注释。我遵循了这个链接上的教程,但在最后,当它谈到将
数据
集
拆分
为
训练
和
测试时,它有点令人困惑。
浏览 2
提问于2014-08-28
得票数 0
2
回答
python
如何
选择每个用户的最新样本作为
测试数据
?
pandas
、
dataframe
、
machine-learning
、
pyspark
我的
数据
如下。我想按时间戳排序,并使用每个userid的最新样本作为
测试数据
。我应该
如何
做
训练
和
测试分离?我尝试的是使用pandas来sort_values时间戳,然后
按
“userid”分组。得到
测试数据
的
数据
帧后,
如何
拆分
数据
?显然,我不能使用sklearn的train_test_split。
浏览 3
提问于2019-11-13
得票数 1
2
回答
查找没有y_test的分类器的错误率
python
、
classification
我的
测试数据
没有标签,这意味着我只有x_train、y_train
和
x_test。有没有一种方法可以在没有准确度的情况下计算错误率?提前谢谢你!
浏览 17
提问于2020-02-04
得票数 0
1
回答
交叉验证是否需要事先对
数据
进行分割/改组
和
拟合?
python
、
scikit-learn
我想知道在使用cross_validate_predict时是否需要在处理
数据
之前对
数据
进行洗牌,以及是否需要在使用之前对
数据
进行拟合:X_train
浏览 0
提问于2021-06-16
得票数 1
2
回答
在机器学习算法的特征准备中何时去除离群点
data-cleaning
、
outlier
我有一个数值
变量
(价格),它在
训练
和
测试数据
集中都有一个长尾。我发现,如果删除这个
变量
在
训练
和
测试数据
集中的最高值1%,那么这个
变量
的直方图
和
测试数据
集看起来基本相同。见下图。📷 我的问题是:我仍然需要使用
训练
数据
(包括特性
和
标签)对
测试数据
进行预测(仅使用特性)。在这种情况下,我应该
如何
处理这个特性
变
浏览 0
提问于2018-03-06
得票数 5
回答已采纳
1
回答
如何
在使用inverse_transform进行
训练
和
测试后,为
训练
和
测试数据
分配回分类
变量
?
machine-learning
、
scikit-learn
、
feature-engineering
如何
在使用inverse_transform进行
训练
和
测试后,为
训练
和
测试数据
分配回分类
变量
?像
训练
和
测试一样,
数据
将有编码的数值。那么,
如何
在
训练
和
测试之后为这些
变量
分配回分类值来
训练
和
测试数据
集呢?请帮我处理这个。
浏览 0
提问于2020-07-31
得票数 0
2
回答
Weka :
训练
和
测试集不兼容
weka
我的
训练
和
测试数据
集的每一行都有图像中像素的强度值,最后一列的标签告诉图像中表示哪个数字;该标签可以是
训练
集中从0到9的任何数字,并且总是?在测试集上。我在Weka Explorer上加载了
训练
数据
集,通过NumericalToNominal过滤器传递
数据
,并使用RemovePercentage过滤器将
数据
按
70:30的比例
拆分
,其中30%的文件用作交叉验证集然后,我加载了
测试数据
,其中?针对每一行
浏览 4
提问于2013-01-17
得票数 0
回答已采纳
1
回答
将电影
数据
拆分
成
训练
验证
测试数据
集
python
、
bayesian
、
precision-recall
、
recommender-systems
我非常有信心我的模型能够很好地学习我提供的
数据
,但现在是时候找出确切的模型超参数了,并尽量避免过度拟合。由于movielens
数据
集只为我提供了5倍的
训练
测试数据
集,而没有验证集,因此我想自己
拆分
原始
数据
集来验证我的模型。由于movielens
数据
集包含943个用户
数据
,每个用户保证至少有20部电影排名,因此我正在考虑
拆分
数据
,以便
训练
和
测试数据
集都包含相同数量的
浏览 5
提问于2020-10-04
得票数 0
1
回答
如何
使用PyTorch将
数据
从一个目录
拆分
为
训练
集
和
测试集?
python
、
neural-network
、
pytorch
、
training-data
、
torchvision
我有一个
数据
文件夹,它没有将
数据
拆分
到
训练
和
测试文件夹中。
如何
将
数据
拆分
成
训练
集
和
测试集?标签来自文件的名称,因此任何
按
该顺序进行的更改都必须包括标签。我想在使用ImageFolder之前
拆分
数据
,这样就可以在
训练
和
测试数据
集上完成不同的转换。
浏览 50
提问于2020-05-04
得票数 0
1
回答
支持向量机-在GridSearchCV之前处理图像
数据
吗?
scikit-learn
、
svm
、
grid-search
、
gridsearchcv
我有不同的图像
数据
集,其中大部分是
按
类排序的,其他
数据
已经混合了。对于每个
数据
集,我想
训练
一个支持向量机(用Python Learn),在每种情况下,超参数都是使用GridSearchCV进行优化的。一些有序的
数据
集仍然需要分成
训练
数据
和
测试数据
,这些
数据
在使用train_test_split之后将以混合的形式出现,据我所知,在使用GridSearchCV之前不必再次混合。其他有序的
数据</
浏览 0
提问于2019-07-30
得票数 2
1
回答
正态回归
和
生存回归的预测限
linear-regression
、
cross-validation
、
survival-analysis
、
cox-regression
我拥有的最新泄漏
数据
是2017年发生的泄漏,该管道是在2009年安装的。我知道,我建立的普通ML模型无法很好地预测2009年后安装的管道的泄漏持续时间。我这么说的原因是因为我首先根据他们的“安装年”对
数据
进行了排序,然后做了一个
训练
测试
拆分
,看看它
如何
在预测
测试数据
集中发挥作用,我得到了%93R平方,但当我在火车测试
拆分
中关闭了混洗功能时(这意味着与正常的火车测试
拆分
不同,子集是随机选择的,
数据
将
按
第一个%80<em
浏览 0
提问于2019-01-28
得票数 0
1
回答
Orange:
如何
确保相同的PCA同时应用于
训练
数据
集
和
测试数据
集?
orange
在Orange中,我可以将
数据
集附加到PCA以进行降维。 通常,在代码中,我会在将经过
训练
的PCA与
训练
数据
进行拟合后,将其应用于
测试数据
。有没有一种方法可以在
测试数据
的
训练
数据
上运行PCA转换?
浏览 72
提问于2020-02-22
得票数 0
回答已采纳
5
回答
数据
科学中的
训练
数据
和
测试数据
data-science
我是python中相对较新的
数据
科学,在探索一些关于
数据
科学的竞争时,我对“
训练
数据
集”
和
“
测试数据
集”感到困惑。一些项目合并了这两个项目,另一些项目则保持分离。拥有两个
数据
集的基本原理是什么?
浏览 1
提问于2017-04-25
得票数 0
2
回答
如何
进行
训练
测试
拆分
,以使Python中的每个类都有足够的
训练
和
测试数据
?
python
、
pandas
、
scikit-learn
我有一个
数据
集,它有5个类,分布如下: ? 从发行版中可以明显看出,类1的样本非常少。
如何
对这些
数据
进行
训练
-测试
拆分
,以便Python中的每个类别都有足够的
训练
和
测试数据
?
浏览 12
提问于2019-05-25
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
九道门丨如何使用随机森林进行时间序列预测?
RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测
TensorFlow 2keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)
手把手:用Python搭建机器学习模型预测黄金价格
如何使用 Python 进行时间序列预测?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券