腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3563)
视频
沙龙
1
回答
学习者
是否
需
要将
任务
分成
训练
集
和
测试
集
,
还是
由
他们
自己
完成
r
、
mlr3
我的问题是,
学习者
是否
由于
任务
没有被拆
分成
训练
和
测试
集
而过度
训练
,
还是
它
自己
在内部处理? 我的猜测是,它是这样的,但我只是不确定,而且我是R
和
mlr3的新手,似乎找不到关于这个主题的文档。
浏览 19
提问于2021-11-14
得票数 0
回答已采纳
1
回答
范畴独立变量的Logistic回归
regression
、
logistic-regression
、
rstudio-server
我正在对一个二元相关变量
和
一个
由
100多个类别组成的独立变量进行逻辑回归。逻辑回归
是否
仍然是正确的选择?
还是
有必要再做一次
测试
? 我郑重地使用logistic回归来检验独立变量
是否
与依赖变量有关。在这种情况下,
是否
有必
要将
我的数据
分成
训练
和
测试
集
。我可以用什么样的
测试
来确定我正在工作的模型
是否
好。
浏览 0
提问于2018-12-04
得票数 0
1
回答
训练
分类示例
python
、
machine-learning
我已经拆分了
测试
集
和
训练
集
,并通过OneHotEncoder转换字符串属性来处理它们,而且,我还使用StandardScaler来缩放
训练
集
的数字特征。我的问题是对于
测试
集
,我
是否
需要转换仍然是字符串格式的
测试
集
目标,就像我使用OneHotEncoder对
训练
集
的字符串目标所做的那样,
还是
让
测试
集</e
浏览 7
提问于2018-03-02
得票数 0
回答已采纳
1
回答
TreeBagger() (MATLAB)
和
不同数量的
训练
和
测试
集
上的变量
matlab
、
machine-learning
、
random-forest
我正在使用MATLAB函数TreeBagger()进行随机森林分类,以
完成
一项
任务
。当
测试
数据的变量数量与
训练
数据的变量数量不同时,它会给出错误。我被告知,变量选择应该只在
训练
数据上进行,而不是在
测试
数据上,这样
测试
数据上就没有偏见。因此,在将初始数据
集
(50个变量)拆分为
训练
集
和
测试
集
后,我对
训练
集
执行变量选择(独立性的卡方检
浏览 0
提问于2015-12-20
得票数 1
1
回答
从
测试
集中派生特性?
machine-learning
、
neural-network
、
training
、
overfitting
我有一个数据
集
的选择(在A,B
和
C之间)
由
某些用户
完成
,我想
训练
一个神经网络来预测选择。我
分成
火车组
和
测试
组。我的假设是同一个用户经常做出相同的选择,所以我想要一个描述选择的“频率”的特性(例如,用户1选择了60%的次数)。从哪个数据
集
可以计算这个频率?我不能使用
训练
集
浏览 0
提问于2021-01-13
得票数 1
1
回答
“对培训
集
的交叉验证”,而开发
和
测试
集
与培训是不同的:这有意义吗?语义错误?
cross-validation
、
bert
、一个开发
集
和
一个持久
测试
集
。开发
和
测试
集
各有100个观测值,为
训练
集
留下600个观测值。(.)超参数优化是通过网格搜索进行的,在
训练
集
上使用交叉验证来评估每个可能的超参数
集
的模型性能。然后根据开发
集
对最优模型进行评估。最后,在开发所有模型之后,我们根据我们的等待
测试
集
测试
它们,以获得最终结果。” 对我来说,<
浏览 0
提问于2022-10-10
得票数 3
1
回答
合并2个数据
集
python
、
dataset
、
pandas
、
data
、
data-cleaning
在给定的
任务
中,
他们
为我们提供了两个数据
集
,即
测试
和
训练
数据
集
。所以,我想知道我们
是否
可以将这两个数据集合并成一个数据帧,并删除重复的数据
集
。你会建议我采用这种方法吗?
还是
会产生不良影响,比如过度适应?
浏览 0
提问于2022-02-11
得票数 1
1
回答
对YOLO模型“
训练
”的基本质疑
machine-learning
、
cnn
、
image-classification
、
image-recognition
、
yolo
因此,我最近刚刚开始探索机器学习,在一个项目中,我被要求
训练
YOLO v5模型。我首先在coco128数据
集
:https://www.kaggle.com/ultralytics/coco128.上尝试了它。github.com/ultralytics/yolov5的存储库 我遵循了本教程:https://github.com/ultralytics/yolov5/wiki/Train-Custom-Data一步一步地
完成
浏览 0
提问于2021-05-09
得票数 3
回答已采纳
3
回答
如何正确地将我的数据集中起来
machine-learning
、
deep-learning
、
cnn
、
normalization
我的
任务
是根据一个人的脸的rgb图像来估计一个人的年龄。我要用ResNet-50来达到这个目的。在第一阶段,我在一个名为WIKI-IMDB的数据
集
上
训练
我的网络(通过水平翻转来过滤
和
扩展我的数据
集
,其中包含大约300 k的图像),并且我用一个在ImageNet上
训练
的预先
训练
的ResNet-50网络的权重来初始化网络的权重在
完成
WIKI上的网络培训之后,我想在另一个数据
集
上
测试
它,它是这项
任务
的基准
浏览 0
提问于2018-06-09
得票数 2
1
回答
科学知识中的分组抽样
python
、
machine-learning
、
scikit-learn
是否
有一种方法可以方便地将数据
集
分成
训练
集
和
测试
集
,同时保存属于同一组的记录?例如,一个表记录每个person_id的独立变量
和
因变量,这样每个人都可能有一个或多个条目: dependent_variable=np.arange(20)现
浏览 3
提问于2015-07-07
得票数 5
回答已采纳
1
回答
学习:朴素贝叶斯分类器给出低精度
python
、
machine-learning
、
scikit-learn
、
bayesian
、
naivebayes
我有一个数据
集
,其中包括200000标签的培训例子。对于每个
训练
示例,我有10个特性,包括连续的
和
离散的。我正在尝试使用python的sklearn包来
训练
模型
和
进行预测,但是我有一些麻烦(也有一些问题)。但是,我不太确定数据(例如,需要更多的数据或其他什么)或代码
是否
有问题。 这是实现具有离散
和
连续特征的数据
集
的朴素贝叶斯分类器的正确方法吗?此外,在机器学习中,我们知道数据
集
应该分为
训练
集
浏览 3
提问于2016-11-10
得票数 3
2
回答
训练
和
测试
数据
集
有什么区别?
machine-learning
、
beginner
测试
数据
集
和
训练
数据
集
有什么区别?根据我研究过的博客
和
论文,我所理解的是,我们将拥有100%的数据
集
,分为2组(
测试
数据
集
为30%,读取70%数据
集
为培训数据
集
)。我想知道更多的分数
和
使用区分100%的数据
集
来
测试
和
培训数据
集
。
浏览 0
提问于2016-07-06
得票数 2
3
回答
机器学习项目:在探索性数据分析之前或之后,拆分培训/
测试
集
?
r
、
machine-learning
、
data-analysis
在进行任何探索性数据分析之前,最好将数据
分成
培训
和
测试
集
,
还是
所有的探索都是基于培训数据?我现在正在做探索性数据分析--一开始没有什么特别的,只是从变量分布之类的东西开始。但我不确定:在探索性分析之前
还是
之后,我
是否
应该将数据
浏览 1
提问于2019-01-21
得票数 15
2
回答
CNN模型的交叉验证技术
python
、
deep-learning
、
cnn
、
cross-validation
和
往常一样,我用批次
和
时代一起
训练
我的模型。当它
完成
训练
和
验证时,最后我使用一个
测试
集
来衡量模型的性能并生成混淆矩阵。现在我想用交叉验证来
训练
我的模型。我
是否
可以将数据
集
拆分为
训练
/
测试
,然后在列车/验证
集
上进行交叉验证(即,除了通常的列车/
测试
外,交叉验证作为列车/验证),并最终以同样的
浏览 0
提问于2019-03-22
得票数 10
回答已采纳
3
回答
使用dev
集
或train
集
machine-learning
、
deep-learning
因此,我们在dev集合上尝试一些东西,并得出结论,然后转到列车集合,对其进行适当的
训练
和
检查。我们
训练
训练
集
,并在dev
集
上对模型进行评估。将dev设置为基准。
浏览 6
提问于2017-08-28
得票数 0
2
回答
我怎样才能自动使我的模型适合于文本分类?
machine-learning
、
classification
、
logistic-regression
我想展示一个模型的例子,该模型过度拟合了
测试
集
,并且不能很好地对未来的数据进行泛化。我将新闻数据
集
分成
3组:test set length: 5500我正在使用一个文本数据
集
并构建一个CountVectorizer我正在创建一个网格搜索(没有交叉验证),每个循环都会
测试
向量化器上的一些参数('min_df','max_df')和我的模型Logisti
浏览 0
提问于2018-03-14
得票数 1
1
回答
区分过拟合与良好预测
python
、
numpy
、
machine-learning
、
regression
、
scikit-learn
这些都是机器学习中如何计算
和
减少过度拟合的问题。我想许多机器学习的新手都会有同样的问题,所以我试着把我的例子
和
问题弄清楚,希望这里的答案能帮助到其他人。TfidfTransformer()>> print X.shape 将这26个样本中的6323个特征(X)
和
相关的分数问题2::在这种情况下,防止过度拟合的最佳方法是什么,以确保预测结果
是否
好? 问题3:,如果使用LeaveOneOu
浏览 2
提问于2012-09-03
得票数 33
回答已采纳
1
回答
菜鸟:给出一个预测未来成功与否的问题,从哪里开始
machine-learning
、
data-mining
、
classification
、
pattern-recognition
float valueThirtyDaysAfterPrediction: float我们可以定义一个成功的
测试
用例,其中如果在预测时考虑方向
和
值时,任何两个未来值检查点都是有利的。) 在用户提交表单的那一刻,预测类中的一切都是已知的,而predictionResult中的信息直到后来才知道;理想情况下,模型或算法可以从我们将算法应用于新的预测的三年历史中派生出来,我们可以获得它
是否
成功的概率(我很高兴看到一个布尔Y/N标志,关于这<
浏览 1
提问于2010-09-25
得票数 1
回答已采纳
1
回答
如何将快速表格模型应用于新的数据?
fast-ai
我用fastai.tabular
训练
了一个模特。现在,我有一个合适的
学习者
。最终,模型将被应用于新的数据,而不仅仅是用于
训练
集
和
测试
集
上的评估。我尝试了不同的东西,所有这些都会导致错误或一些奇怪。
是否
有一种方法可以将经过快速
训练
的模型应用于以前不可用的数据?
还是
必须一次又一次地
训练
模型并输入新的
测试
数据?这似乎不太可能。=cont_names) prediction = learn
浏览 0
提问于2019-06-05
得票数 5
3
回答
使用完整的数据
集
进行预测是一种很好的做法吗?
machine-learning
我知道你应该把你的
训练
数据
和
测试
数据分开,但是当你用你的模型进行预测时,你可以使用整个数据
集
吗?我假设分离您的
训练
和
测试
数据对于评估不同模型的准确性
和
预测强度是很有价值的,但是一旦您选择了一个模型,我想不出使用完整数据
集
进行预测有什么坏处。
浏览 4
提问于2016-09-20
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
5分钟搞懂什么是机器学习
深度学习研究:微软认知转移神经元技术,创建适应性元学习模型
如何使用XGBoost和InluxDB进行时间序列预测
新型机器学习隐写术,智能体伪装训练集,隐藏任务目标
重磅!吴恩达新书中文版来了
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券