腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
用于
训练
机器
学习
模型
的
80-20
或
80-10-10
?
validation
、
machine-learning
、
training-data
我有一个非常基本
的
问题。 1)建议在什么时候保留部分数据进行验证,什么时候不需要?例如,什么时候我们可以说80%
的
训练
,10%
的
验证和10%
的
测试拆分更好,什么时候我们可以说简单
的
80%
的
培训和20%
的
测试拆分就足够了?2)另外,使用K-Cross验证是否适
用于
简单
的
拆分(
训练
-测试)?
浏览 26
提问于2020-03-18
得票数 0
回答已采纳
1
回答
80-20
还是
80-10-10
的
训练
机器
学习
模式?
machine-learning
、
cross-validation
、
training
我有一个非常基本
的
问题。2)此外,使用K-交叉验证是否与简单
的
拆分(培训-测试)一致?
浏览 0
提问于2020-03-18
得票数 0
回答已采纳
2
回答
术语问题
machine-learning
、
machine-learning-model
在
机器
学习
中,
模型
的
定义是问题域选择
的
算法,还是
模型
是算法和
训练
数据? 谢谢。
浏览 0
提问于2018-12-03
得票数 1
回答已采纳
1
回答
是否有可能对个人实例进行分段,并使用从Google获得
的
网络在云端运行?
google-cloud-platform
、
google-cloud-vision
我在Google文档中找不到这些信息: 此外,我是否拥有获得
的
网络(和数据)?
浏览 1
提问于2018-11-20
得票数 0
回答已采纳
2
回答
面部表情数据集
的
训练
验证测试集分割
machine-learning
、
neural-network
、
cross-validation
、
computer-vision
、
convolutional-neural-network
我正在使用卷积神经网络(CNN),我只想问一下,我
的
训练
/验证/测试集
的
划分方式是否正确。验证集是否也应由看不见
的
主题组成?或者我可以洗牌整套培训,并使用其中
的
一部分(10-20%)作为验证集? 我读过,使用N-折叠交叉验证,整个
训练
集(实例)被洗牌,然后分裂成N-折叠,
模型
被
训练
浏览 0
提问于2016-10-04
得票数 2
回答已采纳
2
回答
训练
集和测试集大小
machine-learning
、
deep-learning
、
training
如何正确处理培训/测试集
的
生成?我正在做几个实验来测试我
的
神经网络
模型
的
泛化能力,所以在所有实验中,我
的
测试集都不同于我
的
训练
集(例如,在一个实验中,
训练
集和测试集之间
的
句子结构是相同
的
,而在
训练
集中我使用一组单词,在测试集中使用另一组单词因此,我
的
问题是:为了能够比较实验之间
的
准确性,我是否必须在实验之间保持相似的
训练
集/测
浏览 0
提问于2021-07-08
得票数 1
1
回答
如果在相同
的
数据上
训练
嵌套
模型
,是否会过度拟合
machine-learning
如果我建立一个
机器
学习
模型
,它使用来自另一个
机器
学习
模型
的
输出,而两个
模型
都是在相同
的
数据上
训练
的
,是否会过度拟合?基本上,我想知道是否可以使用KNN预测结果作为深度神经网络
模型
的
输入,而这两个
模型
都是在完全相同
的
数据上
训练
的
。
浏览 0
提问于2018-11-06
得票数 0
1
回答
面部表情数据集
的
训练
验证测试集分割
validation
、
machine-learning
、
computer-vision
、
neural-network
、
conv-neural-network
我正在使用卷积神经网络(CNN),我只想问一下,我
的
训练
/验证/测试集
的
划分方式是否正确。验证集是否也应由看不见
的
主题组成?或者我可以洗牌整套培训,并使用其中
的
一部分(10-20%)作为验证集? 我读过,使用N-折叠交叉验证,整个
训练
集(实例)被洗牌,然后分裂成N-折叠,
模型
被
训练
浏览 3
提问于2016-10-03
得票数 1
回答已采纳
1
回答
我有一个数据集,其中
的
目标变量有15%
的
空值,我想使用这些空行作为我
的
测试集,这是可能
的
吗?
machine-learning
、
dataset
、
linear-regression
、
isnull
我正在使用
机器
学习
算法线性回归来预测房地产销售价格
的
值,并将销售价格作为我
的
目标变量。.But销售价格中有15%
的
空值,所以我可以使用这15 %作为我
的
测试集和非空值作为我
的
训练
集吗?
浏览 11
提问于2019-05-31
得票数 0
2
回答
为什么不能用0.01作为参数
或
99%
的
训练
数据来分割
训练
试验数据?
tensorflow
、
lstm
、
training
大多数博客都提到了一个很好
的
经验法则,即列车和测试
的
分选分别是
80-20
。有问题吗?为什么我们不能有一个99-1
的
火车测试分裂,为
模型
学习
所有的信息和时间趋势。由于我
的
预测将在未来,我将永远增加我
的
测试数据集。我使用神经网络(Rnn)来预测。我知道cross_validation,froward_chaining是
训练
时间序列数
浏览 0
提问于2019-09-22
得票数 3
回答已采纳
1
回答
分离因变量和自变量
python
、
data-science
我建立了一个线性回归
模型
,但不知道分离因变量和自变量
的
必要性x = data.iloc[:, 0:1].values y = data.iloc[:, 1]
浏览 1
提问于2019-10-31
得票数 0
1
回答
在NLP中受过
训练
的
模型
是什么?
java
、
nlp
、
stanford-nlp
、
opennlp
我是自然语言处理
的
新手。有人能告诉我在OpenNLP
或
斯坦福大学CoreNLP中受过
训练
的
模特是什么吗?在使用apache openNLP包在java中进行编码时,我们总是需要包括一些经过
训练
的
模型
(在这里可以找到 )。他们是什么?
浏览 2
提问于2016-12-30
得票数 1
回答已采纳
1
回答
亚马逊
机器
学习
模型
重建可能性
amazon-web-services
、
machine-learning
、
amazon-machine-learning
在AWS
机器
学习
中,只有两种内建
的
预测/分类
模型
.Logistic回归和线性回归。在AWS ML的当前版本中,是否有可能:在AWS开发者指南
的
最新版本中,我找不到那些问题<
浏览 12
提问于2016-12-13
得票数 2
回答已采纳
1
回答
同时使用和
训练
神经网络是可能
的
吗?
neural-network
、
artificial-intelligence
、
biological-neural-network
是否可以使用Tensorflow
或
类似的库来建立一个
模型
,您可以同时有效地进行培训和使用。 这方面的一个例子/用例是你给出反馈
的
聊天
机器
人。有点像宠物
学习
的
方式(也就是复制他们只是为了奖励而做
的
事情)。或者能够添加新
的
条目
或
新
的
响应。
浏览 6
提问于2020-07-20
得票数 0
回答已采纳
2
回答
我们是否需要对测试和
训练
数据集进行预处理?
machine-learning
、
python
、
pandas
、
preprocessing
我得到了两个数据集,在测试和培训数据集中都有缺失
的
值。我是否也需要对test.csv进行预处理,还是只对train.csv进行预处理?
浏览 0
提问于2021-10-17
得票数 3
1
回答
随着更多
的
数据变得可用,您如何改进
机器
学习
模型
?
machine-learning
、
training-data
大多数有监督
机器
学习
问题
的
基本过程是将数据集分为
训练
集和测试集,然后在
训练
集上
训练
模型
,并在测试集上评估其性能。但在许多(大多数)环境中,例如疾病诊断,将来会有更多
的
数据可用。我如何使用它来改进
模型
?我需要从头开始重新
训练
吗?如果是这样的话,什么时候是重新
训练
的
合适时间(例如,特定百分比
的
额外数据点)?
浏览 1
提问于2021-02-17
得票数 0
1
回答
有监督
或
无监督
的
机器
学习
算法如何比新
的
数据集更好
machine-learning
使用这门课程是关于
机器
学习
的
,我了解了一些关于监督和无监督算法
的
知识。 在维基百科上,我读到
机器
学习
是“在任务/任务完成后获得更好
的
性能/P,即经验/E”。现在,在这些算法中,我看到
的
是它们给它一组数据(或者为监督
的
算法预先标记,或者不是为另一种算法标记),这些算法试图计算出数据并生成一些输出。但是,我真的找不出在这个过程中,这些算法在接收到
的
每一个新数据集中是如何变得更好
的</
浏览 0
提问于2015-12-09
得票数 1
3
回答
在同一个大规模数据集上对数百个
模型
进行评分
的
最佳实践?
scoring
我有预测各种事物
的
500+
模型
,以及一个由400m+个人和大约5,000个可能
的
自变量组成
的
大型数据库。目前,我
的
评分过程大约需要5天,操作方法是将400m+记录分块成10万人
的
片段,并旋转n个线程,每个线程都有一个特定
的
500+
模型
子集,并以这种方式运行,直到所有
模型
的
所有记录都得分为止。每个线程都是一个Python进程,它提交R代码(即加载一个R .rds
模型
和相关
的
数据集转换
浏览 0
提问于2020-01-21
得票数 2
3
回答
确定描述符K-均值聚类中
的
簇数
machine-learning
、
clustering
、
k-means
我是
机器
学习
领域
的
新手,我有一个问题要问。但让我先发布这个问题。我选择了解决方案:在大多数情况下,解决方案也是非常简单
的
。利用SIFT、SURF等算法提取兴趣点,得到这些关键点
的
描述子,并用K均值算法对其进行聚类。我无法理解
的
是我可能需要
的
集群数量。对上述例子
浏览 0
提问于2016-12-26
得票数 0
1
回答
simpletransformers.ai LayoutLM
模型
的
输入数据格式
python
、
machine-learning
、
nlp
输入数据如下:
模型
的
代码如下: "layoutlm", AttributeError: 'list' object has no attribute 'label' 如何正确定义
模型
输入以获得预测结果
浏览 0
提问于2021-11-10
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券