腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9093)
视频
沙龙
1
回答
如何
根据
从
['
Seen_A
']
列
中
挑选
2
的
随机
列表
,
将
数据
帧
分割为
训练
和
验证
数据
集
(如
下图
所示
)
、
如何
基于
从
列
中
挑选
2
个
的
随机
列表
将
数据
帧
分割为
训练
和
验证
数据
集
(如
下图
所示
)。即通过在
数据
帧
列
中
随机
选取几个
列表
来将其分割成两个<e
浏览 14
提问于2021-10-21
得票数 0
1
回答
从不同
的
输入集中获取相同分布
的
数据
、
、
、
我正在尝试创建一个在多个
列表
之间平均分布
的
训练
数据
集
,每个
列表
都有不同类型
的
数据
。我该怎么做?我查看了GroupKMeansFold
和
StratifiedFold,但我并不完全理解它。a = [a1, a
2
, a3.... a10000] c = [c1, c
2
, c3.... c10000] 我希望我
的</e
浏览 0
提问于2022-07-29
得票数 1
1
回答
在python3
中
划分文本文件以
训练
和
测试
数据
存储
我有一个类似下面这个例子
的
数据
文件: X Y month day FFMC DMC DC ISI RH wind rain area387 5 5 mar thu 90.9 18.9 30.6 8.0 48 5.4 0.0 0.00 我尝试将其
随机
分割为
训练
集
和
测试
集
,但基于<e
浏览 0
提问于2019-10-22
得票数 0
1
回答
随机
森林:如果测试
集
也被标记,会有什么不同吗?
、
、
我能找到
的
所有使用
随机
森林进行预测
的
例子都已经有了实际
的
答案(即测试
集
有标签)。当你没有这个栏目的时候你会怎么做?例如,本教程使用虹膜
数据
: 如果我们真的这样做,测试
数据
集
应该有第1,4
列
,而不是第5
列
。如果您尝试在没有第5
列
的
情况下运行此测试
数据
集
,则会引发一个错误,即
数据
帧
的
大小不同,显然
浏览 0
提问于2013-07-05
得票数 3
回答已采纳
2
回答
使用类似json
的
字段填充pandas
数据
帧
、
、
我正在尝试创建一个包含两
列
'type‘
和
'waveforms’
的
数据
集
,'Type‘
将
包含一个注释,
如
'real’或'simulated‘'waveforms’
将
包含
从
JSON文件创建
的
对象。“waveforms”
列
中
的
单个条目将如
下图
所示
。而且,行数超过100行。ga
浏览 15
提问于2021-05-19
得票数 0
1
回答
模型
的
验证
和
培训损失不稳定。
、
、
、
下面我已经
训练
了一个模型,并且显示了
训练
数据
集
(蓝色)
和
验证
数据
集
(橙色)
的
丢失。
根据
我
的
理解,理想
的
情况是,
验证
和
训练
损失都应该收敛
和
稳定,以判断模型没有不适合或过适合。但我不确定下面的模式。
从
损失
中
你能看出什么,好吗?此外,这也是模型
的
准确性: 📷
浏览 0
提问于2022-12-02
得票数 2
回答已采纳
1
回答
一对一样本
的
Keras模型
训练
及
验证
曲线
的
绘制
、
、
我见过一些帖子在一对一
的
样本上谈论Keras模型
的
训练
.我也从这些帖子中了解到,Keras模型
将
更新模型权重,即使是在逐个
训练
的
基础上。那么,在这种情况下,现在
的
问题是,我们
如何
提供
验证
拆分,以及我们
如何
绘制模型
的
验证
图,因为我们不是
将
整个
数据
集
提供给我们
的
模型,而是逐行提供
数据
集</
浏览 1
提问于2021-08-14
得票数 1
回答已采纳
1
回答
为ConvLSTM
2
d准备网格天气
数据
、
、
、
我正在尝试使用一个使用每小时网格天气
数据
的
ConvLSTM
2
d模型。我可以
将
数据
放入具有以下维数(纬度、num_features)
的
四维数组
中
。ConvLSTM
2
d需要5d,我计划为序列长度设置一个变量,可能是24小时。我
的
问题是,我
如何
在这个数组
中
创建一个额外
的
维度来拥有序列长度维度?(num_hours,sequence_length,lat,lon,num_features)
浏览 3
提问于2021-09-28
得票数 0
1
回答
从
python dataframe
列
中
检索字符串
的
一部分
、
、
我正在使用一个Yelp
数据
集
,这是一个熊猫
数据
帧
。每一行包含一个企业
的
信息,每一
列
引用一个特定
的
信息,
如
消费者评级、类别、属性等。我特别感兴趣
的
是
从
数据
帧
的
属性
列
中提取信息。每行
中
的
属性字段包含多个元素,并且长度不同。我附上一张图片来说明这一点。 我想从属性单元格中提取以下信息:'Restaurant
浏览 8
提问于2017-06-19
得票数 0
1
回答
如果模型在
验证
数据
集
上表现不佳,怎么办?
、
、
即使所有分类器
的
roc曲线都显示出90%以上
的
AUC,但一旦我提供了一个
验证
数据
集
,该模型几乎无法准确地预测30 %
的
分类对象。在基于3/4
的
训练
数据
集
生成模型
的
同时,对模型进行了
训练
和
测试。我在培训期间做了10次交叉
验证
,我想代码是正确
的
。我试着在
训练
前包括或不包括pca。
如
损失函
浏览 0
提问于2022-05-10
得票数 0
1
回答
新测试
数据
( TFLearn )上
的
LSTM/RNN模型失败
、
、
、
我对ML相当陌生,目前我正试图开发一个可以通过从音频文件中提取classify spoken digits (0-9)
的
模型。我在一个由15位演讲者
和
2400个培训示例(每个数字有240个音频示例)组成
的
数据
集
上对模型进行了培训。经过3000 epochs后,该模型
的
精度达到97%。问题是,当我记录自己
的
数字wavs时,模型无法正确地分类。为什么会发生这种情况,我能做些什么来解决这个问题呢?这是overfitting
的
一个例子吗?
浏览 0
提问于2018-06-06
得票数 0
1
回答
从
验证
精度到测试精度
的
显著下降
、
、
、
、
给我一个大
的
训练
数据
集
(>70k样本)
和
一个独立收集
的
测试
集
(~
2
k)。在测试
集
上,我始终取得了不错
的
验证
精度,但精度却明显较低。我一直在执行这样
的
验证
:
2
)提供10%
的
训练
浏览 0
提问于2019-08-11
得票数 3
2
回答
Dataset以及为什么使用度量衡()?
、
、
、
我是
从
机器学习开始
的
,我对一些概念有疑问。我读过我们需要将
数据
集
分成
训练
、
验证
和
测试
集
。我会问四个与他们有关
的
问题。 1-
训练
集
:在.fit()中用于学习神经网络
中
的
权值等参数。
2
-
验证
集
:也可用于.fit()。
验证
集
被使用,这样我们就可以在每个时代结束时
验证</em
浏览 0
提问于2021-12-03
得票数 2
回答已采纳
1
回答
如何
根据
ID
将
数据
帧
划分为
训练
集
、
验证
集
和
测试
集
?
、
我需要将我
的
数据
集
随机
拆分为
训练
、
验证
和
测试
集
,
如
本文()
所示
,但它需要
随机
链接到拆分主题ID,而不是整个
数据
帧
。当应用代码回答这个问题时,它完全
随机
地拆分我
的
数据
帧
,但我有堆叠
的
ID,需要它们留在一起,否则一个主题
的
数据
将</em
浏览 11
提问于2017-08-20
得票数 3
回答已采纳
1
回答
使用sklearn
随机
拆分
数据
以进行
训练
和
测试
、
我有一个类似下面这个例子
的
数据
文件: X Y month day FFMC DMC DC ISI RH wind rain area387 5 5 mar thu 90.9 18.9 30.6 8.0 48 5.4 0.0 0.00 我尝试将其
随机
分割为
训练
集
和
测试
集
,但基于<e
浏览 4
提问于2019-10-21
得票数 0
1
回答
如何
从
UCI给定
的
标准
数据
集
生成
训练
和
测试
数据
集
、
我有一个包含699行
和
11个属性(包括class属性)
的
癌症
数据
集
。
如何
将
数据
集
划分为
训练
数据
集
和
测试
数据
集
?我知道下面的事情。它们是真的吗?(1)选择初始150行用于测试,剩余549行用于
训练
(
2
)选择初始549行用于
训练
,剩余150行用于测试 此外,我是否需要在两个
数据
集
浏览 3
提问于2016-07-01
得票数 0
1
回答
当我
的
测试
集
有我
的
火车
数据
没有的
数据
时,会出现错误吗?
、
、
、
、
我有一个
数据
集
,并将其分为train (80%)
和
test (20%)
集
。第一步是建立决策树,然后使用测试
集
进行预测。train, method = "class")运行此操作后,我将得到一个错误: Model.frame.default
中
的
错误,我有土地"Zypern“在我
的
测试
集
,但不是在
浏览 0
提问于2018-10-02
得票数 1
回答已采纳
1
回答
如何
使用机器学习解决时间序列问题?
、
、
、
你好,我有一个时间序列
数据
,基本上表现为锯齿状。在每个维护周期之后,信号总是在下降之前上升,直到发生维护,这将导致信号再次增加。我正在尝试预测信号,看看如果我计划将来
的
维护,信号会发生什么情况。我是时间序列
的
新手,我不确定应该使用哪种模型来预测
数据
。我研究了交叉相关,但它似乎没有考虑到任何会影响信号
的
事件,比如我
的
问题。我只是在每个维护事件之后发生了什么,信号在每个维护周期之后一直遵循着类似的趋势,在每个维护周期之后,信号会上升
和
下降。有什么建议吗?
浏览 1
提问于2020-01-19
得票数 1
1
回答
正则化误差与过拟合
、
、
、
我收集了来自50个唯一块
的
数据
,然后
将
49个块
中
的
数据
合并成一个
数据
集
,并将
数据
从
1个块中保存下来用于测试。然后,我使用train_test_split(sklearn)
将
合并
的
数据
集
从
49个块
中
拆分。然后利用
训练
数据
对
随机
森林回归者进行交叉
验证</
浏览 0
提问于2020-07-15
得票数 1
5
回答
数据
科学
中
的
训练
数据
和
测试
数据
我是python
中
相对较新
的
数据
科学,在探索一些关于
数据
科学
的
竞争时,我对“
训练
数据
集
”
和
“测试
数据
集
”感到困惑。一些项目合并了这两个项目,另一些项目则保持分离。拥有两个
数据
集
的
基本原理是什么?任何建议都将是有益
的
,谢谢
浏览 1
提问于2017-04-25
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
交叉验证和超参数调整:如何优化你的机器学习模型
《Deep Facial Expression Recognition:A Survey》论文笔记
Tensorflow实战:Discuz验证码识别
AI以假乱真怎么办?TequilaGAN教你轻松辨真伪
CIFAR-10+ImageNet=?CINIC-10!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券