腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
缩放
混合
数据
帧
的
训练
和
测试数据
集中
的
不是
所有
数值
列
、
、
、
、
下面的代码
缩放
训练
集
和
测试集。由于Col6
和
Col7不能
缩放
,因此将它们从原始
数据
中删除,以
缩放
训练
和
测试集: library(tidyverse) Data_Frame <- data.frame(Col1 = c("A1",index] %>% dplyr::mutate_if(is.numeric, ~scale(.) %>% as.vector) 有效,但会从
数据
框中
浏览 25
提问于2021-07-20
得票数 0
1
回答
学习StandardScaler,不允许直接转换,我们需要fit_transform
、
、
、
fit_transform
和
transform有什么区别?为什么转换不能直接工作呢?在使用此方法之前,使用适当
的
参数调用“fit”。
浏览 1
提问于2018-08-23
得票数 3
回答已采纳
2
回答
在机器学习算法
的
特征准备中何时去除离群点
、
我有一个
数值
变量(价格),它在
训练
和
测试数据
集中
都有一个长尾。我发现,如果删除这个变量在
训练
和
测试数据
集中
的
最高值1%,那么这个变量
的
直方图
和
测试数据
集看起来基本相同。见下图。📷 我
的
问题是:我仍然需要使用
训练
数据
(包括特性
和
标签)对
测试数据
进行预测(仅使用特性)。在这种情况
浏览 0
提问于2018-03-06
得票数 5
回答已采纳
2
回答
svm错误
测试数据
是否与模型不匹配?
、
、
、
我正在尝试
训练
一个支持向量机分类器来做预测。当我尝试使用经过
训练
的
模型时,我得到这个错误:
测试数据
与模型不匹配。我
不是
这一切发生
的
原因。这是我
的
代码dat = data.frame(x = rbind(tmp1, tmp2), y = as.factor
浏览 13
提问于2017-12-31
得票数 1
1
回答
使用插入符号对
训练
和
测试数据
进行预处理
、
日安 我使用插入符号函数中
的
preProcess()函数来相应地
缩放
我
的
训练
数据
。我还有一个
测试数据
集,我想用
训练
集中
相同
的
均值
和
标准差进行
缩放
。通过这种方式,我将
测试数据
视为全新
的
/看不见
的
数据
,这些
数据
是根据我基于
训练
数据
观察到
的
数据<
浏览 40
提问于2020-06-24
得票数 1
回答已采纳
2
回答
将最小最大
缩放
应用于测试集
不是
很危险吗?
、
、
、
这就是我所担心
的
情况。据我所知,最小值
和
最大值
不是
稳定
的
值,特别是在易失性
数据
集中</e
浏览 16
提问于2019-11-01
得票数 1
回答已采纳
2
回答
我是否需要在列车
数据
中
缩放
测试数据
和
因变量?
、
、
我对机器学习中
缩放
特性
的
概念非常陌生,我认为,当一个特性范围相对于其他特性非常高时,
缩放
将是有用
的
。但是,如果我选择
缩放
培训
数据
,那么: 我能不能缩小一个高范围
的
功能?如果我对列车
数据
的
整个X进行
缩放
,那么是否也需要对列车
数据
和
整个
测试数据
的
y进行
缩放
?
浏览 4
提问于2017-09-16
得票数 6
回答已采纳
1
回答
在管道中
的
特定列上使用StandardScaler并连接到原始
数据
、
、
我有一个
数据
帧
,它有4个
数值
列
,并且我试图在<code>D1</code>中使用<code>D0</code>仅
缩放
一
列
。我使用下面的代码来
缩放
和
转换我
的
专栏。<code>A2</code><code
浏览 19
提问于2020-11-20
得票数 0
回答已采纳
1
回答
将
数据
规范化为[-1,1]范围
、
我有一个大小为NxD
的
训练
数据
集
和
一个大小为AxD
的
测试数据
集。行是
数据
点,
列
是特性。 现在,我想将每个特征(
列
)转换为- 1,1。此外,测试
集中
的
特征
的
缩放
应该使用
训练
集上估计
的
参数进行。例如,如果我通过减去均值
和
除以标准偏差来进行标准化,我就会计算
训练
集上
的
均值
和
浏览 1
提问于2016-04-25
得票数 0
回答已采纳
2
回答
ValueError:查询
数据
维度必须匹配
训练
数据
维度-KNN
、
、
、
、
最近邻居和我收到此错误: ValueError:查询
数据
维度必须与
训练
数据
维度匹配。# Part 1 - Data Preprocessing import numpy as np import
浏览 0
提问于2020-05-14
得票数 1
1
回答
所生成
的
混淆矩阵
的
大小使用混淆块函数是不对
的
,为什么?
、
、
、
、
我正在使用比利时交通标志
数据
集在MATLAB中编写交通标志识别代码。可以找到此
数据
集。然后,我使用
训练
数据
集中
的
所有
标记来
训练
多类支持向量机。在
训练
集中
有62类别(即不同类型<em
浏览 2
提问于2018-05-16
得票数 0
回答已采纳
1
回答
我应该使用火车
数据
集上
的
MinMaxScaler来转换
测试数据
集,还是使用单独
的
MinMaxScaler来拟合
和
转换
测试数据
集?
、
、
、
、
另外,我有两个python脚本,如下所示: train.py:用于
训练
和
测试ML模型、负载
训练
和
测试数据
集,保存所
训练
的
模型,通过网格搜索找到最佳模型。predict.py:用于加载预先
训练
的
模型
和
负荷预测
数据
集,预测模型输出
和
计算精度.然而,在train.py中,fit是在
训练
数据
集上进行
的
,使用相同
的
Min
浏览 4
提问于2020-07-01
得票数 0
回答已采纳
1
回答
R:
训练
集
和
测试集对分类解释变量具有不同
的
值: Logistic回归
、
、
、
、
我在试着预测一个基因变体所属
的
类别。我
的
数据
帧
在我
的
代码中被称为Genetic。我将我
的
数据
帧
分成
训练
和
测试数据
集,如下所示:train=sample(54248,27124)Genetictrain=Genetic[train,]问题是我
的
一个解释变量(它是分类
的<
浏览 0
提问于2018-11-05
得票数 0
1
回答
为什么最小-最大标度器导致回归树
的
精度较低?
、
、
、
我有一个包含7个特性
的
数据
集。值不太大。我
训练
scikit-learn
的
RandomForestRegressor来预测目标变量。R^2
的
分数原来是0.2左右,但当我第一次使用scitkit-learn
的
MinMaxScaler对x_train
和
x_test进行评分时,R^2分数下降到0.11。我听说决策树不受
缩放
的
影响,所以不需要
缩放
数据
。我
的
问题是,如果树木不受尺度
的<
浏览 0
提问于2021-06-30
得票数 0
1
回答
Sklearn管道:当包括管道
缩放
时是否存在泄漏/bias?
、
、
、
、
在机器学习中,将
数据
分成
训练
数据
和
测试数据
。 在交叉验证中,将培训
数据
分为培训集
和
验证集。如果需要
缩放
,则在CV
的
每一次迭代中,计算不包括验证集
的
训练
集(
不是
整个
训练
数据
)
的
均值
和
标准差,并用于
缩放
验证集,使
缩放
部分永远不包括来自验证集
的
信息。我
的<
浏览 1
提问于2020-12-08
得票数 0
1
回答
Keras
的
model.predict()在一次调用多个批
和
一个接一个地调用单个批时产生非常不同
的
准确性。
、
、
、
这是我用过
的
模型:model.add(LSTM(units=200, input_shape=(15, 17), return_sequences=True)metrics=['binary_accuracy']) 现在,在model.fit()之后,当我调用model.predict(X_dataset_multiple_batch)时,我得到了一些很好
的
预测老实说,附加备注我只需要最后一个预测,但是由于Keras内部设计
的
原因,我不能只有一个预测。必须分批处理。所以我必须分
浏览 7
提问于2021-01-11
得票数 0
回答已采纳
1
回答
测试
和
列车组中
的
特征工程(组合
数据
或列车
和
测试分开)
、
、
背景:作为预测分析
的
一部分,我得到了一个
训练
和
测试数据
集。
训练
数据
和
测试数据
都有
数值
和
分类预测变量,另外,
训练
数据
有一个
数值
目标变量。目的是在测试中预测目标。train = C1,c2,x3,x4,y = Xc,X,y Xc,X表示范畴变量和
数值
预测变量。我试图从分类变量Xc中生成额外
浏览 0
提问于2018-06-05
得票数 1
1
回答
手动查找KNN
的
最好方法是什么?
、
假设我得到了以下内容,并且需要找到'use‘KNN来预测记录15
的
类别标签,并且预先知道k被设置为3。为了做到这一点,正确
的
步骤是什么,无论是表还是标签或k被设置为?前10个是
训练
数据
,其他10个是
测试数据
。
浏览 0
提问于2015-10-10
得票数 0
2
回答
用R-“学习”
和
“应用”特性对ML中
的
预测
数据
进行预处理
、
、
、
我已经研究过常用
的
机器学习预处理方法,但我无法解决以下具体问题。问题出现在这里,因为如果我再次为我
的
新
数据
应用准备步骤,这些步骤没有考虑到培训
浏览 0
提问于2016-10-12
得票数 1
1
回答
使用Caret's Train方法将模型应用于
测试数据
集以预测R中标签
的
问题
、
、
、
我有一个
训练
数据
集,我们称它为"training_data",它由19个变量(特征)
和
1个标签组成,总共20个变量(
列
)。这个
数据
集只包含最好
的
预测器,这意味着低方差
列
或差预测器已经被删除,我
的
意思是,这是从特征选择得到
的
数据
帧
。让我们将此
数据
集中
的
标签命名为:"final_score“ 另外,我有一个
测试数
浏览 13
提问于2019-11-23
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
10种数据预处理中的数据泄露模式解析:识别与避免策略
想提高预测精度?7步教你微调机器学习模型
数据清洗&预处理入门完整指南
机器学习数据预处理完整入门指南!
机器学习Kaggle入门,经典又兼具备趣味性的泰坦尼克号问题
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券