腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
数据
预处理
和
特征
工程
、
、
我一直在读一些关于
数据
预处理
和
特征
工程
的文章,包括
特征
选择,
特征
重要性
和
特征
构造。我的理解是在
数据
预处理
阶段应用了
特征
工程
。此外,在应用机器学习模型时,有时会检查
特征
重要性,有时会在模式内部进行检查。 我的问题是:
特征
工程
是否总是在
预处理
阶段实现,或者有时可以在以后的阶段执行? 谢谢你Shos
浏览 45
提问于2021-04-28
得票数 0
1
回答
如何进行实时
数据
的
特征
工程
?
、
、
、
、
我用以下步骤建立了一个很好的线性回归模型: 我的问题是,如果我们在生产环境中使用这个模型,那么我们如何进行实时
数据
的
特征
工程
,因为这个模型是用
特征
归一化
和
缩放的来建立的,那么如何对实时
数据
进行规范化
和</e
浏览 2
提问于2017-03-01
得票数 0
2
回答
前处理前与后处理前的列车、试验分车的区别
、
我在
预处理
方面有点困惑。一般来说, 场景1:我将
数据
集分解为训练、测试
和
验证,并应用诸如列车上的fit_transform
和
测试上的转换。场景2:另一种方法是首先对整个
数据
集应用转换,然后将
数据
集拆分为训练、测试
和
验证。在
预处理
和
特征
工程
之前,或者在
预处理
和
特征
工程
之后,我对
数据
的选择、划分有些困惑。寻找一个很
浏览 0
提问于2019-03-07
得票数 4
回答已采纳
1
回答
预处理
与
数据
工程
与
特征
工程
、
、
我有一个非常困难的分类,不同的
数据
准备方法分为3类
预处理
,
数据
工程
,功能
工程
。
预处理
通常被描述为“清理
数据
”。在这个职位中,前处理分为
数据
工程
和
特征
工程
。这里的
数据
工程
实际上只是将
数据
放入某种模型可识别的形式,而功能
工程
浏览 0
提问于2023-01-06
得票数 0
2
回答
预处理
、EDA
和
特征
工程
、
、
、
、
EDA、
特征
工程
和
预处理
有什么区别? 主要目的是使原始
数据
适合于建模。在EDA中,我们正在清理
数据
,
预处理
也是如此。在有限元中,我们正在进行缩放
和
估算。
浏览 0
提问于2021-08-17
得票数 0
回答已采纳
2
回答
预处理
螺旋
数据
集以用于Logistic回归
、
、
、
因此,我需要对螺旋
数据
集进行分类。我一直在试验一系列算法,如KNN,Kernel SVM等。我想尝试使用
特征
工程
,
预处理
等来提高Logistic回归的性能。这更像是对
预处理
和
其他
特征
工程
/提取方法的学习练习,看看我可以在多大程度上改进这个特定的模型。 以下是我将用于分类的示例
数据
集。任何关于如何操作
数据
集以在Logistic回归算法中使用的建议都将是有帮助的。 ? 我也有多个螺旋线的
数据</
浏览 44
提问于2021-07-12
得票数 0
回答已采纳
2
回答
相关分析应该在哪个阶段进行?
、
、
、
大多数情况下,在
数据
准备就绪后,我将执行以下步骤:如果存在范畴变量,则应用虚拟刻度
数据
列车模型 对于我所遵循的这条道路,在哪里应用相关分析会更有意义在
数据
平衡之后?在缩放之后?还是刚开始?
浏览 0
提问于2020-02-20
得票数 2
1
回答
在应用交叉验证之前对
特征
进行
预处理
而不会泄漏
、
、
我想做一些带有交叉验证的
预处理
(缩放,
特征
工程
,例如目标编码)。我知道最好的
和
理论上正确的方法是为交叉验证的每个训练/测试步骤分别
预处理
数据
。但是,我使用的是H2O,除非我弄错了,否则它不允许我创建
预处理
管道。在我看来,这避免了从训练样本到测试样本
浏览 12
提问于2018-08-23
得票数 0
回答已采纳
1
回答
数据
后处理用酸洗机
、
但我不能得到一些泡菜或类似的
数据
预处理
。我正在做
预处理
: 从sklearn.preprocessing导入StandardScaler 现在,我想对我传递给预测的每一个<e
浏览 4
提问于2018-06-30
得票数 0
回答已采纳
1
回答
预处理
总是必要的吗?
、
当我正在寻找
预处理
的最佳步骤时,我开始怀疑这是否真的是必要的。假设设置
和
噪声以及任何类型的失真在两个类中都是相同的,即使占优势,当各种分类模型已经返回满意的原始
数据
浏览 0
提问于2017-06-08
得票数 0
回答已采纳
2
回答
将
数据
清理或功能
工程
步骤包括在sklearn管道中以创建可伸缩的管道是很好的做法吗?
、
、
、
、
我正在实现一个可伸缩的管道,用于清理我的
数据
并在建模之前对其进行
预处理
。我对用于
预处理
的sklearn Pipeline对象相当满意,但我不确定是否应该包括
数据
清理、
数据
提取
和
特性
工程
步骤,这些步骤通常更适合我正在处理的
数据
集。我的一般想法是,
预处理
阶段将包括对拆分后需要完成的
数据
进行操作,以避免
数据
泄漏。这些通常是:估算(如果不是按恒定值计算)另一方面,
数据
清理或
浏览 0
提问于2020-12-11
得票数 2
2
回答
特征
工程
和
特征
提取有什么区别?
、
、
据我所知,这两种方法都提到将原始
数据
转化为更全面的特性来描述当前的问题。他们是一样的吗?如果没有,可以请任何人提供两个例子吗?
浏览 2
提问于2016-08-24
得票数 4
2
回答
特定算法的
特征
工程
、
几天前,一家人工智能金融服务提供商给我们上了一课,并提到你应该根据具体的算法(你是using.For的例子)来进行具体的
特征
工程
。当使用物流回归时,将更多的
特征
(不相关)(如将连续变量结合成离散变量)拟合成离散的
特征
往往是suggested.Because物流回归的一个简单算法,我们试图以更好地分离样本的方式来提高维数。我搜索了很多(也许还没有),大多数材料是“为什么/什么特性
工程
重要”,“缩放/标准化/连续变量”,“处理空值”或一些没有离散操作的理论评论。为什么
和<
浏览 0
提问于2018-02-28
得票数 0
1
回答
用时间序列预测模型进行预测的正确方法是什么?
、
、
我对ML和
数据
科学有一段时间了,但现在我开始探索时间序列预测,我有一个(让我们说)一个简单的问题:时间序列预测模型的特性/输入是什么?1.date (feature)3.sales (result) 我将使用这些
数据
来训练模型,但我的问题与预测有关例如,如果我有一个简单的分类问题,比如根据一个人的体重、身高
和
鞋号来预测性别,我将利用这些
特征
进行训练,然后我会为“未知”的人添加体重、身
浏览 0
提问于2021-07-22
得票数 0
1
回答
在SageMaker中部署自定义
预处理
和
后处理脚本
、
、
我的
预处理
(
特征
工程
)
和
后处理脚本都是用python编写的,其中有一些相互依赖的脚本
和
方法。
预处理
步骤也不一定来自SKLearn,它们是自定义函数,每次都需要从
预处理
端点调用原始
数据
,然后使用另存为第二端点的模型进行预测。第三个端点将用于后处理步骤,并连接这3个端点,我们希望每次都将
数据
从原始格式转换为输出格式。我们目前有一些普通的python脚本,它们使用一些高度定制的函数对
数据
进行
预处理
(所有功
浏览 21
提问于2021-07-24
得票数 0
1
回答
平滑目标变量
、
、
为了提高结果的准确性
和
置信度,我最近测试用目标变量的平滑版本(用局部加权散射图平滑( LOWESS)计算)替换目标变量,使用一个无滞后时间(即滞后时间= 0)的
特征
作为自变量,试图从测量
数据
中去除噪声。我一直在研究平滑技术在机器学习中的应用,发现平滑确实是一种用于
数据
预处理
、
特征
工程
和
用于噪声滤波的
数据
挖掘(例如这里或这里;或这里,用于时间序列预测)的技术。一方面,从目标变量中删除噪声来估计从我试图建模的过程中得到的“真值”听起来是合
浏览 0
提问于2021-12-09
得票数 2
回答已采纳
2
回答
如何选择神经网络的
特征
?
、
、
、
我知道这个问题没有一个明确的答案,但假设我有一个巨大的神经网络,有大量的
数据
,我想在输入中增加一个新的特性。
浏览 0
提问于2014-07-10
得票数 22
回答已采纳
1
回答
基于树的算法需要什么
特征
工程
?
、
、
、
、
我理解
数据
卫生,这可能是最基本的特性
工程
。这意味着确保所有
数据
都正确加载,确保N/As被视为一个特殊值,而不是一个介于-1
和
1之间的数字,并正确地标记您的分类值。使用log、指数、幂变换将
特征
转化为正确的标度。但是,对于LightGBM (
和
浏览 0
提问于2017-08-08
得票数 12
回答已采纳
2
回答
用Python对机器学习中的原始
数据
进行
预处理
、
、
我有一个原始的
数据
集与9个
特征
数字
和
第10列是一个分类国家=法国,德国,印度,中国,墨西哥。
数据
集有20000行。许多数值
特征
列缺少
数据
,而且没有规模。我应该预测一个
特征
值,它位于
数据
集中的第5列位置。我是否应该: 对整个原始
数据
集进行
预处理
,包括输入
数据
(用于丢失
数据
)、用于分类
和
特征
缩放的编码器。在训练
和</e
浏览 5
提问于2017-09-29
得票数 0
2
回答
机器学习中的预测函数是否理解分类
数据
?
、
、
、
、
据我所知,在进行
特征
工程
之前,必须将
数据
集分成训练
数据
和
测试
数据
,以避免分析中的偏差。我还了解到,机器学习模型除了数字
数据
之外不理解
数据
,因此需要编码,这是
特征
工程
的一部分。我的问题是,我是单独编码测试
数据
,还是预测函数理解分类
数据
。
浏览 0
提问于2019-11-06
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券