腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
Python
的推荐教程视频或关于功能
工程
的书籍
、
、
、
、
如果你们能用
Python
向我推荐一个很好的入门教程、视频或关于特性
工程
的书籍,我会很感激的。我不想要那些只教授功能
工程
理论的视频或书籍,而是一本能给我展示一些代码和如何做的书。 谢谢。
浏览 0
提问于2020-08-28
得票数 0
1
回答
数据预处理和
特征
工程
、
、
我一直在读一些关于数据预处理和
特征
工程
的文章,包括
特征
选择,
特征
重要性和
特征
构造。我的理解是在数据预处理阶段应用了
特征
工程
。此外,在应用机器学习模型时,有时会检查
特征
重要性,有时会在模式内部进行检查。 我的问题是:
特征
工程
是否总是在预处理阶段实现,或者有时可以在以后的阶段执行? 谢谢你Shosho
浏览 45
提问于2021-04-28
得票数 0
2
回答
特征
工程
技术清单
、
、
、
、
是否有任何资源与一系列的功能
工程
技术?数据类型、模型和
特征
工程
技术的映射将成为金矿。
浏览 0
提问于2016-07-25
得票数 18
1
回答
如何进行实时数据的
特征
工程
?
、
、
、
、
我用以下步骤建立了一个很好的线性回归模型: 我的问题是,如果我们在生产环境中使用这个模型,那么我们如何进行实时数据的
特征
工程
,因为这个模型是用
特征
归一化和缩放的来建立的,那么如何对实时数据进行规范化和缩放以得到一个很好的预测呢?对于交叉验证和测试步骤,我们不需要显式的
特征
工程
,因为在建立模型之前,这可以在数据预处理步骤中完成。实时数据<e
浏览 2
提问于2017-03-01
得票数 0
2
回答
特征
工程
、
、
、
、
我有一个大约37,000行和54列的数据框架。在这54个列中,有两个列,即“user_id”和“mail_id”,格式非常怪异,如下所示:AR+tMy3H/E+Re8Id20zUIz+amJkv6KU12o+BrgIDin0= DQ/4I+GIOz2ZoIiK0Lg0AkwnI35XotghgUK/MYc101I= 1P4AOvdzJzhDSHi7jJ3udWv4ajpKxOn4T/rCLv4PrXU= BL3z4RtiyfIDydaRYWX2
浏览 0
提问于2016-08-31
得票数 2
1
回答
使用两种不同的DNN体系结构,我能从相似的精确度中推断出什么呢?
我使用了两种不同的方法:两者的结果非常相似(准确率为40%,召回率为95%)。
浏览 0
提问于2019-01-11
得票数 0
1
回答
Azure :部署集成在数据库上的ML模型的可选角色
、
、
、
我使用
python
notebook在Azure Databricks中开发了基于历史数据的ML预测模型。这意味着我已经使用
python
notebook完成了在Databricks中完成的所有数据提取、准备、
特征
工程
和模型训练。
浏览 14
提问于2021-08-10
得票数 1
1
回答
如何应用时间序列机器学习模型预测下一个时间步长
、
我对单变量时间序列数据(备件使用)进行了
特征
工程
,然后将时间序列数据转化为有监督的机器学习问题。我对转换后的新数据集进行了培训和测试。我的问题是如何应用该模型来预测未来的一步、多步?所有
特征
都是在以前的数据点上计算的,例如滞后
特征
、移动窗口统计数据,例如最大值、最小值、平均值、中值,例如,持续5天、10天、15天。如果您有
Python
中的工作示例或任何带有示例的白皮书,那将是很棒的。期待你的帮助,肖恩
浏览 0
提问于2019-12-06
得票数 0
1
回答
基于树的算法需要什么
特征
工程
?
、
、
、
、
我理解数据卫生,这可能是最基本的特性
工程
。这意味着确保所有数据都正确加载,确保N/As被视为一个特殊值,而不是一个介于-1和1之间的数字,并正确地标记您的分类值。使用log、指数、幂变换将
特征
转化为正确的标度。但是,对于LightGBM (和随机森林)来说,这些特性的规模似乎并不重要,因为可排序的项目是有序的,然后是随机的二分法。
浏览 0
提问于2017-08-08
得票数 12
回答已采纳
1
回答
如何在具有大量
特征
的数据集中进行
特征
选择或
特征
工程
?
、
、
为了建立一个良好的ML模型,我们必须选择能够提高模型精度的
特征
,如果需要的话,还要“
工程
”
特征
(例如,如果与预测变量不线性相关,则应用对数或平方等函数对线性回归预测器)。我应该在不同的条件下测试每一个变量,还是有一些更简单的方法来进行
特征
选择或
特征
工程
。
浏览 0
提问于2022-03-13
得票数 1
1
回答
使用经过训练的ML模型作为服务进行预测的同时进行
特征
工程
、
、
、
、
但是在数据上训练模型,我做了很多
特征
工程
,比如对数盒cox变换,一次热编码,由于高度多重共线性而丢弃了几列等,现在
特征
的数量是35。我在这35个
特征
上训练了模型,检查了性能,并使用pickle保存了模型。我在flask服务中加载了我的腌制模型。但是现在模型的输入是我的原始数据的格式,它只有20列。那么,我如何对新的输入集进行所有的
特征
工程
呢?我只能保存训练好的模型,但在传递新数据进行预测之前,我如何进行所有的
特征
工程
呢?
浏览 15
提问于2021-05-30
得票数 1
回答已采纳
2
回答
盲
特征
工程
、
、
、
基于SVM的分类算法具有较好的分类精度(> 95%),但由于对列没有直觉,除了标准标度、零值替换等外,我无法在
特征
工程
或
特征
生成方面做更多的工作。或者只有当一个人拥有基于列名的直觉时,功能
工程
才真正有意义.
浏览 0
提问于2019-07-30
得票数 3
6
回答
自动
特征
工程
、
我遇到了一个机器学习软件,我不会命名它,它声称在没有领域知识的情况下,功能
工程
过程从任何来源完全自动化,这意味着数据科学家在这一步中几乎没有必要。现在,我发现这个说法有点可疑,因为它违背了我所学到的功能
工程
所包含的常识。 但考虑到这可能是缺乏知识,从我的部分到什么点,我们可以自动化的特色
工程
过程?
浏览 0
提问于2016-05-24
得票数 6
4
回答
在使用XGBoost时,特性
工程
仍然有用吗?
、
使用XGBoost进行特性
工程
有什么价值?
浏览 0
提问于2017-03-20
得票数 23
1
回答
纸袋图在文本
特征
工程
中的应用
、
、
关于包图在文本
特征
工程
中的应用,我有几个问题:当n克袋的
特征
空间随'N‘呈指数增长时,是什么(还是有?)或者,通常情况下,在将文本字段转换为文本
特征
字段时,n-gram包是否与其他功能
工程
技术一起使用?
浏览 0
提问于2022-04-10
得票数 1
回答已采纳
1
回答
迁移学习中的模型微调
、
、
、
、
我正在研究一个深度学习模型,用于“年龄不变的人脸检测”。我开始对数据进行预处理,包括通过MTCNN进行人脸裁剪,图像对比度校正和锐化。然后我开始构建模型架构,我设计了一个定制的顺序CNN模型。训练和验证损失接近1.9,但模型一个时期大约需要8小时。我需要快速的结果,所以我开始尝试迁移学习。我读到一篇论文,说Resnet-18在任务中表现很好,所以我首先使用了Resnet-18。尝试通过改变学习率来调整它,但没有效果。准确率的提高不超过40%。然后我使用了Resnet-50,目前,我正在研究它。我尝试通过手动更改学习率进行微调,尝试使用不同的优化器Adam、SGD。使用学习率衰减。我的模型开始
浏览 17
提问于2020-10-02
得票数 0
2
回答
Python
中timeseries数据集的
特征
工程
、
我正在对这个数据集进行
特征
工程
,以便根据我拥有的标签在数据中找到有意义的
特征
。有没有什么
Python
包可以简化这个过程?
浏览 2
提问于2017-04-16
得票数 0
2
回答
机器学习中的预测函数是否理解分类数据?
、
、
、
、
据我所知,在进行
特征
工程
之前,必须将数据集分成训练数据和测试数据,以避免分析中的偏差。我还了解到,机器学习模型除了数字数据之外不理解数据,因此需要编码,这是
特征
工程
的一部分。
浏览 0
提问于2019-11-06
得票数 1
回答已采纳
1
回答
Featuretools可以从一组
特征
中选择一组
特征
吗?
我也在试着找出哪个传感器的数据是最好的
特征
。Featuretools是否可以进行功能
工程
,并从功能集中找到最佳功能集?
浏览 5
提问于2018-10-29
得票数 0
1
回答
在DataFrame中以所有可能的组合(训练ML模型)删除和包含列,但一个列(目标列)除外
、
我想是这样的, index feature1(target column) feature2 feature3 feature41 1 1 2 3 43 3
浏览 6
提问于2022-09-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券