学习
实践
活动
专区
工具
TVP
写文章
首页标签特征工程

#特征工程

从原始数据转换为特征向量的过程。 特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间。 典型的特征工程包括数据清理、特征提取、特征选择等过程。

利用Python进行常见的特征工程

HsuHeinrich

上期说到数据分析师一般对业务数据提取的时候就会进行数据清洗,也会做一些业务逻辑或者数据逻辑上的特征处理。但由于特征工程是数据建模重要的一环,所以这里就做一个简单...

6140

基于XGBoost的用户流失预测

HsuHeinrich

本文主要介绍在日常数据挖掘过程中的一些流程化的东西,例如从数据探索->特征工程->数据建模->结果展示。

5020

5 分钟了解机器学习的特征工程

数据派THU

来源:DeepHub IMBA 本文约1300字,建议阅读5分钟 在本文中,我们将了解什么是特征工程以及如何将其应用于您的机器学习算法。 介绍 在我们进一步研究...

1010

B.机器学习实战系列[一]:工业蒸汽量预测(最新版本上篇)含数据探索特征工程等

汀丶人工智能

阿里 · 算法工程师 (已认证)

火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的...

4600

特征工程 | 类别特征目标编码

小石头记

很多模型不支持类别变特征作为直接输入,所以需要对类别特征编码转为数值输入,如较常用的独热编码、WOE等。此外还有一种比较流行的方法-目标编码(target...

8840

一文揭秘微信游戏推荐系统

腾讯云开发者

模块的核心功能负责离线数据处理。它包括特征、画像开发、场景样本开发、特征工程等相关工作;也负责离线模型训练、离线与线上数据交互、批量打分等等。

29860

科大讯飞CTR预估挑战赛Top3方案总结

老肥码码码

‍前一阵子,老肥参加了科大讯飞AI开发者大赛的部分比赛,主要包括结构化、音频、文本以及图像这四大类型,总体来看都是较为简单的任务并且解题方案也较为简单,后续会跟...

11010

案例实操 | 利用Lambda函数来进行特征工程,超方便的!!

用户6888863

特征工程对于我们在机器学习的建模当中扮演着至关重要的角色,要是这一环节做得好,模型的准确率以及性能就被大大地被提升,今天小编就通过Python当中的lambda...

7820

AAAI 2022 | 一种支持任意场景下时序表征学习的模型 TS2Vec

VachelHu

时序表征学习的基本思想就是“以向量嵌入的形式提供时间表示,以便自动进行特征工程过程并以更好的方式对时间建模”,有点类似于NLP中最初的词嵌入层(Embeddin...

8830

通用视觉框架OpenMMLab图像分类与基础视觉模型

timerring

山东大学 · 助理工程师 (已认证)

在ImageNet 图像识别挑战赛里,2010 和2011 年的冠军队伍都使用了经典的视觉方法,基于手工设计的特征+ 机器学习算法实现图像分类,Top-5 错误...

7920

音频领域常用的谱特征

用户10366352

本文详细列举一些谱特征的公式定义,做业务的时候,再也不用为脑海里捉襟见肘的特征发愁了!!!

13970

深度学习工具audioFlux--一个系统的音频特征提取库

用户10366352

audioFlux是一个Python和C实现的库,提供音频领域系统、全面、多维度的特征提取与组合,结合各种深度学习网络模型,进行音频领域的业务研发,下面从时频变...

255110

全球音频领域哪家强--盘点音频领域常用的python库

用户10366352

计算机音频领域,有近百年的历史,论起这个行业的翘首,DAW(数字音频工作站)当之无愧,集行业各种顶尖技术和人才,产生出工业级标准如Pro Tools,各方一霸如...

235120

机器学习(四):机器学习工作流程

Lansonli

腾云先锋 · 腾云先锋(TDP)成员 (已认证)

特征工程(Feature Engineering)是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。

24080

图像数据的特征工程

deephub

上面就是对于图像数据基本的特征工程,但是你可能觉得这些方法并不那么太好用。这是因为深度学习的一个主要好处是它可以识别复杂的模式,而不需要进行特征工程。你需要弄清...

11540

多元时间序列特征工程的指南

deephub

使用Python根据汇总统计信息添加新特性,本文将告诉你如何计算几个时间序列中的滚动统计信息。将这些信息添加到解释变量中通常会获得更好的预测性能。

9910

Feature-engine: 一个完备的特征工程Python库,实现端到端的特征流水线

核桃量化

特征工程本质是一项工程活动,它目的是最大限度地从原始数据中提取并加工特征以供模型或者算法使用。在传统机器学习领域流传着这样一句话: “数据和特征决定了机器学习的...

13300

端上重排系统:提升推荐系统的实时性

炼丹笔记

获奖论文《Real-time Short Video Recommendation on Mobile Devices》针对短视频推荐场景,传统服务端部署的推...

19910

完整数据分析流程:Python中的Pandas如何解决业务问题

饼干哥哥

作为万金油式的胶水语言,Python几乎无所不能,在数据科学领域的作用更是不可取代。数据分析硬实力中,Python是一个非常值得投入学习的工具。

23030

2.1.3 特征工程

用户10270559

顾名思义,特征工程是一种工程活动,有很多对数据的处理在一定程度上都可以算法是特征工程,比方说数据清洗、数据选择、数据构造、数据提取等。

13030

扫码关注腾讯云开发者

领取腾讯云代金券