首页
学习
活动
专区
工具
TVP
发布
首页标签特征工程

#特征工程

从原始数据转换为特征向量的过程。 特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间。 典型的特征工程包括数据清理、特征提取、特征选择等过程。

机器学习-05-特征工程

用户2225445

特征工程是指使用专业的背景知识和技巧处理数据,使得特征能在机器学习算法上发生更好的作用的过程。更好的特征意味着更强的灵活性,只需简单模型就能得到更好的结果,因此...

14410

CatBoost中级教程:特征组合与建模技巧

人类群星闪耀时

通过本教程,您学习了如何在Python中使用CatBoost进行特征组合与建模技巧。我们介绍了特征组合、类别型特征处理、学习率调整和交叉验证等常用的特征工程和建...

7710

机器学习知识点:表格数据特征工程范式

数据STUDIO

表格数据的特征工程本是一个模块化过程,目标是对数据集进行编码以获得更好的模型精度。

9910

CatBoost中级教程:自动分类特征处理

人类群星闪耀时

在机器学习任务中,特征工程是至关重要的一步。对于分类特征的处理尤为重要,而CatBoost是一种能够自动处理分类特征的梯度提升决策树算法。本教程将详细介绍如何在...

12610

LightGBM高级教程:高级特征工程

人类群星闪耀时

特征工程是机器学习中至关重要的一部分,它直接影响到模型的性能和泛化能力。在LightGBM中进行高级特征工程可以进一步提高模型的效果。本教程将详细介绍如何在Py...

8910

探索LightGBM:类别特征与数据处理

人类群星闪耀时

LightGBM是一种高效的梯度提升决策树算法,常用于分类和回归任务。在实际应用中,数据通常包含各种类型的特征,其中类别特征是一种常见的类型。本教程将详细介绍如...

19010

探索XGBoost:时间序列数据建模

人类群星闪耀时

XGBoost是一种强大的机器学习算法,广泛应用于各种领域的数据建模任务中。但是,在处理时间序列数据时,需要特别注意数据的特点和模型的选择。本教程将深入探讨如何...

11310

掌握XGBoost:特征工程与数据预处理

人类群星闪耀时

在应用XGBoost模型之前,特征工程和数据预处理是至关重要的步骤。良好的特征工程和数据预处理可以显著提高模型的性能。本教程将介绍在Python中使用XGBoo...

12210

Scikit-Learn 高级教程——高级特征工程

人类群星闪耀时

特征工程是机器学习中不可或缺的一部分,而高级特征工程则涉及更复杂的技术和方法。本篇博客将深入介绍在 Scikit-Learn 中进行高级特征工程的一些常见技术,...

12210

特征工程函数代码大全

数据STUDIO

特征工程的问题往往需要具体问题具体分析,当然也有一些暴力的策略,可以在竞赛初赛前期可以带来较大提升,而很多竞赛往往依赖这些信息就可以拿到非常好的效果,剩余的则需...

9110

用python比较两篇文章的相似度以判断重复度

mariolu

vivo · 后台开发工程师 (已认证)

文档相似度判断方法有很多种,比如说余弦相似度,ngram和著名的tf-idf方法去计算文本相似度。

21310

用python比较两篇文章的相似度以判断重复度

mariolu

vivo · 后台开发工程师 (已认证)

文档相似度判断方法有很多种,比如说余弦相似度,ngram和著名的tf-idf方法去计算文本相似度。

21310

ChatOCR:文心一言/千帆API实现关键信息提取

机器学习AI算法工程

现在的任务是从OCR文字识别的结果中提取我指定的关键信息。OCR的文字识别结果使用符号包围,包含所识别出来的文字,顺序在原始图片中从左至右、从上至下。我指定的关...

60510

【机器学习】特征工程:特征选择、数据降维、PCA

Twcat_tree

各位同学好,今天我和大家分享一下python机器学习中的特征选择和数据降维。内容有:

16830

【机器学习】 特征工程:特征预处理,归一化、标准化、处理缺失值

Twcat_tree

归一化是在特征(维度)非常多的时候,可以防止某一维或某几维对数据影响过大,也是为了把不同来源的数据统一到一个参考区间下,这样比较起来才有意义。其次可以让程序更快...

26060

用LightGBM进行时间序列预测项目实战

数据STUDIO

但是在这篇文章将使用更高级的技术来预测时间序列,本文将使用 Prophet 来提取新的有意义的特征,例如季节性、置信区间、趋势等。

38720

【python】数据挖掘分析清洗——离散化方法汇总

用户10828570

24230

【python】数据挖掘分析清洗——缺失值处理方法汇总

用户10828570

本文链接:https://blog.csdn.net/weixin_47058355/article/details/128866686

30090

聊聊基于Alink库的特征工程方法

Ryan_OVO

VectorAssembler 是用于将多列特征合并为单列特征向量的类。它将多个特征列的值合并为一个特征向量,通常用于特征工程的最后阶段,以准备机器学习模型的输...

17210

简述机器学习和深度学习的区别

秋名山码神

博主目前不是相关从事人员,本文的书写时,博主学习机器学习与深度学习已有2月有余,如有知识性错误还请指正。

19330
领券