首页标签特征工程

#特征工程

从原始数据转换为特征向量的过程。 特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间。 典型的特征工程包括数据清理、特征提取、特征选择等过程。

汽车之家推荐系统排序算法迭代之路

石晓文

美团点评 · 算法实习生 (已认证)

导读:汽车之家的推荐系统紧随前沿技术,在支持内部多个推荐场景的同时,对外也有了一定的输出。未来我们期望汽车之家的推荐系统不只是前沿技术的应用者,更是推动者和创新...

18210

10万元奖金,开启“智源粒子分类赛”下半时,三篇高分Baseline带你突破瓶颈!

大数据文摘

高能质子对撞中会产生大量粒子团喷注(jet),喷注可以根据其不同内在特性分为胶体喷注、轻夸克喷注、魅夸克喷注、美夸克喷注。

10920

深度CTR预估模型的演化之路

石晓文

美团点评 · 算法实习生 (已认证)

传统CTR预估任务采用的方法不外乎特征工程+LR/FM的组合,这种通过大量特征工程来提高预测效果的工作费时费力,且构造过程不具有通用性。此外,传统的人工特征工程...

16230

一日一学--如何对数值型特征进行分桶

材ccc

当数值特征跨越不同的数量级的时候,模型可能会只对大的特征值敏感,这种情况可以考虑分桶操作。

54320

CNN vs RNN vs ANN——3种神经网络分析模型,你pick谁?

AI科技大本营

这个问题很有意义。机器学习算法并没有什么不足之处,那么为什么数据科学家要选择深度学习算法呢?神经网路能够提供给我们哪些传统机器学习提供不了的功能呢?

71410

在一个机器学习项目中,你需要做哪些工作?

超哥的杂货铺

机器学习是通过对已有数据进行模型训练,再将训练好的模型应用于未知数据的过程。从这句话中我们可以看到几个关键要素:数据,模型,训练,应用。对于一个通常的机器学习项...

12010

推荐系统流程

马哥Python

建立推荐系统前,首先要根据业务目标确定推荐系统的优化目标,而ctr只是可能被设置成的优化目标之一。

12920

面向 Kaggle 和离线比赛实用工具库 nyaggle,解决特征工程与验证两大难题(附代码)

AI研习社

而 nyaggle 就是一个特定于 Kaggle 和离线比赛的实用工具库,它主要作用于四个部分,即:特征工程、模型验证、模型实验以及模型融合,尤其在特征工程和模...

9210

刀尖上的舞蹈?股票Alpha模型与机器学习

量化投资与机器学习微信公众号

量化投资与机器学习微信公众号 · 新媒体运营 (已认证)

特征工程是最大限度地从原始数据中提取特征以供算法和模型使用,一个好的特征在任何普通的模型中都会发光,而一批平庸的特征使用再复杂的算法也难以压榨出选股能力。

15510

巴菲特的Alpha:利用机器学习量化『股票基本面』

量化投资与机器学习微信公众号

量化投资与机器学习微信公众号 · 新媒体运营 (已认证)

现在我们已经对我们的数据进行了一些研究,我们可以继续进行更多的研究,或者转移到特征工程中,或者更具体地说,是特征选择。特征工程是改变数据集以增强机器学习模型的过...

16910

CNN vs.RNN vs.ANN——浅析深度学习中的三种神经网络

人工智能小咖

这是一个值得思考的问题。机器学习算法并不缺乏,那么为什么数据科学家会倾向于深度学习算法呢?神经网络提供了传统机器学习算法不具备的功能吗?

19230

一文看懂预测性维护

黄成甲

当前,新一轮科技革命和产业变革孕育兴起,大数据的集聚、理论算法的革新、计算能力的提升及网络设施的演进,驱动人工智能发展进入新阶段,人工智能正加快在工业领域的渗透...

39030

深度学习之Keras检测恶意流量

FB客服

Keras是由 Python 编写的神经网络库,专注于深度学习,运行在 TensorFlow 或 Theano 之上。TensorFlow和Theano是当前比...

19830

【深度好文】推荐系统中的深度匹配模型

腾讯大讲堂

腾讯 · 产品经理 (已认证)

Google 的 wide&deep 框架固然强大,但由于 wide 部分是个 LR 模型,仍然需要人工特征工程。华为诺亚方舟团队结合 FM 相比 LR 的特征...

27720

从700多支队伍脱颖而出,知乎这个算法大赛冠军这样让大V「谢邀」答题

机器之心

在他的解题过程中,首先对数据进行特征工程,然后将特征输入到模型中进行训练并调参,最终评价结果。其中,特征工程无疑是解题中非常关键的步骤。

8610

机器学习模型五花八门不知道怎么选?这份指南告诉你

AI科技大本营

· 适用于在已有了一些预先定义好的变量并且需要一个简单的预测模型的情况下使用;

11020

DeepFM在贝壳房源详情页推荐场景的实践

石晓文

美团点评 · 算法实习生 (已认证)

上一篇文章《wide&deep 在贝壳推荐场景的实践[1]》中,我们介绍了贝壳首页推荐展位使用的 Wide & Deep 模型,本文向大家介绍贝壳房源详情页推荐...

25320

独家 | 经验&教训分享:我的第一个机器学习项目

数据派THU

除了上面所显示的特征工程,我们还尝试了许多类型的特征工程和筛选(从数据集A开始直到数据集C,这些特征工程被依次实现)。虽然我们自己得到的MSE测试分数并不总是与...

22220

泰坦尼克号幸存预测

py3study

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析

13220

亚马逊畅销书的NLP分析——推荐系统、评论分类和主题建模

石晓文

美团点评 · 算法实习生 (已认证)

与所有其他零售公司一样,亚马逊努力解决客户评论中存在的欺诈和质量差的问题,并开发系统来识别公正和可靠的信息,以获得更好的客户体验。该分析试图将自然语言处理、情感...

30230

扫码关注云+社区

领取腾讯云代金券