机器学习特征提取 | 自动特征工程featuretools

1、什么是Featuretools?

为了能使框架普适,就像pandas用于数据准备或scikit-learn用于机器学习。

链接:https://www.featuretools.com/

2、安装

通过源码安装,代码如下:

git clone https://github.com/featuretools/featuretools.git
cd featuretools
python setup.py install

通过pip安装,命令如下:

pip install featuretools

3、五分钟快速开始

1)首先导入相关包:

In [1]: import featuretools as ft

2)准备相关数据:

In [2]: data = ft.demo.load_mock_customer()
In [3]: customers_df = data["customers"]
In [5]: sessions_df = data["sessions"]
In [7]: transactions_df = data["transactions"]
In [10]: relationships = [("sessions", "session_id", "transactions", "session_id"),
   ....:                  ("customers", "customer_id", "sessions", "customer_id")]

3)特征综合:

In [11]: feature_matrix_customers, features_defs = ft.dfs(entities=entities,
   ....:                                                  relationships=relationships,
   ....:                                                  target_entity="customers")

In [12]: feature_matrix_customers

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏布尔

金格科技iMsg2000消息数据格式

本文介绍的是金格科技iweboffice2003控件前端向服务器发请求后服务器解析数据流的过程,从中也可以了解其前端对数据的封装过程,不复杂很简单,挺不错的数据...

1906
来自专栏debugeeker的专栏

《coredump问题原理探究》windows版7.2节list

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/detai...

662
来自专栏MelonTeam专栏

[译]Android TensorFlow机器学习示例

原文地址:<https://blog.mindorks.com/android-tensorflow-machine-learning-example- ff...

2116
来自专栏debugeeker的专栏

《coredump问题原理探究》windows版7.4节set

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/detai...

501
来自专栏云时之间

深度学习与神经网络:调用数据集,完成应用(2)

在上一篇文章中,我们通过使用mnist上的图片和标签数据来去制作数据集,而今天这一篇文章我们将在反向传播过程中和测试过程中调用数据集.

2055
来自专栏社区的朋友们

对基于 TCP 的网络应用在 socket 非阻塞模式下 send 调用错误原因的深入分析

本文试图从 send 函数以及 TCP 协议两个点进行问题的分析,并复现出错误场景,最后针对导致错误的原因来给出解决方案。

4100
来自专栏debugeeker的专栏

《coredump问题原理探究》windows版7.6节string

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/detai...

922
来自专栏林德熙的博客

C# 使用转换语义版本号

本文告诉大家如何转换语义版本号,那么什么是语义版本号,语义版本号(semantic version)就是版本号带 alpha 等的版本号

961
来自专栏企鹅号快讯

Bootstrap项目实训干货:设计带修改和删除的图书表格

# 一、实验目标 写一个带修改和删除的表格。页面如下: ? # 二、环境依赖 采用bootstrap框架来实现,依赖的版本为3.3.7。 我们可以直接引用cdn...

1945
来自专栏机器学习算法与Python学习

支持向量机Python实现(附源码与数据)

之前的文章已经将支持向量机的原理讲解的比较清楚了,今天这篇文章主要是基于Python实现支持向量机,具体的数据集和源代码如下所示(文末附有本文使用的数据集和源代...

3855

扫码关注云+社区