机器学习特征提取 | 自动特征工程featuretools

1、什么是Featuretools?

为了能使框架普适,就像pandas用于数据准备或scikit-learn用于机器学习。

链接:https://www.featuretools.com/

2、安装

通过源码安装,代码如下:

git clone https://github.com/featuretools/featuretools.git
cd featuretools
python setup.py install

通过pip安装,命令如下:

pip install featuretools

3、五分钟快速开始

1)首先导入相关包:

In [1]: import featuretools as ft

2)准备相关数据:

In [2]: data = ft.demo.load_mock_customer()
In [3]: customers_df = data["customers"]
In [5]: sessions_df = data["sessions"]
In [7]: transactions_df = data["transactions"]
In [10]: relationships = [("sessions", "session_id", "transactions", "session_id"),
   ....:                  ("customers", "customer_id", "sessions", "customer_id")]

3)特征综合:

In [11]: feature_matrix_customers, features_defs = ft.dfs(entities=entities,
   ....:                                                  relationships=relationships,
   ....:                                                  target_entity="customers")

In [12]: feature_matrix_customers

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法与Python学习

支持向量机Python实现(附源码与数据)

之前的文章已经将支持向量机的原理讲解的比较清楚了,今天这篇文章主要是基于Python实现支持向量机,具体的数据集和源代码如下所示(文末附有本文使用的数据集和源代...

44850
来自专栏代码小睿

绝对定位的层判断是否有相互覆盖的解决算法

  这个算法我在上篇博文《jQuery 模拟 ubuntu 3D desktop 的 Dodge Effect 效果》中有提到过。   但那时想法过于简单,当时...

28960
来自专栏祝威廉

MLSQL 对Python的支持之路

Python是做机器学习框架一定要支持的。MLSQL很早就支持集成Python脚本做模型的训练和预测。

12230
来自专栏debugeeker的专栏

《coredump问题原理探究》windows版3.4节coredump例子

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/detai...

10210
来自专栏debugeeker的专栏

《coredump问题原理探究》windows版7.6节string

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/detai...

12620
来自专栏林德熙的博客

C# 使用转换语义版本号

本文告诉大家如何转换语义版本号,那么什么是语义版本号,语义版本号(semantic version)就是版本号带 alpha 等的版本号

13110
来自专栏哲学驱动设计

OpenExpressApp 框架结构(2)

    上次随便画了一篇关于GIX4项目目前的类的结构图(见:GIX4 目前大致的类结构),目的是为了更好的认识系统,并对其进行改进。发现AutoUI部分的耦合...

18890
来自专栏社区的朋友们

对基于 TCP 的网络应用在 socket 非阻塞模式下 send 调用错误原因的深入分析

本文试图从 send 函数以及 TCP 协议两个点进行问题的分析,并复现出错误场景,最后针对导致错误的原因来给出解决方案。

55200
来自专栏布尔

金格科技iMsg2000消息数据格式

本文介绍的是金格科技iweboffice2003控件前端向服务器发请求后服务器解析数据流的过程,从中也可以了解其前端对数据的封装过程,不复杂很简单,挺不错的数据...

20360
来自专栏debugeeker的专栏

《coredump问题原理探究》windows版7.4节set

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/detai...

7410

扫码关注云+社区

领取腾讯云代金券