机器学习特征提取 | 自动特征工程featuretools

1、什么是Featuretools?

为了能使框架普适,就像pandas用于数据准备或scikit-learn用于机器学习。

链接:https://www.featuretools.com/

2、安装

通过源码安装,代码如下:

git clone https://github.com/featuretools/featuretools.git
cd featuretools
python setup.py install

通过pip安装,命令如下:

pip install featuretools

3、五分钟快速开始

1)首先导入相关包:

In [1]: import featuretools as ft

2)准备相关数据:

In [2]: data = ft.demo.load_mock_customer()
In [3]: customers_df = data["customers"]
In [5]: sessions_df = data["sessions"]
In [7]: transactions_df = data["transactions"]
In [10]: relationships = [("sessions", "session_id", "transactions", "session_id"),
   ....:                  ("customers", "customer_id", "sessions", "customer_id")]

3)特征综合:

In [11]: feature_matrix_customers, features_defs = ft.dfs(entities=entities,
   ....:                                                  relationships=relationships,
   ....:                                                  target_entity="customers")

In [12]: feature_matrix_customers

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏10km的专栏

cmake 3.5:find_package(HDF5) 指定HDF5_ROOT无效问题

我们知道cmake提供了FindHDF5.cmake(位置:$cmake_root/Modules)模块用于搜索HDF5组件。 通过查看FindHDF5.c...

1989
来自专栏小詹同学

深度学习入门笔记系列 ( 一 )

本系列将分为 8 篇 。今天是第一篇 ,工欲善其事必先利其器 ,先简单讲讲当前的主流深度学习框架 TensorFlow 及其安装方法 。

872
来自专栏人工智能LeadAI

Tensorboard入门 | TensorFlow深度学习笔记

Tensorboard是TensorFlow自带的一个强大的可视化工具 01 功 能 这是TensorFlow在MNIST实验数据上得到Tensorboard...

3685
来自专栏我是攻城师

关于Elasticsearch里面聚合group的坑

3336
来自专栏coderhuo

虚拟内存探究,深入理解进程地址空间

想了解堆栈等虚拟内存相关知识吗? 想知道下面这张进程地址空间示意图是如何一步一步画出来的吗? 《虚拟内存探究》系列文章将通过实验的方式带你学习相关知识。

802
来自专栏梦里茶室

TensorFlow深度学习笔记 Tensorboard入门

Github工程地址:https://github.com/ahangchen/GDLnotes 官方教程:https://www.tensorflow.org...

1888
来自专栏Hadoop实操

Hadoop之上的模型部署 - CDSW1.4新功能模块

CDSW1.4提供了一个新的模型模块,可以让数据科学家通过REST API的方式来构建,部署和管理模型,从而提供预测。如下图所示,这个功能可以帮助数据科学家实现...

832
来自专栏瓜大三哥

Matlab基本语法9

simulink基本知识 simulink是matlab软件的重要组成部分,能够进行系统的建模、仿真和综合分析,提供了交互式图形化环境,在simulink中,把...

1968
来自专栏GAN&CV

深度学习优化器算法详解:梯度更新规则+缺点+如何选择

转载自:https://mp.weixin.qq.com/s/RZc1PUgZs1BqRPeyBmTELA

1562
来自专栏calvin

SSH通过SSH代理连接到内网机器

操作步骤: 1.实现本地机器到代理机器的SSH连接。 ssh ftpuser@proxyip

873

扫码关注云+社区