首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    手把手 | 如何用Python做自动化特征工程

    EntitySet(实体集)是表的集合以及它们之间的关系。可以将实体集视为另一个Python数据结构,该结构具有自己的方法和属性。)...我们可以使用以下命令在featuretools中创建一个空实体集: import featuretools as ft # Create new entityset es = ft.EntitySet...在添加entities并建立关联后,我们的entityset就算完成了,可以开始建立特征量了。 特征基元 在我们完全深入进行特征合成之前,我们需要了解特征基元。...我们传入entityset,target_entity,这是我们要添加特征的表,选择的trans_primitives(转换)和agg_primitives(聚合): # Create new features...using specified primitives features, feature_names = ft.dfs(entityset = es, target_entity = 'clients

    4.3K10

    机器学习实战 | 自动化特征工程工具Featuretools应用

    image.showmeai.tech/machine_learning_in_action/209.png) 实体(Entities) 一个Entity可以视作是一个Pandas的数据框的表示,多个实体的集合称为Entityset...特征算子(Feature primitives) DFS通过将特征算子应用于Entityset的实体关系来构造新特征。算子就是一些特征工程的函数,例如groupby mean max min等等。...接下来我们创建一个特征EntitySet,它是一种包含多个数据框及其之间关系的结构。...# 构建实体集合es es = ft.EntitySet(id = 'sales') # 添加dataframe数据 es.add_dataframe(dataframe_name = 'bigmart...divide_numeric'] # 2列相加减乘除来生成新特征 agg_primitives=['sum', 'median','mean'] feature_matrix, feature_names = ft.dfs(entityset

    1.3K83

    独家 | 用Python Featuretools库实现自动化特征工程(附链接)

    深度特征综合(Deep Feature Synthesis ,DFS) 特征基元(Feature primitives) 一个Entity可以视作是一个Pandas的数据框的表示,多个实体的集合称为Entityset...DFS通过将特征基元应用于Entityset的实体关系来构造新特征。这些特征基元是手动生成特征时常用的方法。例如,基元“mean”将在聚合级别上找到变量的平均值。...在继续之前,我们将创建一个特征EntitySet,它是一种包含多个数据框及其之间关系的结构。那么,让我们创建一个EntitySet并将数据框组合添加进去。 ?...让我们检查一下EntitySet的摘要。 ? 如上所示,它包含两个实体,bigmart和outlet。两个表之间也形成了一种由Outlet_Identifier连接的关系。...回想一下,DFS使用Feature Primitives和EntitySet中存在的多个表来构造新特征。 ?

    1.5K20
    领券