FeatureTools: time_index参数中可以有多个列吗？

文章/答案/技术大牛

发布

1回答

python、python-3.x、datetimeindex、featuretools

我在一个数据帧中有两个时间参数，即start_date和end_date，当从一个数据帧创建一个实体集时，这两个参数都是时间参数。在指定time_index时，我们可以指定两个不同的列吗？我不想创建一个合并2列的新列，因为我想得到这两列的agg_primitives，如"time_since_first"，"time_since_last"，"avg_time_be

浏览 16提问于2019-09-29得票数 1

回答已采纳

1回答

在计算特征时选择过去的数据量

featuretools

我想知道是否有一种方法可以在计算特性时自动选择过去的数据量。例如，我可能想预测一个客户什么时候会进行下一次购买，所以最好通过不同的日期截断来知道购买的数量或平均购买价格。

浏览 1提问于2018-06-21得票数 2

回答已采纳

2回答

在Python特性工具中将当前行排除在特性工程之外

python、pandas、datetime、feature-extraction、featuretools

Package featuretools包含参数cutoff_time，以及时排除cutoff_time之后的所有行。我将cutoff_time设置为time_index value - 1 second，因此我希望这些特性是基于历史数据减去当前行的。这允许从历史记录行中包含响应变量。问题是，当这个参数不等于time_index变量时，我在原始和生成的特性中得到了一堆NaN。#!/usr/bin/env python3 impo

浏览 0提问于2018-07-05得票数 3

回答已采纳

1回答

如何在功能工具中为多个日期时间列创建功能？

python、featuretools

如何为多个数据列创建特性？ DFS和calculate_feature_matrix之间有什么(性能)差异吗？虽然我要对相同结构的不同实体集执

浏览 5提问于2022-10-12得票数 0

1回答

FeatureTools:处理多到多的关系

python、python-3.x、feature-engineering、featuretools

我有多列采购的数据，包括以下三栏： WORKER_ID (index of worker)一个工作人员可以有多个与他们关联的帐户，一个帐户可以有多个工作人员。那么我就会得到一个错误：到目前为止，我的

浏览 1提问于2018-10-03得票数 2

回答已采纳

1回答

使用带有时间戳的FeatureTools到normalize_entity时，无法将列转换

featuretools

我正在尝试使用FeatureTools来规范化一个用于特征合成的表。我的表格类似于Max-Kanter对的回应。我遇到了一个异常，我希望能得到一些帮助。异常源于featuretools.entityset.entity.entityset_convert_variable_type，它似乎不处理时间类型。 dataframe=df, entity_id='appointments&

浏览 47提问于2018-06-12得票数 0

回答已采纳

1回答

在实体中找不到es.normalize_entity错误变量

featuretools

我正在使用featuretools文档来学习entityset，目前我得到了以下代码的错误KeyError: 'Variable: device not found in entity'：data = ft.demo.load_mock_customer()customers_dfes.entity_from_dataframe(entity_id="transactions",

浏览 12提问于2018-07-29得票数 1

1回答

功能工具与非唯一连接键的关系

python、feature-extraction、feature-engineering、featuretools

假设我有两个表，一个包含关于带有字段customer_id的客户的元数据，以及一个记录在网站单击流事件中的事件表，其中字段为customer_id，date。

浏览 0提问于2018-09-23得票数 0

回答已采纳

1回答

为什么当我增加达斯克工人的数量时，特性工具会慢下来？

jupyter-notebook、dask、amazon-sagemaker、feature-engineering、featuretools

该示例包含来自5个不同“资产”的4500行和735列(我指的是每个资产的147列)。代码对列进行过滤，并为每个筛选的Dataframe创建一个功能矩阵。(我想我创造了9个工人，每个人有8个核心。)=dataframe, time_index) if __name

浏览 1提问于2020-03-07得票数 0

回答已采纳

1回答

对单个表上的滞后要素使用要素工具

featuretools

现在，我的情况有点不同，我有一个表，看起来像这样基本上，我将相同特性的滞后版本放在同一表的不同列中。在这种情况下，我可以使用功能工具吗？

浏览 3提问于2018-06-06得票数 1

1回答

如何通过在表中交叉特性来使用FeatureTools生成新特性？

featuretools

如何通过在表中交叉特性来使用FeatureTools生成新特性？

浏览 0提问于2018-05-08得票数 2

1回答

如何使用来自多个要素/列的值组合来创建有趣的值

featuretools

我对features还是个新手，正在尝试理解是否以及如何将有趣的值添加到使用多个功能生成的实体集。例如，我有一个包含两个实体的实体集: customers和transactions。交易可以是借记卡或信用卡(c_d)，并且可以跨不同的消费类别(tran_category)发生-餐馆、服装、食品杂货等。到目前为止，我能够为这两个特性中的任何一个创建有趣的值，但不能从它们的组合中创建： import featuretools as ft x = ft.EntitySet

浏览 11提问于2019-01-11得票数 2

回答已采纳

2回答

Python中timeseries数据集的特征工程

python、feature-extraction

我有一个包含n观测值的数据集，其中所有观测值都具有m时间步长。我还有一个n*m数组，其中包含每个给定观察值的每个时间步的标签。有没有什么Python包可以简化这个过程？我遇到了tsfresh ()，尽管它似乎只打算在我们只有一个标签来对每个观察结果进行分类时使用，而不是像我这样用一个标签来对每个时间步进行分类。

浏览 2提问于2017-04-16得票数 0

1回答

在功能工具中，如何控制where_primitives的应用？

featuretools

在featuretools中，我们有各种基本的应用程序控制机制来定制应用原语来选择entities和列。它们是非常整洁的文档。所有原语应忽略的DFS控制实体和变量(列)的ignore_entities和ignore_variables参数。这对于忽略与问题无关或不应该包含在DFS运行中的列或实体非常有用。单个原语或原语组的选项由DFS的primitive_options参数设置。此参数将任何所需的选项映射到特定的原

浏览 0提问于2021-06-29得票数 0

1回答

对单表数据使用featuretools工具的正确方式是什么？

data-science、feature-selection、feature-engineering、featuretools

假设我有一个由单个表组成的数据集，例如，您可以考虑kaggle上的泰坦尼克型数据集。现在，使用功能工具获得最大收益的适当方式是什么？as featuretools是专门针对关系数据的。现在我说“适当”，我的意思是，当创建实体集时，index参数将只是数据集的索引，但是在规范化实体时，我的新索引应该是什么呢？同样，盲目地使用RFE进行特征选择也可以吗？

浏览 44提问于2020-02-22得票数 0

1回答

当我只有一个数据帧时，如何使用特性工具获得dfs的自动特性？

python、pandas、feature-extraction、featuretools

我试图弄清楚Featuretools是如何工作的，我正在Kaggle上的房屋价格数据集上测试它。因为数据集很大，所以我在这里只使用一组数据集。期间没有使用一些指定的原语: agg_primitives：‘max_depth’、‘max_depth’、'sum‘--这可能是由于使用max_depth的值太小，没有设置有趣的值，或者它可能表明数据中没有为原语找到兼容的列如果DFS调用包含上面列表中一个原语的多个实例，则没有使用它们。首先，我说，这是因为我有一个小的数据，没有任何有用的东西可以

浏览 4提问于2022-04-30得票数 0

回答已采纳

1回答

内置聚合和转换原语列表

featuretools

我是不是只需要把API中的方法列表替换成小写字母(中间还有下划线)？

浏览 8提问于2019-06-13得票数 2

回答已采纳

1回答

用于在保持cut_off时间的子实体上聚合的功能工具

python、featuretools

有一组分销商(< 在计算与每个时间戳相关联的分配器的平均标签时，时间戳排序是非常重要的，以避免信息泄漏。下面是我使用Pandas的方法： import pandas as pdfrom datetime import datetimees.entity_from_dataframe(entity_id='Sales', dataframe=df, index='index', make_inde

浏览 27提问于2020-04-16得票数 2

回答已采纳

1回答

线程可以有多个参数吗？

c、arguments、pthreads

线程可以在不使用结构的情况下有多个参数吗？谢谢你，Hristo

浏览 1提问于2010-02-14得票数 0

回答已采纳

2回答

#define可以有多个参数吗？

您好，我想创建一个有两个甚至三个参数的定义，这可能吗？

浏览 42提问于2011-08-25得票数 0

点击加载更多