有没有办法使用Pandas将时间序列中的行(相同的特性，5行[每年1行])转换为包含20列的单个特性？

python、pandas

很抱歉，这个问题与其他问题类似，但我找不到适合我的特定情况的好答案。我正在处理一个时间序列的图像数据。在我的数据框中，每个特征都有5行数据:每年1行。我想把这五行转换成列，这样我就只有一个特征行，但我不能丢失或聚合任何数据。我的数据帧如下所示： df = pd.DataFrame([[1, 3, 4, 9, 31,

浏览 7提问于2021-01-28得票数 0

1回答

Openrefine基于文本将行转到列中

openrefine

我收到了一个图书馆目录中的数据转储，它是以.txt格式发布的。我已经能够将数据放入电子表格中，但它们都在一列中。我想把这些行转成几列。数据按以下顺序列在这一列中:标题文档类型、作者日期因此，我不能根据行数将这些记录转换为列。每个标题前面都有“描述”一词。这是贯穿整个数据集的一个常规特性</e

浏览 2提问于2017-09-29得票数 2

2回答

如何对时间序列数据进行转换，将有监督的学习算法应用到时间序列数据中？

classification、time-series、random-forest、training

为可能是一个非常基本的问题事先道歉。我有一个由对不同客户的营销调用组成的数据集，其中包括呼叫的时间戳。我的目标是训练一个模型来预测一个客户是会根据呼叫时间来响应还是忽略它，以及其他功能，比如呼叫者id等等。问题是，调用的结果显然是时间依赖的，也就是说，每个客户端数据点的顺序是预测给定时间内因变量的顺序。我的问题是，我如何转换我的</em

浏览 0提问于2019-07-08得票数 1

回答已采纳

2回答

LSTM特征选择过程

time-series、feature-selection、lstm

我们需要用LSTM模型实现一个时间序列问题。但是，在实现相同功能的同时，我面临的主要挑战是功能选择问题。因为我们的数据集包含2300个观测和600个特征。将单个列视为预测器(我们希望预测的特性) X的形状变成，2280×20×1(如果时间步长为20)。准确度也很差。此外，尝试与主成分分析，使所有600个特征减少到20个特征保留了大约98%的数据

浏览 0提问于2018-02-16得票数 9

1回答

在机器学习算法中处理数据帧中的时间日期特征

python、pandas、timestamp

'是日期格式(即2020/12/31 18:32:19)，对于其他时间-日期特性也是类似的。我正在尝试对此数据集使用基于学习的方法，但是，我已经设置了一个函数，该函数使用以下代码自动将pandas object特征(例如'plug-in time', 'plug-out time', 'charging].hour+60*df['plug-in time'][row].m

浏览 3提问于2021-03-01得票数 0

3回答

如何以压缩的csv或拼花文件(类似的to.gz格式)有效地上传pyspark

python、amazon-s3、pyspark、apache-spark-sql

我在S3中有130个GB的S3文件，它使用从redshift到S3的并行卸载加载。因为它包含多个文件，所以我想减少文件的数量，这样我的ML模型(使用sklearn)就更容易阅读了。我已经设法使用: S3将多个数据从spark_df转换为火花数据格式(称为spark_df)。 spark_df1包含100多个列(特性)，是我对数百万客户ID的<em

浏览 8提问于2022-05-14得票数 0

回答已采纳

1回答

基于学习模式的学生考试成绩预测

time-series、machine-learning-model

根据https://machinelearningmastery.com/convert-time-series-supervised-learning-problem-python/的说法，我可以将时间序列转换为日期对如果我然后将涉及一个学生的所有行合并成一行，并具有10,000个特性，那么对于一些具有数万个特性的队列，我有一千行<

浏览 0提问于2023-01-21得票数 0

回答已采纳

1回答

auto列使UL的每个LI在一行上对齐

css、css-multicolumn-layout

我有一个包含多个列表元素的无序列表。我不知道上述ul中li元素的确切数量--例如，它可以是3个或4个元素(都是非常简洁的元素) --但是我将每个li都作为一个block (而不是一个实际的列表)进行display，并希望使用columns特性将所有元素都设置在一行上，相同地居中/对齐。但是，如果我使用columns: 4，并且只有3个元素，那么它们就像缺

浏览 0提问于2017-09-11得票数 2

1回答

如何在顶点AI AutoML时间序列模型中选择目标列

google-cloud-platform、google-cloud-automl、google-cloud-vertex-ai

我正在用时间序列AutoML模型测试Google顶点AI。我从Biguery表创建了一个数据集，其中有2列，一列是时间戳，另一列是我想要预测的数值：salesorderdate是我的TIMESTAMP列，orders是我想要预测的值。当我继续下一步时，我无法选择orders作为我要预测的值，因此该字段没有可用的选项：我在这里错过了什么？在这种情况下，时间序列值肯定是目标值吗？这里是否期望有更多

浏览 8提问于2021-06-25得票数 1

回答已采纳

2回答

MySQL联合限制的性能

mysql

我有两个不同的MySQL表，它们都包含时间序列数据(因为它们都包含一个'timestamp‘列)。除了“timestamp”列之外，这两个表除了“client_id”列之外，没有任何共同的特性。这两个表都以(client_id，时间戳)为索引。我正在尝试将这两个表合并为一个分页的时间序列。具体地说，我的意思是，我试图从timestamp排序的<

浏览 1提问于2012-04-19得票数 4

回答已采纳

1回答

如何使用Jeigen覆盖矩阵的列/行(vs. EJML)

java、matrix、ejml

我使用来表示Java语言中的矩阵(Jeigen是Eigen的包装器)。这个库又快又简单，但我遗漏了一个很酷的特性。据我所知，Jeigen不支持交换列或行(例如，对列进行操作，然后用新值替换列)。Jeigen仅支持设置单个条目。或者，也许EJML支持这一点。但是

浏览 4提问于2016-02-13得票数 0

1回答

如何在Python中优化正则表达式匹配搜索

python、regex、search、optimization

程序问题现在我把每一个步骤的定义都转换成一个正则表达式，比如.I {qualifier} click on the {place}将转换为(I (should not|should) click o

浏览 3提问于2020-04-07得票数 1

1回答

将Parquet文件分区列存储在不同文件中

python、pandas、parquet、pyarrow、apache-arrow

我有一个大型数据集，它收集了许多对象(行)的属性/特性(列)。行数约为100k-1M (行数将随着时间的推移而增长)。相反，这些列在逻辑上分成200组，每组有200-1000列。当数据到达时，我希望将这组不断增长的列存储在parquet中。最终，所有列组都将填充数据。随着时间的推移，新的对象(行)将到达，并且它们的数据将</em

浏览 47提问于2020-03-05得票数 3

1回答

如何设置1dCNN+LSTM网络(Keras)的输入形状？

python、tensorflow、keras、lstm

我有以下的想法来实施：输入有100个时间步骤，每个步骤都有一个64维特征向量Conv1D层将在每个时间步骤中提取特性。CNN层包含64个过滤器，每个过滤器有16个水龙头。然后，最大池层将提取每个卷积输出的单个最大值，从而在每个时间步骤中总共提取64个特征。然后，

浏览 1提问于2018-04-17得票数 2

1回答

使用scikit对数据进行缩放时的奇怪结果

python、scikit-learn、time-series、feature-scaling

我有一个输入数据集，它有4个时间序列，包含288个值，为期80天。所以实际形状是(80,4,288)。我想把不同的日子聚在一起。我有80天，他们都有4个时间序列:外部温度，太阳辐射，电力需求，电价。我想要的是将这4个时间序列组合成簇的相似的日子分组。属于同一组的天数应具有类似的时间序列。在使用k均值或Ward的</em

浏览 6提问于2022-08-24得票数 0

回答已采纳

1回答

将我的数据格式化为RNN输入的可取方法

python、keras、recurrent-neural-network

我有一个dataframe X，其中每一行都是一个数据点，每一列都是一个特性。标签/目标变量Y为单变量。X的一个列是Y的滞后值。根据我在这个网站上所读到的，batch_size应该尽可能大，而不会耗尽内存。我主要怀疑的是n_timesteps。和n_features。我认为n_feature是X数据中的列数。

浏览 12提问于2022-02-18得票数 1

回答已采纳

1回答

我在这里阅读这个博客是为了了解的理论背景，但是在阅读了之后，我有点困惑于什么** 1)时间步骤，2)展开，3)隐藏单位的数目和4)批大小**？也许有人也可以在代码的基础上解释这一点，因为当我查看模型配置时，下面的代码没有展开，但是在这种情况下，timestep在做什么呢？让我说，我有一个长度为2.000点的数据，分为40个时间步骤和一个特征。隐藏的单位是100。批次大小没有定义，模型中发生了什么？history=model.fit(train, train, epoch

浏览 0提问于2018-05-22得票数 1

回答已采纳

3回答

如何为LSTM时间序列预测准备数据

python、learning

我有一个时间序列数据的二进制分类任务。我的CSV中的每14行都与一个时隙相关。我应该如何准备这些数据在LSTM中使用？换句话说，如何向模型提供这些数据？

浏览 0提问于2017-03-28得票数 3

1回答

为什么pandas* Dataframe.to_csv的输出与Series.to_csv不同？*

python、python-3.x、pandas、dataframe、csv

我的问题是，当我尝试使用apply遍历我的Dataframe时，我得到了一个Series对象，to_csv方法给了我一个拆分成行的str，将None设置为""，没有任何,。但是，如果我使用for遍历数据帧，我的方法将获得一个Dataframe对象，并在一行中给出一个包含,的str，而不会将None设置为""。0.12 使用f

浏览 28提问于2021-04-22得票数 3

回答已采纳

1回答

如何根据时间戳将dataframe与json数据同步或合并

python、json、pandas、dataframe、merge

有很多关于如何合并两个pandas数据帧的例子，但我的问题是我有两种数据。data1是一个csv数据，我用pandas读取它并将其转换为dataframe，另一个data2是json格式的。在每一列中，都有与该特性相对应的所有值，并且这些值都在这个json中。我的目标是基于时间戳合并这两个数据集。这非常困难，因为在json中，我有一个与每个单独的</em

浏览 9提问于2019-11-11得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Openrefine基于文本将行转到列中

如何对时间序列数据进行转换，将有监督的学习算法应用到时间序列数据中？

LSTM特征选择过程

在机器学习算法中处理数据帧中的时间日期特征

如何以压缩的csv或拼花文件(类似的to.gz格式)有效地上传pyspark

基于学习模式的学生考试成绩预测

auto列使UL的每个LI在一行上对齐

如何在顶点AI AutoML时间序列模型中选择目标列

MySQL联合限制的性能

如何使用Jeigen覆盖矩阵的列/行(vs. EJML)

如何在Python中优化正则表达式匹配搜索

将Parquet文件分区列存储在不同文件中

如何设置1dCNN+LSTM网络(Keras)的输入形状？

使用scikit对数据进行缩放时的奇怪结果

将我的数据格式化为RNN输入的可取方法

展开、计时步骤、批次大小和隐藏单元

如何为LSTM时间序列预测准备数据

为什么pandas* Dataframe.to_csv的输出与Series.to_csv不同？*

如何根据时间戳将dataframe与json数据同步或合并

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐