如何将我的dataframe写出为给定列的每个值一个文件？_为给定行中的每个唯一值添加列_如何将我的字典值转换为dataframe中的列？ - 腾讯云开发者社区

pandas、dask

我有一个数据帧，它有一个名为key的列，值的范围从00到FF (以字符串形式)。理想情况下，我会将数据帧编写为每个key值一个或多个文件。也就是说，我不希望一个分区有多个可能的key值。我目前的方法不起作用，因为它只生成一个文件： import dask.dataframe

浏览 20提问于2020-11-09得票数 1

1回答

具有dataframe名称的数据序列列表的变异列

r、list、dataframe、function、lapply

我试图自动为给定的数据文件列表中的所有数据文件创建一个列(名为FXN)，以便生成列的名称：ldf <- lapply("d

浏览 2提问于2022-05-05得票数 1

1回答

将列添加到根据python中的列数据类型显示布尔值的dataframe中

python、pandas、dataframe、alphanumeric、non-alphanumeric

我正在尝试向dataframe中添加布尔值的列，这些布尔值基于对当前要迭代的列是字母数字、字母还是数字的判断。不幸的是，对于每个布尔测试，每一列都给出了False。我们的目标是，对于给定的列，我如何添加另一个列来显示给定列中的</e

浏览 25提问于2019-12-11得票数 1

回答已采纳

3回答

如何在不删除没有新数据的分区的情况下在Spark中分区和写入DataFrame？

apache-spark、spark-dataframe、partitioning、parquet

我正在尝试使用DataFrameWriter以Parquet格式将DataFrame保存到HDFS，该文件由三个列值划分，如下所示：但是，我在理解如何将数据组织到单分区DataFrame中的

浏览 2提问于2017-02-19得票数 37

3回答

选择在熊猫中呈现特定条件的列

python、pandas、filter、mask、any

我有一个关于物种和地点的数据。每个单元格包含一个丰度值。我只想选择那些在任何地点的丰富度高于5的物种。Site_2 0 0 0理想产出：Site_1 0 1Site_3 6 7 假设我有一个dataframe 150 x 150，我想要选择每个列，并写出它们的</em

浏览 6提问于2021-03-17得票数 0

回答已采纳

1回答

如何显示集合中每个项目的所有post标签？

eleventy

在.eleventy.js文件中，我为posts目录中的所有.md文件创建了一个getFilteredByGlob集合。然后，对于该集合中的每一项，我从每个.md文件的前面写出值。这工作得很好，但我正在为每个.md文件的标记而苦苦挣扎。大多数文件都有2个或更多的标签，我想让一个for循环分别

浏览 26提问于2020-07-14得票数 0

1回答

导出excel时如何设置列表头？

python、pandas

我尝试更改标题标题：for item in df.columns.map(lambda x: {x: self._get_column_header(x)}):self._set_column_style(df).to_excel(xls_writer, startcol=1,

浏览 7提问于2020-02-02得票数 0

1回答

对表中的每一列应用相同的聚合。

sql、postgresql、postgresql-8.3

我正在使用一个专有的mpp数据库，这个数据库已经从psql 8.3上分叉出来了。我正在尝试将一个简单的计数应用到一个宽表(大约450列)，所以我想知道用一个简单的sql函数来做这件事的最好方法。我只是在计算给定列中不同值的数量，以及该列中空值数的计数。例如，我想对每一列进行泛化的查询如果我想

浏览 2提问于2013-01-14得票数 3

回答已采纳

1回答

从字典创建数据时发生的StopIteration错误

python、dataframe、csv、dictionary

因此，我从字典中创建了一个数据格式来执行时间序列练习。当我创建dataframe (我是在Google中这样做)时，该单元格正确运行。但是当我做full_df.head()的时候。my_dict[record[0]].append(record) my_dict[record[0]] = [record] full_df = pd.DataFrame.from_dict

浏览 5提问于2021-11-25得票数 0

回答已采纳

1回答

Python -处理后将数据块列表转换为dataframe

python、pandas、dataframe、preprocessor、chunks

我使用分块函数为ML预处理我的数据，因为我的数据相当大。在数据处理之后，我尝试将处理后的数据作为新的列'chunk‘添加回原始数据框中，这给了我一个内存错误，因此我试图一次将块加载到数据帧中，但我仍然收到内存错误：lookup = { 'g': 0.50,

浏览 18提问于2020-02-12得票数 1

2回答

如何垂直组合具有不同列数的两只熊猫数据

python、python-3.x、pandas、dataframe

有两个dataframe，一个dataframe的列可能比另一个少。例如,import numpy as np 'col1': ['A', 'B'], 'col3': [0, 1]df1 = pd.DataFrame</

浏览 6提问于2022-05-05得票数 1

回答已采纳

1回答

Pandas基于列表对行进行自定义排序

python、pandas

给定一个数据帧和一个列表，其中包含数据帧的列的值。(列表是等长的，因为dataframe中的行和每个值都恰好是1)如何根据列表中的顺序对dataframe中的行进行排序？import pandas as pd df = pd.DataFrame({'user': [

浏览 13提问于2020-05-09得票数 2

回答已采纳

1回答

如何使用openpyxl从列表中向excel添加额外的列标题

python、pandas、openpyxl

我希望使用list和openpyxl为我的dataframe添加额外的列标题。请参阅下面的代码片段。import pandas as pdfrom openpyxl.styles import font..worksheet = workbook.active

浏览 7提问于2022-07-17得票数 -1

2回答

在DataFrame df中，我有一个包含时间戳值的列datetime。问题是，在某些行中，这些是unix时间戳，而在其他行中，这些是yyyyMMddHHmm格式。如何验证每个给定值都是unix时间戳，如果不是要将其转换为时间戳？df.withColumn("timestamp", unix_timestamp(col("datetime"))) 我假设应该使用when...otherwise，

浏览 4提问于2018-10-17得票数 1

2回答

Newbie事务问题:在读-计算-write中防止竞争

sql、sql-server、transactions

我想在一个事务中执行以下操作：换句话说，SQL服务器能否用作<em

浏览 5提问于2011-09-14得票数 5

回答已采纳

1回答

从2D数据帧创建多索引数据帧--将多变量时间序列数组转换为滞后的多索引数据帧。

python、pandas、dataframe、multi-index

我正在尝试将一个二维多变量时间序列形状(n_samples, n_channels)数组转换为一个具有多个索引列的DataFrame，该列具有最大的时间差。多索引列的“通道”位于第一级，然后是第二级的时滞。生成的dataframe的每一行将由dataset的一个时间窗口组成。-1我有一个<e

浏览 5提问于2022-10-14得票数 1

回答已采纳

1回答

使用pandas读取和合并文件

python、pandas、merge

我有几个.txt文件，格式为/folder/blahblah_*K.txt，其中星号表示开尔文温度。每个文件包含3列(让我们称它们为'A'，'B‘和'C')。我想创建一个具有公共索引(第一列，称为'A')和来自每个文件的'B‘列的单个DataFrame</e

浏览 1提问于2019-01-30得票数 0

1回答

多个数据存储中多列的计算模式

r、loops、mode

我有限的智力意味着我真的在努力完成以下的任务，任何建议都会被感激地接受！我现在有100个数据存储为一个列表(my.dfs)。在每个dataframe中有六列(a，b，c，d，e，f)。我想要计算a列在dataframe 1，然后dataframe 2，3，4.通过到dataframe 100，并将结果存储在一个新的向量(a.mode)中。因此，a.mode应该有

浏览 3提问于2013-10-23得票数 1

1回答

Spark Partition数据集(按列值)

scala、apache-spark、sharding、data-partitioning

(我们知道如何组合shard S+update= new shard S) 如果这就是我们的设计，我们需要(1)通过它的一列(比如:列K)将DataFrame分片到|range(K)|分区中，其中保证分区中的所有行在列K中具有相同的值，并且(2)能够找到与column_K=k相对应的DataFrame文件，知道k = row.uniqueID % numShard

浏览 19提问于2019-05-03得票数 2

回答已采纳

1回答

通过对每个df列应用函数创建系列

python、pandas、function、dataframe、series

给定一个DataFrame，我想在每一列中计数NaN值的数目，将比例显示为直方图。我想出了nan_dict = {} nan_dict[col是否有一种方法可以将value_counts应用于所有列，以便返回每个列都有

浏览 0提问于2021-05-03得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云