如何使用嵌套字典映射数据帧中的列？_转换数据帧中的嵌套字典？_如何从嵌套的字典列表中创建包含嵌套列的pandas数据帧 - 腾讯云开发者社区

python、list、dataframe、join

我有一个数据帧 df1： df=pd.DataFrame([[1,[1, 2]], [2,[3, 4]], [3,[5, 6,1,1]]], columns=['person','brand_id']) 另一个具有brand_id品牌名称的数据帧是 cars={1:'BMW',2:'HONDA',3:'HYUNDAI',4:'KIA',5:'FORD',6:'TESLA'} df2

浏览 9提问于2019-10-21得票数 1

回答已采纳

2回答

需要基于某些过滤器在嵌套的for循环中创建多个数据帧

python、python-3.x、pandas、dataframe、nested

我有证券的主要原始数据，我需要在其中创建基于某些筛选标准的多个证券投资组合。我习惯于在C++中工作，不太清楚如何用Python语言实现下面的代码。我尝试使用嵌套的for循环创建不同的数据帧： i -用于循环从2007年到2017年的年份(原始数据中的yr列) j -用于遍历从1到4的区域(原始数据中的列区域) for i in range (2007, 2018): for j in range (1,5): dfij_filter = (df['yr'] == i) & (df['Region'] == j)

浏览 8提问于2018-07-27得票数 2

1回答

我有一个包含多个数组的npy文件，我想将其添加到dataframe - python中的列中

python、pandas、numpy、dataframe、merge

我的npy文件包含120951个数组，加载方式如下： import numpy as np arm = np.load('full_numpy_bitmap_arm.npy') 我还有一个数据帧df，它有120951行和6列。我想将"arm“变量中的每个数组附加到数据帧中的每一行，作为数据帧末尾的一个新列。例如，arm在第一行最后一列，arm1在第二行最后一列，等等。我不确定连接函数在这里是否有效，因为arm不是一个数据帧。我想知道是否有其他方法可以做到这一点？谢谢

浏览 1提问于2020-11-25得票数 1

1回答

根据某些条件，我必须更新数据帧

python、python-3.x、pandas

我刚接触pandas，我正在尝试更新基于'Id'列的'Text‘列。我的数据是这样的[(1,'One'), (0, 'Zero'), (4,'Four'), (3, 'Three')]我在数据中也有一些丢失的id，对于那些丢失的id，我必须将其留空原始数据帧 Id A Text 0 0 NaN 1 1 NaN 2 2 NaN 3 3 NaN 4 4 NaN 最终数据帧 Id A Text 0 0 Zer

浏览 9提问于2020-05-11得票数 1

回答已采纳

1回答

从大熊猫数据帧列表中提取数据，并从中生成一个数据框架。

python、pandas、list、dataframe、loops

df_net = pd.DataFrame(j) //// where j is the list of list of data frames 当我运行上述命令并使数据帧从列表j生成时，我所看到的数据框架将在下面给出这个数据帧的每一行都有进一步的365个条目和5列

浏览 1提问于2020-09-21得票数 0

回答已采纳

1回答

使用pyspark在dataframe的模式中进行搜索

scala、dataframe、pyspark、schema

浏览 11提问于2019-10-11得票数 1

回答已采纳

1回答

为数据帧中的每个客户编号创建字典

python、python-2.7、dictionary、dataframe

我有以下客户互动的数据 customer interacted c1 i1 c1 i2 c1 i1 c2 i3 c2 i1 我希望将此数据帧转换为另一个数据帧，其中一列是客户，第二列是存储交互历史的字典。第二个df应该如下所示 customer interhist c1 {'i1': 2, 'i2': 1} c2 {'i3':1, 'i1':1}

浏览 0提问于2016-02-16得票数 0

1回答

csv对具有大量列的数据帧动态生成rdd

apache-spark、pyspark、spark-dataframe、rdd

我有一个现有的rdd，它由一个包含多个(20k+)逗号分隔值的文本列组成。我如何将它转换成一个数据帧，而不按字面顺序指定每一列？ # split into columns split_rdd = input_rdd.map(lambda l: l.split(",")) # convert to Row types rows_rdd = split_rdd.map(lambda p: Row( field_1=p[0], field_2=p[1], field_3 = float(p[2]), field_4 = float(p[3]) )) df

浏览 1提问于2018-03-29得票数 0

回答已采纳

3回答

是否有regex模式可以根据python中的不同匹配来更改不同的值？

python、pandas、dataframe、replace

我在数据帧列名= ' name‘中附加了一个列，它是一个由几个不同的列串联组成的字符串。现在，我想用某些值替换某些字符。让我们说 & ->和< ->小于 ->大于‘->这是撇号“->这是双引号现在，我如何有效地将这个正则表达式应用于整个专栏。此外，我可以把它放在某些功能中，因为我还需要在其他4列中应用相同的功能。我试过这个 df = pd.DataFrame({'A': ['bat<', 'foo>', 'bait&'],

浏览 12提问于2022-11-25得票数 0

回答已采纳

2回答

如何用字典列表键替换dataframe列值？

python、pandas、dictionary、replace、mapping

假设我有一本字典： dic = {'1' : ['A', 'B', 'C'], '2' : ['D', 'E'] , '3' : ['F']} 和数据帧 df = pd.DataFrame() df["ID"] = pd.Series(["A","B","C","D","E","F"]) df["Colour"] = pd

浏览 10提问于2022-09-15得票数 0

回答已采纳

1回答

标签编码器- Inverse_transform函数的用法

python、pandas、scikit-learn、label-encoding

我正在尝试弄清楚如何使用LabelEncoder()中的inverse_transform函数。例如，在下面的代码中， from sklearn.preprocessing import LabelEncoder le = LabelEncoder() df['Label'] = le.fit_transform(df[['Actual']] 如果我想反转，我可以简单地调用： le.inverse_transform(df['Label']) 但是，我需要将相同的转换/逆应用到新的数据集，这可能是从上面的模型中预测到的。也就是说，它是在一个新的笔

浏览 11提问于2021-06-08得票数 0

1回答

如何将名为Key的列添加到多个数据帧的字典中

python、pandas、dataframe、dictionary

给定一个包含多个数据帧的字典。如何向每个数据帧中添加一列，其中该df中的所有行都填充了键名称‘？ ? 我试过这段代码： for key, df in sheet_to_df_map.items(): df['sheet_name'] = key 这段代码确实在字典内的每个数据帧中添加了键列，但也创建了一个额外的数据帧。 ? 不能在不创建额外数据帧的情况下完成此操作吗？此外，我希望通过列数将数据帧从字典中分离出来。连接了10列的所有数据帧，连接了9列的数据帧，依此类推。我不知道该怎么做。

浏览 9提问于2021-09-09得票数 0

1回答

字典追加-多列

python-3.x、pandas、dictionary

在使用df.from_dict更有效地将所有数据转换为数据帧之前，我正在尝试首先将数据帧构建为字典。我已经设置了一个具有正确结构的空字典，使用： d =df.head(0).to_dict() 看起来我可以像这样添加到“第一行”：d‘’UserID‘=1 d’‘EstProb’=1等等。这给出了dict输出： {'EstProb': 1, 'PlayCount': 1, 'PlayDate': 1, 'Timeslot': 1, 'UserID': 1} 但我如何超越这一行，继续向字典中添加更多行呢？

浏览 0提问于2017-06-26得票数 0

1回答

解压dataframe python中的字典值

python、pandas

? 我有这个数据帧，我需要从adresactiviteit列中提取act1omschr，但是它是一个带有列表和dict的对象，我不知道如何提取这些值。有人能帮帮我吗？

浏览 11提问于2020-06-17得票数 0

1回答

Pandas:对列类别中的每一行进行排序/百分位数

python、sorting、pandas、dataframe、percentile

我想知道是否有一个雄辩的方法来对Pandas数据帧中的列进行排序(计算百分位数)，条件如下：在每个类别中进行百分位数计算。每一列将属于一个类别，并在每个类别中进行百分位数计算(请参阅图形描述的链接)。我了解到，我可以执行以下操作，而忽略类别： TargetRanking = StartingData.rank(axis="columns", pct=True) 但我需要按每列的类别对每行进行分组。请参阅以下链接中的图形描述。

浏览 56提问于2017-03-10得票数 1

回答已采纳

1回答

向在for循环中创建的全局变量添加列

python、pandas、loops、for-loop、global

我在一个循环中从一个大的数据帧中创建了子数据帧，并且我一直在尝试在循环中的那些子数据帧上创建一个列： Partidas=data2['Partida'].unique() Partida2=[w.replace(' ','_') for w in Partidas] for i, j in zip(Partidas,Partida2): globals()['%s' % j]=data2.loc[data2['Partida']==i] for k in globals().items() [&#

浏览 1提问于2018-06-01得票数 0

1回答

如何对一个组逐列执行聚合选项，并给出两个列输出

python、pandas

我正在按组数据帧执行一组汇总统计数据。对于一个特别的列，ios_id，我想要一个计数和一个不同的计数。我不知道如何将这个输出到两个具有不同名称的分离列。到目前为止，不同的计数刚刚覆盖计数。如何将ios_id列的不同计数和计数输出到两个单独的列？ df_new = df.groupby('video_id').agg({"ios_id": np.count_nonzero, "ios_id": pd.Series.nunique,

浏览 0提问于2015-05-30得票数 2

回答已采纳

2回答

熊猫在字典中找到并返回键- python的值

python、python-2.7、dictionary

在我的熊猫数据帧列中，我需要检查该列在字典值中是否有任何单词，然后我应该返回键。 my_dict = {'woodhill': ["woodhill"],'woodcocks': ["woodcocks"], 'whangateau' : ["whangateau","whangate"],'whangaripo' : ["whangaripo","whangari","whangar"],

浏览 1提问于2017-07-20得票数 2

回答已采纳

2回答

从JSON加载数据时出现DataFrame构造函数错误

pandas

从JSON加载数据时出现DataFrame构造函数错误当通过df = pd.DataFrame(data)将JSON数据加载到dataframe中时，我得到了以下错误未正确调用DataFrame构造函数！ /usr/local/lib/python2.7/site-packages/pandas/core/frame.pyc in __init__(self, data, index, columns, dtype, copy) 284 copy=False) 285

浏览 3提问于2015-03-24得票数 1

1回答

当嵌套级别未知且逐行更改时，建议/指导如何取消数据嵌套？

r、dataframe、nested、tidyr、unnest

我正在使用Etsy的API中的数据进行一个项目。具体来说，我看的是Etsy的分类。dataframe中的每一行表示一个类别节点，其嵌套数据帧包含其所有子节点。我不确定每个类别中有多少个子类别，每个类别的子类别级别也不同。每个嵌套的dataframe都有与其嵌套的dataframe相同的列。如果节点没有子节点，则将空列表存储在子变量中。有人对我如何解锁这些数据有任何建议吗？我尝试使用嵌套的for循环和tidyr的unnest()，但这是为每个嵌套的dataframe添加了新的列。要明确的是，我要寻找的输出与嵌套的dataframe具有完全相同的列，但是所有的类别都存储在其末尾的内部数据框架中。

浏览 2提问于2022-03-18得票数 1

1回答

想要从熊猫的数据框架中创建python函数

python、pandas

我有一个有各种列的数据框架，其中之一是sex，它有3种不同的值类型： malefemaleNaN 另一种是employment类型： employedunemployed 如何创建一个函数，它接受两个字符串(表示感兴趣的列名)，例如函数(sex，employment)，并说我希望在数据帧中赋值，其sex列值为男性= 1，女性= 2，NaN/other =5f，employment，employed = 10，employment=5-然后函数返回上述两个值的总和？例如函数(“男性”，“受雇者”) output = 11

浏览 3提问于2021-12-11得票数 0

1回答

在Pandas中将数据帧细分为多个数据帧

python、list、pandas、dataframe

我有一个Pandas数据框架，它有51034行和10列。我想根据包含要切片的行的列表将这个数据帧分割成158个较小的数据帧。如何将熊猫数据帧分割成更小的数据帧？例如，如果我有一个10行4列的数据框架： A B C D 0 1 2 3 4 1 5 6 7 8 2 9 10 11 12 3 13 14 15 16 4 17 18 19 20 5 21 22 23 24 6 25 26 27 28 7 29

浏览 2提问于2015-05-13得票数 2

回答已采纳

1回答

基于三列匹配值的多个数据帧合并为单个数据帧

python、pandas、numpy、dataframe

我有多个数据帧(25个数据帧)，我正在从所有数据帧的三列中寻找重复出现的行值。下面是我的daframe示例 df1 chr start end name 1 12334 12334 AAA 1 2342 2342 SAP 2 3456 3456 SOS 3 4537 4537 ABR df2 chr start end name 1 12334 12334 DSF 1 3421 3421 KSF 2 7689 7689 LUF df3 chr start end

浏览 9提问于2016-09-23得票数 1

回答已采纳

1回答

Pandas:如何处理将类别转换为数字时的NaN值

python、pandas、nan

浏览 0提问于2017-07-09得票数 0

回答已采纳

2回答

基于模式的新目标列

python、pandas

数据帧： source target jan feb mar apr jun feb aug apr jul oct dec aug

浏览 14提问于2020-04-17得票数 1

回答已采纳

2回答

匹配和重命名数据帧上的列

python、pandas、dataframe

我有两个数据帧： df1： ID Drive Volume Rep 1 2 3 4 df2： ID 2Volume Drive_1 Reps 1 2 3 4 我使用下表匹配列名 df1 df2 Drive Drive_1 Volume 2Volume Reps Reps 使用表中的映射，如何将df2中的所有列重命名为与df1相同我可以使用一个简单的df2 = df2.rename(columns={old:new})手动完成此操作。但是我想要通用的代码，可以使用不同的列名。

浏览 13提问于2021-05-04得票数 1

回答已采纳

1回答

将Pandas数据帧的行映射到numpy数组

python、arrays、pandas、numpy

对不起，我知道有这么多关于索引的问题，这可能是我的问题，但我在这方面有点小麻烦。我对.loc、.iloc和.index方法以及切片非常熟悉。.reset_index方法可能没有(也可能不能)在我们的数据帧上被调用，因此索引标签可能不是有序的。dataframe和numpy数组实际上是dataframe的不同长度子集，但对于本例，我将使它们保持相同的大小(一旦有了示例，我就可以处理偏移量)。这是一张我正在寻找的图片：我可以根据一些搜索条件从数据框中拉出多个行。 idxlbls = df.index[df['timestamp'] == dt] stuff = df.lo

浏览 16提问于2018-07-23得票数 1

回答已采纳

2回答

将数据框行替换为列值上另一个数据框中相同的行

python、pandas

我有一个数据帧data，在其中我使用了它的一个子集g2_data来执行一些操作。如何将原始数据帧中的值替换为子集的值，并使用其中一列中的值作为引用？ data中的列结构保留在如下所示的子集g2_data中。 data: idx group x1 y1 0 27 1 0.0 0.0 1 28 1 0.0 0.0 2 29 1 0.0 0.0 3 73 1 0.0 0.0 4 74 1 0.0 0.0 ...

浏览 20提问于2021-10-15得票数 0

回答已采纳

1回答

我可以使用df1中的一个列和df2中的一个单元格中的一个值连接两个数据帧吗？

python、pandas、join

我正在处理一些地理空间数据，df_geo，我有一个CSV值，我想加入到位置数据框架，称为df_data。但是，我的问题是，在我想要加入两个数据帧(区域名称)的列中，有多种方法来拼写值。看看下面df_geo中的加泰罗尼亚示例:根据语言的不同，6有不同的拼写区域名称的方法。我的问题是:如果行在df_data中被命名为"Catalonia“，我将如何加入df_data到df_geo

浏览 1提问于2018-09-21得票数 0

回答已采纳

1回答

基于列值的访问行

pandas

我有以下熊猫数据框架： data = {'ID': [1, 2, 3], 'Neighbor': [3, 1, 2], 'x': [5, 6, 7]} 现在我想创建一个新的列'y'，每一行都是字段x的值，从邻居列引用的那一行(即该列，其ID等于neighbor的值)，例如:对于行0 (ID 1)，'Neighbor‘是3，因此'y’应该是7。所以产生的数据帧应该有列y= 7，5，6。我可以不使用df.apply来解决这个问题吗？(因为这对于我的大数据帧来说相当耗时。)我想用像这样的东西 df.loc[:,

浏览 7提问于2019-10-07得票数 1

回答已采纳

1回答

从数据帧中类似字典的列中提取数据

python、python-3.x、pandas、jupyter-notebook

我在一个数据框中有一个列info，它的数据格式类似于下面的dict。我想获得另一个包含此信息的数据帧，并尝试： feature = [d.get('Feature') for d in df['info']] 但它返回none。我该怎么做呢？我真的很难做到这一点。

浏览 12提问于2021-06-28得票数 0

回答已采纳

1回答

作为嵌套json的pandas数据帧

python、json、pandas

我有一个脚本，它将嵌套的JSON作为pandas数据帧读取，并向其中添加一个新列，然后将其保存为JSON。 import numpy as np from pandas.io.json import json_normalize sample_json = { "name": { "emails": [{"address": "clark.kent@example.com"}], "countries": [{"country": "US"

浏览 18提问于2019-06-06得票数 1

1回答

Networkx:从Pandas DataFrame中的距离矩阵绘制网络

python、pandas、dataframe、networkx

我有一个余弦距离矩阵作为熊猫数据帧。如果我将其转换为numpy矩阵并执行以下操作，则可以将其可视化为网络： DistMatrix = cosine1 G = G=nx.from_numpy_matrix(DistMatrix) nx.draw(G , with_labels=True) plt.show() 问题是我丢失了节点的标签。然而，这些标签是在熊猫数据框中的。作为距离矩阵，列标签当然与索引标签相同，并且矩阵的对角线具有为0的条目(它们完全相同)。我如何从我的pandas数据框中绘制网络，并包括标签以正确标记节点？ DistMatrix = pd.DataFrame( data =

浏览 3提问于2017-10-12得票数 1

1回答

访问Python子列表以导入pandas DataFrame

python、pandas

我正在尝试将中的梦幻篮球数据导入到pandas数据框中，但我遇到了嵌套内容的问题。来自yql (results.rows)的数据如下所示(当我使用类型(results.rows)时，我得到列表)。 {u'display_position': u'PF', u'editorial_player_key': u'nba.p.4175', u'editorial_team_abbr': u'Uta', u'editorial_team_full_name': u'Utah Jaz

浏览 0提问于2012-10-28得票数 4

回答已采纳

2回答

切分关键字以成为python中的新类别列

python、pandas

data = pd.Series(['ABC Company, UK', 'CDE Company, US', 'CN DEF Company']) data 输出 0 ABC Company, UK 1 CDE Company, US 2 CN DEF Company dtype: object 如何添加另一列，使其成为此列中从英国转换为英国、美国转换为美国、中国转换为中国的名为“Region”的数据帧？我猜是不是要用字典函数来实现呢？

浏览 12提问于2018-08-08得票数 0

回答已采纳

4回答

如何重命名嵌套df的列

r、purrr、data-wrangling

我有一个数据帧列表，每个列都有两个名为"place“和" data”的列。"place“是一个字符，" data”是一个嵌套的数据框架，其中有一个名为"value“的数字列。对于列表中的每个数据帧，我想用"place“列的值来重命名嵌套数据框架的" value”列。 library(tidyverse) some_dt = tibble(place = c("a","a", "b","b","c","c"),

浏览 5提问于2021-12-20得票数 1

1回答

如何在pandas中添加从另一个dataframe获取的值的列

python、pandas、dataframe

我有两个数据帧，df1和df2。df1有两列'Name‘和'K’。df2有3列'A'，'B'，'C‘ 列B的值与df1 'Name‘的值相同。但现在我需要添加列K。所以我试着 for t in range(len(df1)): whichvalue=t a=df1.iloc[whichvalue,:] Name=a['Name'] knownetf=df2['B'].value_counts()[Name] etfs

浏览 6提问于2018-03-06得票数 0

回答已采纳

1回答

如何确定pandas数据帧中列的顺序？

python、python-3.x、pandas、dataframe

您好，我有一个数据帧，我必须在其中固定列的顺序。我有一个列表，其中定义了列名的前缀。我已经根据那张单子找到了修复方法。示例： df列:- nOffered_count, nOffered_sum, nTransferred_count, nTransferred_sum, tacd_count, tacd_sum, tacw_count, tacw_sum, tHeld_count, tHeld_sum 我有一份清单- list = ['nOffered', 'tacw', 'tacd', 'nTransferred', &#

浏览 23提问于2021-10-25得票数 0

回答已采纳

3回答

在Python for循环中重命名dataframe

python、pandas、dataframe

我尝试在for循环的每次迭代中重命名一个数据帧。对于"data“dataframe中的"item”列，我想生成最多为"item“列中的唯一项数量的数据帧。 for item in data.item.unique(): data+"item" = data[data["item"] == item]

浏览 212提问于2020-02-20得票数 0

2回答

Pandas将数据框列中的列表与另一个数据框合并

python、pandas、dataframe

我有两个数据帧： ID LIST_VALUES 1 [a,b,c] 2 [a,n,t] 3 [x] 4 [h,h] VALUE MAPPING a alpha b bravo c charlie n november h hotel t tango x xray 我需要向第一个数据帧添加一个新列，该列根据LIST_VALUES列表中的内容显示第二个数据帧中的值。如果某个值在LIST_VALUES中重复，则只在输出

浏览 26提问于2020-03-19得票数 0

1回答

如何根据字典(或另一个数据帧)填充数据帧的列？

python、pandas、dictionary

我有一个字典和一个数据框架： dic = {"A":1,"B":2,"C":3,"D":4} key 0 A 1 C 2 D 3 B 4 A 5 C 6 C 如何使用字典填充数据帧，以生成新的数据帧，如下所示： key value 0 A 1 1 C 3 2 D 4 3 B 2 4 A 1 5 C 3 6 C 3 我考虑过使用apply(lambda)函数，但没有成功。谢谢!

浏览 0提问于2020-04-25得票数 0

1回答

根据列值添加行

python、pandas、list、dataframe、validation

数据帧 l=['apple', 'banana'] 从另一个数据帧列中提取，我从列水果中提取列的唯一值。fruits.unique()，其结果是数组()获取项目列表，只需遍历索引值并将其存储在列表中循环列表，以检查列表中的值是否显示在数据帧的列中。如果存在，则为匹配列标题的值添加1，否则为匹配的值添加0。在上述情况下，匹配后的数据框架应该如下所示： 234 apple banana orange 0 1 1 0

浏览 6提问于2022-03-04得票数 0

3回答

业余时间: Python字典结构化

python、pandas、dictionary

我仍处于学习编程和Python的初级阶段，但我正在为如何最好地使用字典或是否应该使用字典而苦苦挣扎。目前，我希望有一个这样的“表”格式： user attr loc ---- ---- ---- 1 red,green here 2 blue there 3 yellow here, there ... ... ... n black nowhere 对于我正在尝试做的事情，我希望能够调用'us

浏览 0提问于2017-09-23得票数 0

2回答

Python:更改pd.DataFrame中的值

python、pandas

我有一个pandas数据帧，其中一列包含分类数据，我希望将其更改为数字 le=LabelEncoder() for col in p3data.columns.values: if p3data[col].dtypes=='object': p3data[col]=le.fit_transform(p3data[col]) 当我在pandas dataframe中的一列上使用此代码时，它会更改值非常低=4 低=1 Medium =2 高=0 非常高=3 然而，这是不符合顺序的，我如何手动更改它们以使其符合顺序(即非常低=0 低=1 Medium =

浏览 65提问于2021-01-20得票数 0

1回答

将3级嵌套字典键值转换为pyspark dataframe

dataframe、apache-spark、pyspark、partition

我有一个Pyspark数据框架，看起来像这样： ? 我想提取"dic“列中的那些嵌套字典，并将它们转换为PySpark数据帧。如下所示： ? 另外，每一行中的键也会有一些变化，例如，一些行可能有其他行没有的字段。我希望包括所有字段，如果一条记录没有某些字段/keys，则该值可以显示为"null“。请告诉我如何才能做到这一点。谢谢!

浏览 22提问于2020-07-22得票数 0

1回答

使用字典映射python中的特定值

python、pandas

我正在迭代一个数据帧，提取出特定的行，然后用一些其他元素丰富这些行。我有一个字典，它有以下定义映射： testdir = {0: 'zero', 40: 'forty', 60: 'sixty', 80: 'eighty'} 当我从原始数据帧中提取出特定行时，如下所示 a b c x str 0 0 0 0 100.0 aaaa 我希望str单元格现在设置为c列的字符串值，它是0，因此输出应为 a b c x str 0 0 0 0 100.0 zero 然

浏览 1提问于2020-06-15得票数 2

1回答

解析python pandas dataframe中字典列中的多个列

python、pandas、dictionary、dataframe

我有一个由两列组成的pandas数据框架。一列是ID，另一列是100+键和值的嵌套字典。我试图将字典列解析为多个列(每个键对应一个列)，但我无法弄清楚。我能够做的是手动指定每个列的名称，并使用apply函数从字典中提取值： def get_col(row): d = ast.literal_eval(row["dictionary_col"]) js = json.dumps(d["key1"]) return js df["key1"]=df.apply(lambda row: get_col(row),axis

浏览 1提问于2016-11-15得票数 0

3回答

遍历python中的列，并根据条件插入列名

python、python-3.x、pandas

我有一个数据帧，它被划分为数字和列表的范围，与这些范围相对应。我想遍历每一列，并获得最大值，然后根据范围将列的标题放在正确的列表中。我拥有的列表和数据帧是： range A B C 0 0-300 20 0 427 1 300-500 66 16 341 2 500-800

浏览 5提问于2018-08-30得票数 0

回答已采纳

3回答

Pandas - pd.merge，添加检查以确保列不存在？

python、pandas、dataframe

我有两个数据帧，一个是我使用的主要数据帧，另一个是我想要从中获取信息的辅助数据帧。 df1 (main)包含一个具有各种名称字符串的报表程序列。 df2 (附加信息)包含报告器名称及其位置。我希望将location列作为新列添加到df1中。我可以通过以下方式一次性完成以下操作： df1 = pd.merge(df1, df2, on='Reporter', how='left') 和它的工作。我的问题是，我经常运行一个更新脚本(检查新行和旧行的更新)，重复运行这行代码会为每次执行添加多个列。检查列是否存在的麻烦在于，可能已经向df中添加了一个我确实想知道

浏览 52提问于2018-06-05得票数 2

回答已采纳

3回答