在pandas中如何将数据帧转换为以行和列为键的字典？

在Pandas中，可以使用to_dict()方法将数据帧（DataFrame）转换为以行和列为键的字典。具体来说，可以通过设置to_dict()方法的参数来控制字典的结构。

以下是一些常见的转换方式：

1. `orient='records'`

将每一行转换为一个字典，字典的键为列名，值为对应行的值。

import pandas as pd

# 创建一个示例数据帧
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
})

# 转换为以行为键的字典
result = df.to_dict(orient='records')
print(result)

输出：

[{'A': 1, 'B': 4, 'C': 7}, {'A': 2, 'B': 5, 'C': 8}, {'A': 3, 'B': 6, 'C': 9}]

2. `orient='index'`

将每一列转换为一个字典，字典的键为行索引，值为对应行的值。

# 转换为以列为键的字典
result = df.to_dict(orient='index')
print(result)

输出：

{0: {'A': 1, 'B': 4, 'C': 7}, 1: {'A': 2, 'B': 5, 'C': 8}, 2: {'A': 3, 'B': 6, 'C': 9}}

3. `orient='columns'`

将每一列转换为一个字典，字典的键为列名，值为对应列的值。

# 转换为以列为键的字典
result = df.to_dict(orient='columns')
print(result)

输出：

{'A': {0: 1, 1: 2, 2: 3}, 'B': {0: 4, 1: 5, 2: 6}, 'C': {0: 7, 1: 8, 2: 9}}

4. `orient='split'`

将数据帧转换为一个包含四个元素的字典：索引、列名、数据值和列的数据类型。

# 转换为以split为键的字典
result = df.to_dict(orient='split')
print(result)

输出：

{'index': [0, 1, 2], 'columns': ['A', 'B', 'C'], 'data': [[1, 4, 7], [2, 5, 8], [3, 6, 9]], 'dtype': {'A': 'int64', 'B': 'int64', 'C': 'int64'}}

应用场景

数据导出：将数据帧转换为字典后，可以方便地将其导出为JSON或其他格式。
数据处理：在某些情况下，字典结构可能更适合某些数据处理任务。
API响应：在Web开发中，将数据帧转换为字典可以方便地作为API的响应。

参考链接

Pandas to_dict() 方法文档

通过这些方法，你可以根据具体需求将数据帧转换为不同结构的字典。

pandas数据帧行使用sklearn进行缩放

、、、

如何将sklearn缩放器应用于pandas数据帧的所有行。这个问题与相关。如何将sklearn缩放器应用于一行的所有值？注意:我知道对于特性缩放来说，在列中包含特性和按列缩放特性是很正常的，就像refenced问题中那样。然而，我想使用sklearn标度器来预处理可视化数据，在我的例子中，按行扩展是合理的。

浏览 11提问于2019-11-13得票数 1

回答已采纳

1回答

我需要将第一行转换为字典，然后删除所有"nan“值。这行得通..。 pd.Series(df.head(1).T.to_dict()[0]).dropna() 或。这一个..。 df.head(1).dropna(axis=1).T.to_dict()[0] 但是，有没有其他方法可以实现这一点呢？数据帧的类型是稀疏的，如果这很重要的话。 type(df) pandas.core.sparse.frame.SparseDataFrame 我之所以这样问，是因为我不认为它是pythonic式的，我想肯定有一种方法可以做到这一点。

浏览 7提问于2019-08-24得票数 0

回答已采纳

1回答

Pandas:根据一列的值打印另一列的值

、

给定一个数据帧： Animal wings claws horns 0 Ant No No No 1 Bat Yes Yes No 2 Cat No Yes No 我正在尝试打印'Animal‘列的相应值，其中给定列的值是'Yes’。 Eg1:给定列为“claws”，输出应为Bat和Cat。 Eg2:给定列为“wings”，输出应为Bat

浏览 27提问于2020-02-07得票数 1

回答已采纳

2回答

pandas:从字典创建数据帧

、

拿字典来说： dict = {'a':'ham', 'b': 'ham', 'c': 'chicken', 'd': 'beef', 'e': 'chicken'} 如何获取此字典并将其转换为以列为值的数据帧？例如，我想要一个数据帧来显示： ham chicken beef 0 a c d 1 b e 看起来根本不能从这个表单中得到它！谢谢这是一个不同的问题，另一

浏览 2提问于2017-02-15得票数 2

1回答

根据某些条件，我必须更新数据帧

、、

我刚接触pandas，我正在尝试更新基于'Id'列的'Text‘列。我的数据是这样的[(1,'One'), (0, 'Zero'), (4,'Four'), (3, 'Three')]我在数据中也有一些丢失的id，对于那些丢失的id，我必须将其留空原始数据帧 Id A Text 0 0 NaN 1 1 NaN 2 2 NaN 3 3 NaN 4 4 NaN 最终数据帧 Id A Text 0 0 Zer

浏览 9提问于2020-05-11得票数 1

回答已采纳

2回答

从单个pyspark dataframe返回多列

、、、、

我正在尝试解析单个列的columns.My数据帧，并获取具有多个pyspark数据帧的数据帧，如下所示： a b dic 0 1 2 {'d': 1, 'e': 2} 1 3 4 {'d': 7, 'e': 0} 2 5 6 {'d': 5, 'e': 4} 我想要解析dic列并获得数据帧，如下所示。如果可能的话，我期待着使用pandas UDF。我的预期输出如下： a b c d 0 1 2 1 2 1 3 4 7

浏览 40提问于2020-03-01得票数 0

回答已采纳

2回答

如何在数据框中存储字典列表中的特定键值

、、、、

我一直在尝试将特定键的值存储到pandas数据帧中，该数据帧来自具有字典列表的另一个数据帧。有人能教我怎么做吗？？ source data frame result data frame

浏览 11提问于2021-02-08得票数 0

1回答

从多个数据字典中提取数据

、、

我有一本字典，里面包含大量的数据帧。我想从它中提取所有数据帧，并将这些值存储到一个数据帧中。字典如下：存储在字典中的许多数据文件之一如下所示：我尝试过使用'pd.DataFrame.from_dict'方法，如下所示： wwwwww = pd.DataFrame.from_dict(res, orient='index') 但提交给我的输出被混淆或被废弃，如下所示：因此，我做了进一步的搜索，找到了使用熊猫将字典转换成数据的最简单的方法，并使用了如下所示： data2 = pd.DataFrame(res, index =[0]

浏览 4提问于2020-12-11得票数 0

回答已采纳

3回答

如何将python字典转换为所需的格式

、、、

我有以下字典，它是在对熊猫数据帧应用to_dict()方法时获得的。 { 'name' : { 0: 'abc', 1: 'xyz' }, 'email': { 0: 'abc@abc.com', 1: 'xyz@xyz.com', }, 'category': { 0: 'category 1', 1: 'category 2', } } 如何将其

浏览 19提问于2018-07-17得票数 2

回答已采纳

1回答

将每个Pandas Dataframe行绘制为单独的绘图

、、、

我在CSV文件中存储了几行数据。我想遍历每一行，并将每一行绘制为单独的图。经过一些研究，看起来熊猫是解决这个问题的方法。这是给Jupyter Notebook的。我尝试过直接读取CSV文件，但发现pandas更易于使用。但是，我只从数据帧中提取y值。我已经用我的x值定义了一个单独的numpy数组。例如，我有： x_values = np.array([1, 2, 3, 4, 5, 6, 7, 8]) my_data = pd.read_csv('example_data.csv') 在我的数据中，我将第一列列为“位置”，范围从1英里到20英里。在那之后，我有8列填充值

浏览 0提问于2019-05-12得票数 1

2回答

将Python数据帧转换为带索引的字典

、、

我正在尝试将dataframe转换为字典(因为它们在过滤key时速度更快)，我目前正在使用 t3 = time() r={} for i in df.index.unique(): r[i]=[] r[i].append(df.loc[i].values) print(round((time()-t3), 1), "s") 这种类型的转换速度很慢。有没有别的选择呢？我希望数据帧的索引作为键，行作为在单个键上具有多个值的值

浏览 19提问于2020-08-22得票数 0

回答已采纳

3回答

将JSON文件转换为Pandas数据帧

、

我有一个json文件，我将其转换为dict，如下所示： {'DATA': [{'COMPANY_SCHEMA': 'ABC', 'CONFIG_TYPE': 'rtype', 'IM_ID': '44f8d1b4_437e', 'MODIFIED_DATE': 'Unknown', 'ID': 'Test', 'CONFIG_KEY': 'posting_f', 'SYSTEM_N

浏览 9提问于2018-05-08得票数 0

2回答

为什么熊猫的NaN数据不能作为字典密钥使用？

、、、

我试图在下面的数据帧中使用values列的元素作为字典中的键。 In [1]: import numpy as np ...: import pandas as pd ...: rng = pd.date_range('2021-06-01', periods=4) ...: values = [1, -1, 0, np.nan] ...: df = pd.DataFrame(values, index=rng, columns=['values']) In [2]: df Out[2]: values 2021

浏览 1提问于2021-06-07得票数 2

回答已采纳

3回答

Pandas -更改因子类型对象的级别顺序

、

我有一个以school列为因子的Pandas数据帧df Name school A An B Bn C Bn 如何在python中将school列的级别从('An'，'Bn')更改为('Bn'，'An')？ R等价物是 levels(df$school) = c('Bn','An')

浏览 4提问于2016-06-25得票数 15

2回答

如何将Python Dataframe转换为列表列表？

、、

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

2回答

如何在Python中将JSON行数据拆分成多列

、、、

我正在尝试找到一种在pandas中将JSON行数据拆分(扁平化)为多列的方法。我有一个数据帧，如下所示： Current Dataframe 以下是行的外观示例： Row example 我能够在单行上使用json_normalize函数来实现以下目标：(仅作为示例进行了简化) Code Example Table 但是，当尝试对整个dataframe应用规范化函数时，我得到'str‘对象没有'values’属性。对于如何做到这一点，有什么建议吗？谢谢我为使用图片道歉，但我一直收到一条消息，说代码格式不正确

浏览 161提问于2021-08-20得票数 2

1回答

使用Pandas读取用HDF5创建的h5py文件

、、、

我有一堆hdf5文件，我想把其中的一些数据转换成拼花文件。不过，我很难把它们读成熊猫/皮亚罗。我认为这与最初创建文件的方式有关。如果我使用h5py打开文件，数据看起来与我所期望的完全一样。 import h5py file_path = "/data/some_file.hdf5" hdf = h5py.File(file_path, "r") print(list(hdf.keys())) 给我 >>> ['foo', 'bar', 'baz'] 在这种情况下，我感兴趣的组“酒吧”，其中有3

浏览 75提问于2022-03-07得票数 1

1回答

如何在迭代和追加列表时求解ValueError

、、、、

ValueError:传递了2列，传递的数据有4列： import pandas as pd def customedata(): colnum = input("How many columns do you need? ") colnum = int(colnum) rownum = input("How many rows do you need? ") # user input column and row rownum = int(rownum) colName = [] rowName

浏览 16提问于2020-06-18得票数 0

回答已采纳

1回答

如何访问数据帧中的字典列表中的值？

、、、

我有一个dataframe，它有一个包含字典列表的列，对于每个字典，我希望能够提取这些值并将它们作为列表放在另一个列中。请看下面的图片，它只显示了数据帧的1行。因此，对于图片上显示的每个标题，我希望提取值并将它们放入数据帧中所有行的列表中 ?

浏览 15提问于2021-10-12得票数 1

回答已采纳

2回答

将列转换为pandas.datetime或时间序列

、、

我有一个数据帧，看起来像这样，但有多条记录： ID Date 1 {'day': 20, 'year': 2018, 'month':9} 我正在尝试将Date列中的所有内容都更改为pandas timeseries格式。我试图通过执行以下操作来遍历数据并更改每个条目，但我得到了一个错误，指出格式不匹配。 for index, rows in iterrows: x = row['Date'] pd.to_datetime(pd.Series(x), format = 'day

浏览 0提问于2018-09-21得票数 1

2回答

将在值中包含列表的dict转换为Pandas dataframe

、、

我有一个具有以下键和值的字典 my_dict={'1':{'name':'one', 'f_10':[1,10,20,30], 'f_20':[1,20,40,60]}, '2':{'name':'two', 'f_10':[2,12,22,32], 'f_20':[2,22,42,62]}} 如何将其转换为P

浏览 10提问于2022-09-19得票数 1

回答已采纳

1回答

如何使用Python比较太大而无法放入内存的数据帧？

、、、

我有可能很大的数据帧，大约有10列和1e6行，具有不同的维度。假设行在两个数据帧中都是唯一的。由于这些数据帧不能加载到内存中，我如何找到一个数据帧中存在于另一个数据帧中的所有行？我目前只处理较小的数据帧，但我很快就会弄清楚这一点。我非常喜欢使用pandas，但我愿意使用不同的包(xarray?)如果有显著的好处。如果您推荐一个不同的包，请提供一些代码来进行比较。下面是我如何与内存中适合的pandas数据帧进行比较： import pandas as pd def row_intersection(df1, df2): noNA = df2.fillna(0) retur

浏览 23提问于2021-09-02得票数 0

回答已采纳

1回答

在熊猫的每一行上运行一个函数，并返回字典

、、

我有许多函数，每个函数都返回字典，我想在Pandas DataFrame的每一行上运行这些函数。例如 def calc_a(input): # do calculations return {"x": valuex, "y": valuey, "z": valuez} 显然，我忽略了所有的计算代码，因为它是不相关的。我想我可能可以使用pandas.DataFrame.apply，但我不知道如何将函数返回的字典x、y和z的每个键都指向不同的列。

浏览 4提问于2016-01-27得票数 0

回答已采纳

1回答

缺少json文件Python中的特性/组

、、

我正在尝试从中提取韩国每个城市的英文和韩语名称，这是我的Python代码。 import json import pandas as pd Korean_municipalities = json.load(open('skorea-municipalities-2018-geo.json', 'r')) munic_map_eng = {} for feature in Korean_municipalities['features']: feature['id'] = feature['prope

浏览 6提问于2022-06-10得票数 0

回答已采纳

1回答

indexerror:使用iloc的索引越界

、

每当我在mysql中使用pandas sql进行查询时，如果结果只有一行，我就无法从中选择值。我的命令是： result = psql.read_frame("select id,name,age from tb1 where id=1", con=conn) 然后，它返回一个数据帧。然而，我希望能够做到： age = result['age'] 但这是不可能的，因为它是一个数据帧。(它创建了行的索引，所以这里是0)，所以当我这样做时，我想让它成为一个序列或字典： result = result.iloc[0] 我得到了 {'id': 1,

浏览 1提问于2015-05-21得票数 0

2回答

在Python中将2列的数据帧转换为一系列2列

、

我正在尝试处理一些时间序列数据，并且对pandas dataframe还是个新手。我有一个包含两列的数据帧，如下所示： +---+-----------------------+-------+--+ | | 0 | 1 | | +---+-----------------------+-------+--+ | 1 | 2018-08-02 23:00:00 | 456.8 | | | 2 | 2018-08-02 23:01:00 | 457.9 | | +---+-----------------------+------

浏览 0提问于2018-08-16得票数 0

3回答

Python pandas数据帧拆分

、、

我有这样一种dataFrame，我想将其拆分成独立的数据帧： A B C Mark 3 5 6 T 4 5 2 T 3 4 5 B 5 6 7 B 3 4 5 T 2 5 2 T 例如，上面的表格应该被分成三个pandas数据帧。第一个数据帧将两行标记为"T“作为一个数据帧，第二个数据帧将下两行标记为"B”，第三个数据帧将最后两行标记为"T“。 df1 A B C Mark 3 5 6 T 4 5 2 T df2 A B C Mark 3 4 5 B 5 6 7 B df3 A B C Mark 3 4 5 T 2 5 2 T

浏览 21提问于2019-02-14得票数 2

回答已采纳

3回答

将时间序列转换为数据帧并返回

、、

时间序列的输出看起来像一个数据帧： ts(rnorm(12*5, 17, 8), start=c(1981,1), frequency = 12) Jan Feb Mar Apr May Jun Jul ... 1981 14.064085 21.664250 14.800249 -5.773095 16.477470 1.129674 16.747669 ... 1982 23.973620 17.851890 21.387944 28.451552 24.177141 25.212271 19

浏览 0提问于2011-03-17得票数 18

回答已采纳

1回答

Json序列化具有Pandas Dataframe属性的类: TypeError：'DataFrame‘类型的对象不是JSON可序列化的

、、、

嗨，我有一个带有pandas数据帧属性的类。我如何编码成json，这样pandas的dataframe属性也能被正确序列化？ class MachineObject(dict): def __init__(self, *args, **kwargs): self._MachineName = '' self._propsDataFrame = None # Pandas dataframe 我是这样序列化的： print(json.dumps(machine_objects[0].__dict__)) 但这给了我错误： Ty

浏览 2提问于2021-04-10得票数 0

1回答

Pandas中的列操作

、

假设我有一个数据帧： import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(4,5), columns = list('abcde')) 我想从所有其他列中减去列df.a中的条目。换句话说，我想要得到一个数据帧，它包含以下列为列： col_b - col_a| col_c - col_a |col_d - col_a 我尝试过df - df.a，但这产生了一些奇怪的结果： 0 1 2 3 a b c d e 0 NaN NaN NaN NaN NaN

浏览 1提问于2013-02-19得票数 5

回答已采纳

2回答

将3d numpy数组转换为1列pandas df和2d数组

、、、

我会将3Dnumpy数组转换为由2dnumpy数组组成的具有1列的pandas数据帧。具体示例： np_array = np.zeros((10,3,5)) print(np_array.shape) # (10, 3, 5) 因此，从这个数字数组中，我想创建一个1列的数据帧，它有10行，每行都有一个形状为(3,5)的项。尝试将其按原样转换为pd.DataFrame(np_array)会抛出ValueError: Must pass 2-d input错误。谢谢!

浏览 59提问于2021-01-07得票数 1

回答已采纳

1回答

在熊猫DataFrame中迭代行并创建一个数据集

、、、

我正在尝试使用pandas DataFrame创建一个字典。 import pandas as pd df = pd.DataFrame({'name': ["p1","p1","p2","p2","p2"], 'val': [0, 1, np.nan, 1, 0] }) 我想创建一个字典，其中name列为key，val列为values。值将是一个列表。我使用的是for loop，因为DataFrame只有100行。 mydict = dict

浏览 2提问于2022-02-06得票数 0

回答已采纳

1回答

如何从pickle文件列表创建多个Pandas数据帧？

、

我想为一个pickle文件列表中的每个文件创建一个Pandas数据帧。如果我使用以下代码： dfs = [pd.read_pickle(file) for file in DATA_PROCESSED.iterdir()] 我将获得一个列表，但我还希望在文件名和数据帧名之间建立一个对应关系。在这种情况下，我将只获得dfs，例如你能帮我一下吗？

浏览 37提问于2018-08-05得票数 0

回答已采纳

1回答

2个Pandas数据帧的条件语句

、、、、

我在解决以下问题时遇到了麻烦：我在熊猫中有两个数据帧，第一个数据帧(df1)是关于我一整年来购买的水果，下一个数据帧(df2)是关于水果的定价。现在的问题在于df1中的一些水果的价格是不正确的。示例如下： df1 = pd.DataFrame({'Fruits Bought Over a Year' : ['Apple', 'Apple', 'Apple', 'Apple', 'Orange', 'Watermelon',

浏览 0提问于2020-10-14得票数 0

3回答

在循环中将字典附加到pandas数据帧

、、

我需要在循环中创建一个字典，并将它们附加到具有匹配的dict键名和数据框的列名的pandas数据框中。每次迭代中字典的键值对可以是不同的。在字典中使用所有可能的关键字在开始时定义了空的熊猫数据帧df_podcast。以下是尚未完成的代码示例 df_podcast=pd.DataFrame(columns=podcast_cols) podcast_dict={} for j in range(len(podcast[0])): if podcast[0][j].tag=="key": podcast_dict[podcast[0][j].text]=

浏览 0提问于2017-05-14得票数 9

回答已采纳

2回答

Pandas dict to dataframe -列无序？

、

我进行了搜索，但没有看到与这个特定问题有关的任何结果。我有一个Python字典，正在将我的字典转换为pandas数据帧： pandas.DataFrame(data_dict) 它可以工作，但有一个问题-我的pandas dataframe的列与我的Python字典的列的顺序不同。我不确定熊猫是如何重新排序的。如何保留排序？

浏览 2提问于2015-04-15得票数 1

1回答

将series.map与多键字典一起使用

、、、

我有一个包含3个键的Python字典，它是我使用以下代码创建的。字典非常大-大约有100,000行。 t1=list(zip(df.Col1, df.Col2,df.Col3)) d_dict= dict(list(zip(t1,df.Col4))) 我现在有了一个单独的数据帧，它也非常大，它有3列与字典键匹配。我想应用series.map(d_dict)来优化一些代码。我该怎么做呢？我目前正在使用下面的代码，它在nan上有错误，并且需要很长时间 s1 = df2.apply(lambda x: d_dict[x.Col1,x.Col2,x.Col3], axis=1) s1= df2.ma

浏览 14提问于2019-11-12得票数 1

1回答

作为dict从pandas数据帧中检索非零列

、

给定如下的数据帧 cat dog hamster dolphin cat 1 0.5 0 0.25 dog 0.5 1 0 0 hamster 0 0 1 0.5 dolphin 0.25 0 0.5 1 我想以字典格式获取给定行的大于零的列值。例如，对于仓鼠线，结果应该是： { 'h

浏览 25提问于2020-10-03得票数 5

回答已采纳

3回答

烧瓶和潘达斯:上传一个csv作为熊猫数据文件，并通过视图传递

、、

我开始构建一个允许用户上传csv的应用程序。然后，csv将作为Pandas Dataframe装载。使用该数据帧，将进行多个计算，有时会提示用户完成该过程。我成功地构建了上传过程并使用保存了文件，但是，我不知道如何将Dataframe从一个视图传递到另一个视图。我的想法是像对本地脚本那样在Dataframe上执行计算，将变量df分配给dataframe并在每个视图中引用它。用水瓶可以吗？如果没有，是否有其他方法来引用内存文件？

浏览 4提问于2013-12-09得票数 1

回答已采纳

3回答

将多个csv文件读取到单独的pandas数据帧中

、、、

我已经看到了一些关于将多个csv文件读取到单独的Pandas数据帧中的答案，但仍然遇到了麻烦。我已经将csv文件和文件名读入字典： path = os.getcwd() file_names = ['file1', 'thisisanotherfile', 'file3'] df_dict = {x: pd.read_csv('{}/{}.csv'.format(path, x)) for x in file_names} 这似乎是可行的：print(df_dict['file1']) 然而，我正在寻找的是一个名

浏览 28提问于2019-07-15得票数 1

回答已采纳

1回答

Pandas:键和值的字典列的堆叠条形图

、、、

我有一个pandas数据帧，如下所示，但是有更多的行： >>> import pandas as pd >>> data = {'First': ['First value', 'Second value'], 'Second': [{'NOUN': 13, 'VERB': 8, 'PRON': 3}, {'PROPN': 2, 'VERB': 10, 'NOUN': 11}],} >&

浏览 18提问于2020-12-15得票数 1

回答已采纳

1回答

更改马赛克图的默认颜色

、、、

我想改变这个马赛克图的颜色，使它可以用白色的黑色打印，但是找不到改变这个参数的方法。 from statsmodels.graphics.mosaicplot import mosaic import matplotlib.pyplot as plt import pandas x = ['yes', 'yes', 'yes', 'yes', 'yes', 'yes', 'yes'] y = ['yes', 'yes', 'yes&

浏览 0提问于2019-06-13得票数 1

回答已采纳

3回答

创建一个if-elif方案语句作为字典

、、、

我有下面的语句，if col1="string1" and col2="string3"然后是newcol="newstring"，如果是col1="stringX"，那么是col2="stringY"然后是newcol="newstringZ"，我该如何将其构建到字典中，以便我可以应用映射函数来使用字典来检查和插入数据帧的新列？ df = pd.DataFrame( { 'col1': ['string1', 'string1', &

浏览 0提问于2021-10-21得票数 0

1回答

从Array创建Pandas数据帧

、、、

如何创建以数组中每个条目命名的新数据框架？我有一个从Pandas数据帧列创建的数组。看上去有点像下面。 [In] company_id = df.COMPANY_IDENTIFICATION.unique() [In] company_id [OUT] array(['BBG000QFYJ26', 'BBG000C0ZQY2', 'BBG000LNZ408', ..., 'BBG000QXGV57', 'BBG0022MJRB2', 'BBG0025394S5'], dtype=obje

浏览 1提问于2018-04-05得票数 1

回答已采纳

2回答

如何将字典附加到pandas数据帧？

、、、、

我有一组包含json文件的urls和一个空的pandas dataframe，其中的列表示jsnon文件的属性。并不是所有的json文件都具有pandas dataframe中的所有属性。我需要做的是从json文件中创建字典，然后将每个字典作为新行附加到pandas dataframe，如果json文件没有与dataframe中的列匹配的属性，则必须将其填充为空。我设法创建了如下字典： import urllib2 import json url = "https://cws01.worldstores.co.uk/api/product.php?product_sku=ULS

浏览 2提问于2015-07-29得票数 11

回答已采纳

1回答

XML to JSON <P>以列表的形式结束

、、、、

我有许多xml文件，我将把它们转换成JSON，然后加载到openRefine或pandas dataframe中进行分析。xml文件如下所示 <NATURE_QUANTITY_SCOPE> <TOTAL_QUANTITY_OR_SCOPE> <P>Entreprisens omfang:</P> <P>Arbeidet omfatter bl.a følgende:&

浏览 50提问于2020-08-19得票数 0

1回答

在Python语言中使用PyMongo在MongoDB中插入文档

、、、、

我使用Python语言中的PyMongo库在MongoDB中插入文档。pandas数据帧有37个字段和60k条记录(数据集链接：)。数据帧中的所有字段都已转换为str类型。我收到以下错误： OverflowError: MongoDB can only handle up to 8-byte ints 当我使用for循环插入2500个文档的块时，错误仍然存在。代码片段： import pandas as pd import pymongo client = pymongo.MongoClient() db = client['patenting_in_psi'] colle

浏览 0提问于2018-02-16得票数 0

2回答

如何将dataframe行调整为列

、、

import pandas as pd import pandas.io.data as web from pandas import Series, DataFrame import matplotlib import matplotlib.pyplot as plt from numpy.random import randn import numpy as np matplotlib.style.use('ggplot') stocks = {'xom': '2014-01-01', 'dvn': '2013-01

浏览 1提问于2015-08-25得票数 1

回答已采纳

4回答

怎样才能更快地计算嵌套列表中出现的相等子列表？

我有一个Python列表，我想(尽可能快:非常重要.)将其出现在嵌套列表中的时间追加到每个子列表中。我已经在一些pandas数据帧中这样做了，但是这似乎非常慢，我需要在非常大的范围内运行这一行。我完全愿意牺牲漂亮的阅读代码来换取高效的代码。例如，我的嵌套列表在这里： l = [[1, 3, 2], [1, 3, 2] ,[1, 3, 5]] 我需要： res = [[1, 3, 2, 2], [1, 3, 5, 1]] 编辑 res中的顺序根本不重要。

浏览 0提问于2019-01-25得票数 9

回答已采纳

3回答

需要帮助理解这一行代码(字典，钥匙，熊猫，小矮人)

我正在尝试一个来学习TensorFlow和机器学习。我很难理解他们的中的一句台词。 def my_input_fn(features, targets, batch_size=1, shuffle=True, num_epochs=None): """Trains a linear regression model of one feature. Args: features: pandas DataFrame of features targets: pandas DataFrame of targets batch_size: Size of batc

浏览 0提问于2018-11-26得票数 3

回答已采纳