Pandas:将列表分配给多索引数据帧的所有行_通过索引值连接Pandas多索引数据帧的行_将pandas数据帧与多索引对齐 - 腾讯云开发者社区

python、pandas

我希望excel文件的第一行是数据帧的标题。(header=0做到了这一点) 当数据帧保存为.csv时，我希望标头位于.csv的第1行，就像它们在原始.csv中一样(这是我在实现时遇到的困难) 我已经尝试将.to_csv的header=设置为None或0，但都没有使头文件成为.to_csv文件的第1行。我现在正在尝试将第0行设置为df1并将其与df连接，但我得到了一个‘第一个参数必须是可迭代的pandas对象，你传递了一个类型为“Series”的对象。’ 有谁能提供一些关于如何实现这一点的见解，或者是否有更简单的方法？ import pandas as pd data = pd.read_

浏览 2提问于2021-11-09得票数 2

1回答

从pandas dataframe中选择特定行

python、numpy、pandas

我在pandas数据帧中执行了group by，以查看每个位置和每个日期有多少行。 agg_count = df.groupby(['date', 'location']).count() 现在，我希望看到这个新数据帧中满足特定条件的行。比如说，计数大于50。我如何高效地迭代这个巨大的数据帧来获得这些行？

浏览 1提问于2013-03-26得票数 1

回答已采纳

2回答

如何将Python Dataframe转换为列表列表？

python、pandas、casting

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

1回答

为数据帧创建多-Column索引

pandas、dataframe、multiple-columns、multi-index

是否可以将单级列数据帧更改为多列数据帧？如果我们有这样的数据帧， import pandas as pd df = pd.DataFrame({ 'a': [0, 1, 2, 3], 'b': [4, 5, 6, 7], 'c': [3, 5, 6, 2], 'd': [1, 5, 7, 0], }) 我们可以像下面这样更改它的列名吗？所以，简单地说，我尝试做的是在不改变数据帧的值的情况下拥有2级的列索引。 A B a b c d 0 0

浏览 10提问于2021-02-03得票数 0

回答已采纳

1回答

使用另一列中的值为列切片赋值不会引发形状不匹配错误

python、pandas

我有一个关于Pandas中形状广播是如何工作的问题。假设我有一个数据帧： df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [11, 22, 33, 44, 55]}) 我尝试将列'A‘的前两行替换为列'B’中的相应值。当我尝试将列B中的值显式指定为列表时： df.loc[[0,1], 'A'] = list(df['B']) 我得到了一个明显的形状广播错误： ValueError: shape mismatch: value array of shape (5,) c

浏览 11提问于2020-01-07得票数 3

回答已采纳

2回答

如何让数据帧行列出索引号？

python、pandas

我这里有一个问题，假设我有这个数据帧： import pandas as pd df = pd.DataFrame([[1, 2, 1], [1, 3, 2], [4, 6, 3], [4, 3, 4], [5, 4, 5]], columns=['A', 'B', 'C']) >> df A B C 0 1 2 1 1 1 3 2 2 4 6 3 3 4 3 4 4 5 4 5 假设我必须得到A=4的行： 2 4 6 3和3 4 3 4 如何将这些数据转换为带有索引号的列表？保罗

浏览 2提问于2020-10-20得票数 1

2回答

读取多个文件，并将它们堆叠到单个多级数据帧中。每个文件都有相同的列名

python、database、pandas

我想问一下，是否有人知道如何使用多级索引将多个数据帧堆叠成一个单独的数据帧，而不是像我正在做的那样堆叠成一个数据帧列表。谢谢 import glob import pandas as pd glist=glob.glob("./path/*.csv") D=[] for file in glist: X=pd.read_csv(file,names=['name1','name2','name3'],index_col = 0, header=0) D.append(X)

浏览 3提问于2017-08-11得票数 0

1回答

将列表追加到pandas数据帧的第一行和第一列

python-3.x、pandas、dataframe、append

我有一个4300x4300的pandas数据帧(行和列)，并希望在第一行和第一列中添加一个列表。我不知道如何做到这一点，如果不完全用零…填充数据帧旧的4300 x 4300数据帧示例(摘录)： ? 要添加的列表示例：“轴”，“输出”，“组”，“多”，“记录” 新的A x A数据帧示例： ?

浏览 11提问于2019-06-13得票数 1

回答已采纳

1回答

当我在数据帧列表中存储多个数据帧时，我回想起其中的一个，有没有一种方法可以格式化输出的列标题？

python、pandas、csv、dataframe、jupyter-notebook

我是Python和Stackoverflow的新手，所以请耐心等待。我有一个大约140k行的大型数据文件存储为csv。该文件被分成基于年龄组的部分，即。16-24，24-50等。在每次休息时，都会有关于受试者的年龄和性特征的信息线。在将csv加载到pandas之后，我尝试通过使用iloc划分年龄组的信息行来将数据帧拆分成几个较小的数据帧。现在我有了一个数据帧列表。我可以访问列表中的每个数据帧，没有问题，但是(我猜是由于信息行的原因) pandas在一列中显示所有信息。有没有一种方法可以格式化输出，并让pandas显示列标题，并将信息行放入列标题上方的标题中？我很抱歉，如果这不是非常清楚，请随

浏览 7提问于2019-05-29得票数 1

回答已采纳

1回答

将数组中的每个dataframe子集，并在每次循环中存储为新的dataframe对象

python、pandas、dataframe、subset

我目前在Pandas中有5个数据帧: a，b，c，d和e。每个文件都有一个'time‘列，我希望只提取'time’= 0的行。我所知道的最直接的方法是简单地子集，例如： a_base = a[a['time']==0] 然而，我正在寻找一种更好的方法，而不是为每个数据帧复制同一行5次。循环遍历数据帧名称的数组意味着每次都必须创建一个新的变量。有没有一种更好的方法，用更少的代码行来做到这一点？

浏览 60提问于2021-08-19得票数 0

3回答

像SQL一样的Pandas文本匹配？

pandas、string-matching、sql-like

有没有办法对pandas text dataframe列执行类似于的操作，使其返回可用于索引数据帧的索引列表或布尔值列表？例如，我希望能够匹配列以'prefix_‘开头的所有行，类似于SQL中的WHERE <col> LIKE prefix_%。

浏览 3提问于2014-03-10得票数 35

回答已采纳

1回答

计算pandas数据框列表中列的平均值和曲线图分布

python、pandas、numpy、dataframe、seaborn

我有一个dflist数据帧列表dflist，我想用pandas绘制数据帧中单个列的子集的平均分布。以下是我到目前为止拥有的代码： import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt df1 = pd.DataFrame(np.random.rand(100, 6) , columns=list('ABCXYZ')) df2 = pd.DataFrame(np.random.rand(100, 6) , columns=list('

浏览 12提问于2020-03-16得票数 0

回答已采纳

1回答

熊猫索引行为出人意料: df[df.index[0]] => KeyError

python、pandas、dataframe

我使用了一个数据have (初始索引为0.9999)，并按年份进行了分区： requests_df = {year : df[df['req_year'] == year] for year in df['req_year'].unique()} 和往常一样，每个子帧保留自己的索引顺序。然后，在尝试对其中一个孤立帧(df_yr = requests_df[2015])进行索引时，我得到了一个非常出乎意料的行为： for idx in df_year.index: qty = frame[idx]['qty_tickets'] 原因

浏览 1提问于2017-02-21得票数 1

回答已采纳

2回答

Python，有没有办法把df.drop赋给一个新的变量？

python、pandas

我练习python已经有一段时间了，刚刚开始接触pandas，开始学习数据帧。我知道df.drop()会根据某些要求删除列/行，并生成一个新的df。我想知道，有没有一种方法可以将这些被删除的列/行分配给一个新的变量以用于日志记录？ import pandas as pd L = ["a","b","c","d","a","a"] df1 = pd.DataFrame(L) df1.columns = ['letter'] #print(df1) df2 = df1.drop(df1

浏览 17提问于2018-01-13得票数 2

回答已采纳

1回答

如何将MultiIndex熊猫数据帧转换为Dask数据帧

python、pandas、dataframe、dask、multi-index

我试图将两个变量(一个ID和一个DateTime变量)为MultiIndexed的熊猫数据帧转换为dask数据帧，但是我得到了以下错误； "NotImplementedError: Dask does not support MultiIndex Dataframes" 我正在使用下面的代码 import pandas as pd import dask.dataframe as dd dask_df = dd.from_pandas(pandas_df) 实际上，我有700多个熊猫数据帧(每个超过100MB)，我计划将每个熊猫数据帧转换为dask，然后将它们全部附加到一

浏览 18提问于2019-07-02得票数 2

回答已采纳

1回答

根据另一个数据帧中的值将数据帧拆分为6个数据帧

python、pandas、dataframe

我正在尝试根据另一个数据帧中的值将一个数据帧的行分成6个列表。在python中使用pandas包。trainX =数据帧形状(7352,561)和trainY =数据帧形状(7351，1) 我想要的是根据trainY中相应行的值，将trainX的每一行排序到6个新的数据帧中。如果trainY中的第1行表示"1"，那么trainX中的第1行应该转到dataframe class1。如果trainY中的第2行表示"2"，那么trainX中的第2行应该转到dataframe class2。依此类推，直到trainX中的所有7351行都划分为类1到6。我用for循环

浏览 1提问于2021-11-26得票数 0

1回答

如何将MultiIndex数据帧转换为单索引数据帧？

python、pandas

我有当前的代码，用于读取文件，然后从数据帧的顶部删除一行，直到一个特定值为‘意外ID’。 def read_file(file): """ This function reads the Excel file, chooses the sheet that contains the information that we need. The sheet is then read and the dataframe is created. """ df = pd.ExcelFile(file)

浏览 143提问于2021-11-17得票数 0

回答已采纳

2回答

Pandas Dataframe .loc布尔值将索引附加到第一列

python、pandas

为什么索引似乎被附加到数据帧的.loc布尔型选定行的第一列？数据帧： date price 0 20180926 100 1 20180925 99 2 20180924 98 3 20180923 97 代码： import pandas as pd d = {'date': ['20180926', '20180925','20180924','20180923'], 'price': [100,99,98,97]} df = pd.Dat

浏览 2提问于2018-09-27得票数 1

1回答

使用pandas中的索引列查看或过滤？

python、pandas

使用Python的pandas库，我导入了一个csv并将多个列设置为我的索引。出乎意料的是，当我显示数据帧时，索引列不再存在，并且我不能使用索引列作为过滤器选项。这让我想知道我是否错误地认为pandas索引类似于SQL索引。 date, exchange, symbol, low, high, open, close, last exchange和symbol足以唯一标识一行。它是加快了查找速度，还是添加了一些对stack/unstack/pivot/groupby之类的东西有用的语义信息？它能减少内存使用量吗？为什么要将日期、交换和符号移出数据帧(并移到索引系列中？)？把它们留在dat

浏览 1提问于2014-09-19得票数 0

2回答

如何将字典附加到pandas数据帧？

python、json、for-loop、dictionary、pandas

我有一组包含json文件的urls和一个空的pandas dataframe，其中的列表示jsnon文件的属性。并不是所有的json文件都具有pandas dataframe中的所有属性。我需要做的是从json文件中创建字典，然后将每个字典作为新行附加到pandas dataframe，如果json文件没有与dataframe中的列匹配的属性，则必须将其填充为空。我设法创建了如下字典： import urllib2 import json url = "https://cws01.worldstores.co.uk/api/product.php?product_sku=ULS

浏览 2提问于2015-07-29得票数 11

回答已采纳

2回答

如何将几行附加到现有的pandas数据框中，其中的行数取决于理解列表

python、pandas、append、intervals

我试图通过一次添加几行来填充pandas中的现有数据帧，行数取决于一个理解列表，因此它是可变的。初始数据帧按如下方式填充： import pandas as pd import portion as P columns = ['chr', 'Start', 'End', 'type'] x = pd.DataFrame(columns=columns) RANGE = [(212, 222),(866, 888),(152, 158)] INTERVAL= P.Interval(*[P.closed(x, y) for x

浏览 31提问于2021-08-06得票数 0

4回答

我如何在Pandas中使用重复的键来透视这个数据帧？

python、pandas、dataframe

我有一个pandas数据帧，它的创建方式如下： df = pd.DataFrame({ 'rank': ['1', '1', '1', '1', '2', '2'], 'name': ['bob', 'rick', 'bob', 'rick', 'randy', 'billy'],

浏览 18提问于2020-10-17得票数 3

2回答

如何将具有多个索引的pandas.core.series.Series对象转换为填充了所有列的pandas Dataframe？

python、pandas、dataframe、pandas-groupby

我有一个具有多个索引的熊猫系列，就像这个图像"target"，"Lastnewjob"，"experienceGroup“。这是pandas.core.series.series类型。我想把它转换成一个数据帧(第二张图)，其中"experienceGroup“值将是列名，而"target"，"Lastnewjob”仍然是列。我想要查看的数据帧使用groupby获取序列的代码。 Job=df.groupby(['target','last_new_job'])['

浏览 1提问于2021-01-26得票数 0

3回答

一种高效串联熊猫DataFrames的方法

python、numpy

我有10个DataFrames，它们的行数相等，每个数据帧都有自己的一组唯一列(没有在任何数据帧之间共享)。我想简单地将数据帧串行地添加在一起，这样最终的数据帧就包含了所有数据帧中包含的所有列。最终数据帧的第一行将包含第一个数据帧的第一行，然后是第二个数据帧的第一行，依此类推，直到第十个数据帧。我尝试过pandas.concat(dataframes，axis=1)，但它最终以某种方式在我的数值数据中创建了NaN值。我通过编写一个极其缓慢而丑陋的方法来解决这个问题，该方法按索引递增各行，并逐行创建最终的数据帧。熊猫做这件事的正确方式是什么？

浏览 0提问于2017-08-07得票数 0

回答已采纳

2回答

如何在python中将整个列表写入数据结构

python、class、pandas、data-structures

因此，我面临的问题是，我想创建一个数据结构，其中包含来自我的熊猫数据帧的46个项目。因此，我有了完整的列名列表和pandas dataframe。所以有没有办法把每一行pandas都转换成我的数据结构的一个对象。所以说：我有一个很棒的地方列X Y A 1 2 B3 4 C5 6 所以我想把每一行都转换成一个对象考虑到我有46列和100,000行，有什么好方法可以做到这一点吗？

浏览 1提问于2015-10-31得票数 0

1回答

使用pandas面板创建3d矩阵

python、csv、pandas

我的目标是创建一个pandas面板，我目前有一个csv，示例如下： Year From country To country Points 2005 Albania Albania 0 2005 Albania Bosnia & Herzegovina 0 2005 Albania Croatia 2 2005 Albania Cyprus 7 2005 Albania

浏览 18提问于2017-03-08得票数 1

2回答

如何在pandas中迭代合并数据帧？

python、pandas、frames

给定一个数据帧列表，我希望迭代地合并它们并返回单个数据帧。输入：frames (熊猫数据框列表)和on_columns (包含要合并的列名的字符串或字符串列表)。如何使用df.merge完成此操作？“给定数据帧列表，以迭代方式合并它们并返回单个数据帧 """HINT: Use slice on frames when iterating and merging. Arguments: frames {list} -- a list of pandas DataFrames on_columns {string or list} -- a string

浏览 4提问于2018-10-11得票数 1

1回答

如何减去两个数据帧行？

python、pandas、dataframe、subtraction

如何减去两个数据帧？我有两个数据帧，A和B。我想减去它们(A-B)。这样，A中B的行将从A中删除。有关更多解释:我想删除B中重复的A中的行。例如：然后我需要一个函数来执行A-B，并给出以下结果：你知道pandas中的这个函数或方法吗？

浏览 1提问于2020-07-12得票数 0

3回答

为什么pandas df.add_suffix()不能与for循环一起使用

python、pandas、for-loop、suffix

我正在尝试将pandas df.add_suffix()用于多个数据帧，这些数据帧通过for循环存储在列表中： df_1 = pd.DataFrame({'X': [2, 3, 4, 5], 'Y': [4, 5, 6, 7]}) df_2 = pd.DataFrame({'X': [6, 7, 8, 9], 'Y': [9, 8, 7, 6]}) df_3 = pd.DataFrame({'X': [6, 3, 1, 13], 'Y': [7, 0, 1, 4]}) mylist = [

浏览 24提问于2020-03-27得票数 1

回答已采纳

1回答

使用同一数据框中2个其他列的值从一个列创建2D列表

python、pandas、list、numpy、dataframe

我有一个有2列的数据帧，它表示需要创建的2D数组的X&Y维度。二维数组中的值将来自数据帧中的另一列。如果数据帧中有1个以上的值列，则需要创建相同数量的2D列表。到目前为止，假设数据帧中只有1个值列，我已经能够创建1个2D列表。我基于dataframe中的X&Y列创建了一个相同维度的空2D列表。然后，我循环遍历数据帧的每一行，并根据该行中X&Y的值填充2D列表。示例数据帧。X表示2D列表的“列”，Y表示2D列表的“行”。在这种情况下，2D列表是3x2。列(numeric_result、电压)将填满2D列表。 | parent | child | nume

浏览 12提问于2019-04-26得票数 1

回答已采纳

2回答

从列表创建数据帧并保留重复项目

python、pandas

我有一份数据帧列表。列表中的每个数据帧都是唯一的-这意味着有一些共享但不同的列。我想创建一个dataframe，它包含来自dataframe列表的所有列，如果元素不存在，将填充NaN。我尝试过以下几种方法 import pandas as pd df_new = pd.concat(list_of_dfs) #I get the following: InvalidIndexError: Reindexing only valid with uniquely valued Index objects 问题似乎是由于列表中的数据帧造成的。每个数据帧只有一行，所以它的索引是零，因此重新索引不会起到

浏览 7提问于2021-07-12得票数 0

2回答

根据Pandas中的列表选择数据帧行的子集

python、pandas

我有一个数据帧df1和列表x In [22] : import pandas as pd In [23]: df1 = pd.DataFrame({'C': range(5), "B":range(10,20,2), "A":list('abcde')}) In [24]: df1 Out[24]: A B C 0 a 10 0 1 b 12 1 2 c 14 2 3 d 16 3 4 e 18 4 In [25]: x = ["b","c","g

浏览 5提问于2015-01-29得票数 6

回答已采纳

1回答

Pandas:数据帧字典

python、pandas

我有一个分析实验数据的函数(所有单独的.txt文件) 此函数输出Pandas Dataframe的字典({} 有没有一种有效的方法来迭代这个字典并输出单独的数据帧？假设我的字典叫做analysisdict for key in analysisdict.keys(): dfx=pd.concat([analysisdict[key]['X'], analysisdict[key]['Y']], axis=1) 其中dfx将是一个单独的数据帧。(我猜可能需要第二个循环？也许我应该遍历df名称的列表？) 输出将是df1...dfn

浏览 1提问于2017-12-29得票数 0

回答已采纳

3回答

快速熊猫过滤

python、pandas

如果name列条目在给定的列表中有一项，我想过滤一个pandas数据帧。这里我们有一个DataFrame x = DataFrame( [['sam', 328], ['ruby', 3213], ['jon', 121]], columns=['name', 'score']) 现在假设我们有一个名为['sam', 'ruby']的列表，我们想要找到列表中名字所在的所有行，然后对分数求和。我的解决方案如下： total = 0 names = ['sa

浏览 0提问于2014-02-13得票数 7

回答已采纳

1回答

Pandas将行组合为标题信息

python-3.x、pandas、dataframe、multi-index

这就是我如何使用pandas读取和创建数据帧 def get_sheet_data(sheet_name='SomeName'): df = pd.read_excel(f'{full_q_name}', sheet_name=sheet_name, header=[0,1], index_col=0)#.fillna(method='ffill') df = df.swapaxes(axis

浏览 95提问于2021-11-22得票数 0

回答已采纳

2回答

Python:将NaN更改为从不同数据帧获取的特定值

python、pandas、dataframe

我想给一个数据帧分配一个变量，但是这个值只分配给了第一行，其余的都是Nan。我只能找到关于如何将NaN值转换为零的文档。我有以下数据： import pandas as pd data = {'One': ['a value', 'another value', 'okay', 'yes'],'Two': ['var', 'var2', 'alright', 'pool']} df = pd.DataFrame(data, co

浏览 12提问于2020-07-12得票数 0

回答已采纳

1回答

pandas.Index.isin产生的数据帧不同于简单的切片

python、pandas

一般来说，我对pandas和python都是新手，所以如果这太基础了，我很抱歉。我有一个索引列表，我必须使用这些索引来获取数据帧的行子集。首先，我简单地使用索引对数据帧进行切片以生成(df_1)。然后我尝试使用index.isin，看看它是否也能工作(df_2)。好吧，它是有效的，但是它产生了一个更短的数据帧(并且似乎忽略了一些应该被选择的行)。 df_1 = df.iloc[df_idx] df_2 = df[df.index.isin(df_idx)] 所以我的问题是，为什么它们是不同的？index.isin到底是如何工作的，什么时候使用它是合适的？

浏览 0提问于2020-08-17得票数 0

1回答

处理附加到数据帧的抽象

python、python-3.x、pandas、dataframe、reference

如果我有一个对dataframe的“引用”，在pandas中似乎没有办法附加到它，因为append和concat都不支持inplace=True参数。一个(过于)简单的例子： chosen_df, chosen_row = (candidate_a_df, candidate_a_row) if some_test else (candidate_b_df, candidate_b_row) chosen_df = chosen_df.append(chosen_row) 现在，因为Python做了类似于按值复制引用的事情，所以chosen_df最初将是对传递给some_test的任何候选

浏览 22提问于2019-08-21得票数 1

回答已采纳

1回答

从多索引Pandas DataFrame中导出/writing到Excel标签

python、excel、list-comprehension、pandas-groupby

我想通过第一个索引'0‘将多索引数据帧拆分/切片为第一个索引的每个级别的数据帧(例如，下面将有4个数据帧)。然后，我想将每个数据框导出到EXCEL中的单独选项卡中。我希望得到帮助的最重要的问题是如何编写循环或列表理解，将多索引数据帧拆分成单独的数据帧。示例Dataframe： import pandas as pd import numpy as np arrays = [ np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo',

浏览 17提问于2019-01-27得票数 0

回答已采纳

1回答

组合一个数据文件列表

python-3.x、pandas、indexing、concat

我有一个有几个..csv文件的文件夹。每个包含数据的时间，高，低，开放，Volumefrom，Volumeto，加密货币关闭。我成功地将.csvs加载到一个数据文件列表中，并删除了列Open、High、Low、Volumefrom、Volumeto，这是我不需要的，给我留下了时间，并关闭了每个数据帧。现在我想把数据列表组合成一个数据，索引以最小的硬币的时间戳开始，在这个例子中是iota。这是我到目前为止编写的代码： import pandas as pd import os # Path to my folder PATH_COINS = r"C:\Users\...\C

浏览 1提问于2018-09-25得票数 0

1回答

使用函数过滤pandas数据帧

python、pandas、dataframe

假设我有一个具有列A, B, C, D, E, F, G, H的pandas dataframe df，并且我想使用一个函数functn来过滤数据帧，该函数接受一个“行”，并根据该行是否满足特定条件返回true或false (假设该函数使用除H之外的每一列)。有没有一种方法可以有效地过滤这个数据帧而不使用又长又难看的lambda？到目前为止，我的解决方案如下所示： df = df[df.apply(functn, axis=1)] 但这种方法似乎非常慢，即使对于有15k行的帧也是如此。有没有一种干净有效的方法来使用用户定义的python函数而不是lambda或查询来过滤pandas数据帧？注

浏览 17提问于2017-12-14得票数 2

回答已采纳

1回答

将Pandas数据帧放入具有特定格式的字典列表的最有效方法

python、pandas、list、dictionary

我有一个Pandas数据框架，其中包含一个列和一个时间戳索引。数据帧的代码如下所示： import pandas as pd indx = pd.date_range(start = '12-12-2020 06:00:00',end = '12-12-2020 06:02:00',freq = 'T') df = pd.DataFrame(data = [0.2,0.4,0.6],index = indx,columns = ['colname']) 我想以某种方式从df行创建一个字典列表。对于数据帧的每一行，我希望创建一个具有

浏览 5提问于2020-12-18得票数 1

回答已采纳

1回答

将二维pandas数据帧重新映射到三维xarray

python、pandas、dataframe、multidimensional-array、python-xarray

我目前有一个很大的2-d pandas时间序列值(1年或更长时间)的数据帧，我想将其重新映射到3-d xarray。pandas数据帧具有对应于另一个引用数据帧中的(经度，经度)坐标的column_id。在xarray中有什么固有的功能可以实现这一点吗？

浏览 25提问于2019-07-31得票数 0

1回答

在Pandas中将数据帧细分为多个数据帧

python、list、pandas、dataframe

我有一个Pandas数据框架，它有51034行和10列。我想根据包含要切片的行的列表将这个数据帧分割成158个较小的数据帧。如何将熊猫数据帧分割成更小的数据帧？例如，如果我有一个10行4列的数据框架： A B C D 0 1 2 3 4 1 5 6 7 8 2 9 10 11 12 3 13 14 15 16 4 17 18 19 20 5 21 22 23 24 6 25 26 27 28 7 29

浏览 2提问于2015-05-13得票数 2

回答已采纳

1回答

是什么改变了这个pandas代码中的日期类型？

python、pandas、datetime

我在Pandas中有一个数据框，其中包含日期和其他一些数据。日期是显式的datetime.date类型。在本例中，我手动强制执行此操作。在实际问题中，框架是从已经设置好的外部源导入的。在操作索引之后，我发现我的dates属于pandas._libs.tslib.Timestamp类，这会导致与后面的代码不兼容。是什么导致了类型/类的变化？最小工作示例(注意第3行和第7行之间的区别)： In [1]: df = pd.DataFrame({'date' : ['02/20/2015','01/15/2016','08/21/2015

浏览 9提问于2019-07-10得票数 1

回答已采纳

1回答

提高非常大的数据帧上的迭代性能

python、pandas、dataframe、iteration、list-comprehension

我有一个pandas数据帧，它由300万行和50列组成，所有列都包含整数(正数或负数)。我想创建一个名为'feature‘的新列，它从现有的50列中提取最大的负数。例如，如果对于给定行，50列包含以下值 -25,-24,-23,...,-1,1,...,23,24,25 “feature”列应返回-1。因为我的数据帧太大了，所以我尝试的解决方案花费的时间太长了。例如，我尝试过使用列表理解，但是因为我求助于iterrows()，所以它太慢了(itertuples()的性能并没有明显的提高)： import numpy as np import pandas as pd from tq

浏览 3提问于2019-07-17得票数 1

回答已采纳

1回答

从多索引创建数据帧

python、dataframe、multi-index

我有一个pandas序列的值，存储在变量s中，它是使用Multi Indexing形成的。代码- s = pd.Series(np.random.rand(50), index=idx) 下面是s的样子- ? 创建此数据帧的最佳方式是什么？

浏览 18提问于2021-11-19得票数 0

回答已采纳

1回答

将整数字典映射到Pandas数据帧

python、pandas

我尝试使用预定义的整型到整型python字典，以便将pandas数据帧中的相应行映射到新行，但没有成功。我有以下数据帧： data=np.array([ ['Item 1',7365301,"Cool item."] ]) items = pd.DataFrame(data = data, columns = ['name','id','description']) 我有一个python字典，它像这样从int->int映射： item_map = {7365301: 10} 我正在尝试使用Pand

浏览 0提问于2018-04-06得票数 0

1回答

如何用任意长度的两列列表对大熊猫数据进行分类

python、pandas

我尝试过不同的布尔数组和.isin结构的组合，但我的熊猫福不够强大。如果我有以下示例dataframe： In[1]: import pandas as pd exampledf = pd.DataFrame({ 'factor1' : ['a', 'b', 'c', 'd', 'a', 'b', 'c', 'd'], 'factor2' : [&

浏览 5提问于2014-04-24得票数 1