pandas -删除MultiIndex DataFrame中的重复行_如何删除pandas dataframe中的重复行？_使用MultiIndex从DataFrame中删除特定行 - 腾讯云开发者社区

python、pandas、dataframe、grouping

我有一个pandas dataframe，它有重复的I，因为每一行代表一个时间度量。 pd.DataFrame([[1, 2], [1, 3], [2, 6], [2,7]], columns=['id', 'colA']) 我希望以这样一种方式对其进行转换，即每行表示一个ID，并在新列中捕获数据的时间序列方面。即:我希望输出如下所示： pd.DataFrame([[1,2,3],[2,6,7]],columns=["id","colA_0","colA_1"]) 我该如何实现这一点？

浏览 0提问于2020-02-25得票数 0

1回答

按行名分组Pandas DataFrame

python、pandas、dataframe、row、pandas-groupby

我有一个简单的Pandas DataFrame，它有行名和2列，类似于下面的内容。 from pandas import DataFrame, Series row_names = ['row1', 'row2', 'row2', 'row4'] df = DataFrame({'col1': Series([1, 2, 3, 4], index=row_names), 'col2': Series([0, 1, 0, 1], index=row_names)}) 与

浏览 2提问于2014-04-03得票数 0

回答已采纳

2回答

在没有循环的情况下从多级pandas数据帧中删除行列表

python、pandas

如果不使用for循环，则无法确定如何从具有3个以上级别的pandas数据帧中删除多级行的列表。在显式定义索引中的所有值时，这样做效果很好，答案是：Pandas Multiindex dataframe remove rows 例如： mask = dfmi.index.isin(( ('A0','B0', 'C0'), ('A2','B3', 'C4') )) dfmi.loc[~mask,:] 然而，当一个人想要接受所有可能的第三级时： dfmi.index.isin(( ('A0&#

浏览 11提问于2019-06-20得票数 4

回答已采纳

1回答

按顺序标注索引以复制DataFrame索引

pandas、numpy

我有一个这样的DataFrame： df = pd.DataFrame([100,200,300], [1,1,2]) 0 1 100 1 200 2 300 我想添加一个二级索引(MultiIndex)，如下所示： 0 index i2 1 0 100 1 200 2 0 300 也就是说，我希望二级索引(在这里称为i2)为零，其中df.duplicated()为False (意味着索引与上面的索引不相同)，并且是其他行的顺序编号。一般的想法是采用一个有重复的索引，并通过引入一个从零开始的额外的索引级别，使

浏览 3提问于2017-07-31得票数 2

回答已采纳

2回答

熊猫:在只有1行的MultiIndex中添加一个DataFrame

python、pandas

我有一个小数据集，如下所示：和一个元组，如：(Timestamp('2009-02-27 09:45:00'), 'bloomberg', 'Chicago PMI') 我想在DataFrame上创建一个多个索引，以便它读起来类似于：当试图构造MultiIndex时： MI=pd.MultiIndex(index, (0,0,0)) 我遇到以下错误： TypeError: Index(...) must be called with a collection of some kind, Timestamp('200

浏览 3提问于2017-01-28得票数 4

回答已采纳

1回答

MultiIndex熊猫数据过滤后解堆时的界外误差

pandas、dataframe、multiple-columns

我有一个多索引熊猫DataFrame，我执行一些操作(包括删除带有空值的列)，然后尝试将.但是，这会导致索引错误。有办法解决这个问题吗？代码如下： ds = ds.unstack(level='Symbol') ds.columns = ds.columns.swaplevel(0, 1) ds = ds[start:end] ds = ds[equities] ds = ds.stack(level='Symbol') ds.dropna(axis=1, inplace=True) # this line breaks the code ds = ds.uns

浏览 2提问于2018-04-02得票数 3

回答已采纳

1回答

用NaN删除带有重复项的MultiIndex中的行

python、pandas、dataframe、nan、multi-index

更新了一个DataFrame，该DataFrame指责了我的确切问题我遇到了一个问题，在我的索引中出现NaN会导致非唯一的行(自NaN !== NaN以来)。我需要删除索引中出现NaN的所有行。我前面的问题有一个示例DataFrame，它只有一个NaN行，但是最初的解决方案并没有解决我的问题，因为它不符合这个不太好的广告要求： (请注意，在实际数据中，我有数千行这样的行，包括自NaN !== NaN以来重复的行，因此在索引中允许这样做) (来自我原来的职位) 问题 >>>import pandas as pd >>>import numpy as

浏览 11提问于2017-09-11得票数 2

回答已采纳

7回答

删除具有重复索引的pandas行

python、pandas、dataframe、duplicates

如何删除索引值重复的行？在下面的天气DataFrame中，有时科学家会返回并纠正观察结果--不是通过编辑错误的行，而是通过在文件的末尾附加一个重复的行。我正在从网络上读取一些自动化的天气数据(每5分钟进行一次观测，并将每个气象站的月度文件汇编成文件)。解析文件后，DataFrame如下所示： Sta Precip1hr Precip5min Temp DewPnt WindSpd WindDir AtmPress Date

浏览 3提问于2012-10-24得票数 353

回答已采纳

2回答

如何使用布尔型DataFrame ("IndexError:条目长度2而不是3“)访问Pandas MultiIndex中的行。

python、pandas

考虑一个具有所有布尔型级别的MultiIndex的Pandas DataFrame (例如下面的例子)。试图使用布尔标签访问此类DataFrame的特定行会导致错误： df = pd.DataFrame([[False, False, 1], [False, True, 2], [True, False, 3]], columns=["A", "B", "C"]) df.set_index(["A", "B"], inplace=Tru

浏览 5提问于2020-03-07得票数 1

回答已采纳

3回答

如何在切割熊猫MultiIndex的DataFrame后更新其水平？

python、pandas

我有一个带熊猫MultiIndex的Dataframe： In [1]: import pandas as pd In [2]: multi_index = pd.MultiIndex.from_product([['CAN','USA'],['total']],names=['country','sex']) In [3]: df = pd.DataFrame({'pop':[35,318]},index=multi_index) In [4]: df Out[4]:

浏览 3提问于2015-02-27得票数 22

回答已采纳

2回答

熊猫DataFrame来自MultiIndex和NumPy结构化数组(recarray)

python、numpy、pandas、dataframe、multi-index

首先，我创建了一个两级。 import numpy as np import pandas as pd ind = pd.MultiIndex.from_product([('X','Y'), ('a','b')]) 我可以这样用它： pd.DataFrame(np.zeros((3,4)), columns=ind) 这意味着： X Y a b a b 0 0.0 0.0 0.0 0.0 1 0.0 0.0 0.0 0.0 2 0.0 0.0

浏览 11提问于2016-06-09得票数 2

回答已采纳

1回答

DataFrame的Series.map的等价物？

python、pandas

使用带有系列参数的Series.map，我可以获取系列的元素，并将它们用作另一个系列的索引。我想对DataFrame的一些列执行相同的操作，将每一行用作多索引编辑的Series中的一组索引层。下面是一个示例： >>> d = pandas.DataFrame([["A", 1], ["B", 2], ["C", 3]], columns=["X", "Y"]) >>> d X Y 0 A 1 1 B 2 2 C 3 [3 rows x 2 columns]

浏览 0提问于2014-03-10得票数 5

1回答

为什么要转置数据以获得多索引数据帧？

python、pandas、dataframe、multi-index

在从DataFrame创建多索引DataFrame时，我对数据定向有点困惑。我使用read_excel()导入数据，并从以下内容开始： import pandas as pd df = pd.DataFrame([['A', 'B', 'A', 'B'], [1, 2, 3, 4]], columns=['k', 'k', 'm', 'm']) df Out[3]: k k m m 0 A B A B 1 1 2 3 4 我想要对此进

浏览 9提问于2019-04-11得票数 1

回答已采纳

2回答

如何通过分组将Pandas Dataframe转换为数据字典

python、pandas、dataframe、dictionary、pandas-groupby

我有一个由3D数据构建的DataFrame，其形式如下：指数：A，B 列：1.a，1.b，2.a，2.b 我试图把它解压缩到字典中，用索引{1,2}和列{A，B}将{a，b}映射到DataFrames。示例输入： aa = pandas.DataFrame({'1.a':[1,2], '1.b':[3,4], '2.a':[5,6], '2.b':[7,8], 'index':['A', 'B']}).set_index('index') 目标输出： bb =

浏览 8提问于2021-01-28得票数 0

回答已采纳

1回答

Python数据源-前两列消失

excel、powerbi、dax、powerquery

我已经开始使用PowerBI，并使用Python作为数据源，下面的代码如下所示。源数据可以下载 (约700兆字节)。数据最初是 (包含在IOT_2019_pxp.zip中)。 import pandas as pd import numpy as np import os path = /path/to/file to_chunk = pd.read_csv(os.path.join(path,'A.txt'), delimiter = '\t', header = [0,1], index_col = [0,1],

浏览 4提问于2022-08-08得票数 1

回答已采纳

4回答

熊猫们读到json没有在MultiIndex上工作

python、json、pandas

我正在尝试阅读通过df.to_json()通过pd.read_json创建的数据文件，但是我得到了一个ValueError。我认为这可能与索引是一个MultiIndex这一事实有关，但我不知道如何处理。 55k行的原始数据被称为psi，我通过以下方法创建了test.json： psi.head().to_json('test.json') 是print psi.head().to_string()的输出，如果您想使用它的话。当我在这个小数据集(5行)上这样做时，我会得到一个ValueError。 ! wget --no-check-certificate https://gi

浏览 11提问于2014-03-31得票数 12

回答已采纳

1回答

Pandas MultiIndex单级查找比其他访问模式慢得多

python、pandas

我有一个孤立的代码片段，它应该是不言而喻的： import string import itertools import numpy as np import timeit index = list(itertools.product(range(100_000), string.ascii_uppercase)) df = pd.DataFrame(index, columns=['i', 'p']) df['n'] = np.random.randn(len(df)) df_2 = df.set_index('i', d

浏览 30提问于2020-08-12得票数 2

2回答

如何重命名重复的MultiIndex列名？

python、pandas

我有一个具有两个列索引级别的数据帧。可复制的数据集。 df = pd.DataFrame( [ ['Gaz','Gaz','Gaz','Gaz'], ['X','X','X','X'], ['Y','Y','Y','Y'], ['Z','Z','Z','Z']], columns=pd.MultiIndex.

浏览 70提问于2020-07-10得票数 0

回答已采纳

1回答

Python Pandas中的交叉表分析

python、pandas、crosstab

所以我要做的是创建一个网页，用户可以在导入的数据文件的选定行和列上运行交叉制表分析。我将文件转换为pandas数据帧，然后使用pandas.crosstab对其进行处理。然而，因为交叉表输出一个“堆叠的”或多索引的表格，所以我必须旋转它，以便更容易地使用和输出回网页。我一直在尝试使用pandas的pivot函数，但是很难找到一个好的、动态的例子。一些我一直在看的pandas中旋转的文档，但它没有显示一个列和行标签是动态的示例。现在我的交叉表函数是： cross_tab = pd.crosstab([dataframe[row] for row in selected_rows], [dat

浏览 5提问于2018-02-06得票数 1

回答已采纳

1回答

在使用MultiIndex索引到Pandas DataFrame时保持顺序？

python、pandas、dataframe、multi-index

如果我有一个带有MultiIndex的Pandas DataFrame，我如何索引到DataFrame中，同时保持我用来索引的东西的顺序？例如，如果我使用以下命令创建一个DataFrame： import pandas as pd df = pd.DataFrame.from_records([ ("alice", "us", 5), ("alice", "fr", 10), ("alice", "de", 15), ("bob", "u

浏览 13提问于2020-07-06得票数 1

回答已采纳

2回答

将二维numpy.ndarray转换为pandas.DataFrame

python-2.7、pandas、multidimensional-array

我有一个相当大的numpy.ndarray。它基本上是一个数组。我想把它转换成pandas.DataFrame。我想做的是在下面的代码中 from pandas import DataFrame cache1 = DataFrame([{'id1': 'ABC1234'}, {'id1': 'NCMN7838'}]) cache2 = DataFrame([{'id2': 3276827}, {'id2': 98567498}, {'id2': 38472837}]) ndarr

浏览 0提问于2014-06-20得票数 2

回答已采纳

3回答

用pandas.DataFrame设置值

python、pandas

拥有这个DataFrame： import pandas dates = pandas.date_range('2016-01-01', periods=5, freq='H') s = pandas.Series([0, 1, 2, 3, 4], index=dates) df = pandas.DataFrame([(1, 2, s, 8)], columns=['a', 'b', 'foo', 'bar']) df.set_index(['a', 'b'],

浏览 1提问于2016-06-01得票数 8

回答已采纳

1回答

当对多列使用groupby时，如何不删除未观察到的列组合

python、pandas

假设我有一个pandas数据框架，如下所示： df = pandas.DataFrame([[1,'A', 'First'], [3,'A', 'Second'], [2,'A', 'Third'], [5,'B', 'Second'], [4,'B', 'T

浏览 0提问于2015-12-17得票数 0

回答已采纳

2回答

来自Dataframe行的MultiIndex (多级)列名

python、pandas、dataframe、multi-index

我有一个相当混乱的数据帧，需要将前3行指定为多级列名。这是我的dataframe，我需要索引3、4和5作为我的多索引列名。例如，“矿物总量”应该是下一项的0级；“TRATAMIENTO(Ts)”应该是1级，直到“LEY Cu(%)”出现为止。实际上，我需要的是尝试模拟pandas.read_excel在使用多行指定“header”时所做的事情。请帮帮我！我在尝试这个，但一点运气都没有： pd.DataFrame(data=df.iloc[3:, :].to_numpy(), columns=tuple(df.iloc[:3, :].to_numpy(dtype='str&

浏览 17提问于2022-10-20得票数 0

回答已采纳

1回答

熊猫DataFrame:重复ID块中的聚合值

python、pandas、dataframe、group-by、aggregate

给定一个ID列和相应值列的DataFrame，我如何在重复ID块中聚合(例如和)值？示例DF： import numpy as np import pandas as pd df = pd.DataFrame( {'id': ['a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'b', 'a', 'b',

浏览 1提问于2020-06-03得票数 3

回答已采纳

1回答

如何从一个DataFrame中选择行，其中行的索引的一部分位于另一个DataFrame的索引中，并且满足某些条件？

pandas、dataframe、multi-index

我有两个DataFrames。df提供了大量数据。test_df描述某些测试是否已通过。我只需要从df中选择那些测试没有失败的行，方法是在test_df中查找这些信息。到目前为止，我能够将我的test_df降低到passed_tests。因此，剩下的是只从df中选择行索引的相关部分在passed_tests中的行。我怎么能这么做？更新： test_db没有唯一的行。如果有重复行(可能有多个重复)，最肯定的测试优先。即真>行>假。我的代码： import pandas as pd import numpy as np index = [np.array(['

浏览 10提问于2017-03-03得票数 2

回答已采纳

2回答

根据选定的列过滤重复的行，并与Pandas中的另一个数据帧进行比较

python、python-3.x、pandas、dataframe

给定如下两个数据帧： import pandas as pd # Creating a DataFrame object df1 = pd.DataFrame([('Stuti', 28, 'Varanasi'), ('Saumya', 32, 'Delhi'), ('Aaditya', 25, 'Mumbai'), ('Saumya', 32, 'Delhi')],

浏览 31提问于2021-01-04得票数 2

回答已采纳

2回答

Pandas中的聚合行

python、python-3.x、pandas、machine-learning、pandas-groupby

我有熊猫DataFrame和下面的专栏： VisitorID (每个基于用户cookie的用户都是唯一的) VisitNumber (1 =第一次访问，2=第二次访问等) TimeSpentOnVist (访问时间以秒为单位) 频道(访问的推荐人)例: Facebook，Google和Bing ) 媒体类型(付费或有机) 每次访问(1，2，3)都重复访问者ID。我想总结一下最后一次访问频道和媒体类型，但同时，汇总(总结)所有访问的时间。我的目标是按visitorID分组，这样就不会有重复。在Pandas中执行这种聚合的最有效方法是什么？

浏览 1提问于2017-11-03得票数 1

回答已采纳

1回答

如何在SQL Server中使用df.to_sql将两个索引的数据导出到一个表中？

python、sql-server、python-3.x、dataframe

我有一个包含两个索引的数据框，我正尝试将其导出到SQL Server表中。这是我正在使用的代码。 grouped_and_summed.to_sql(x, engine, if_exists='append', index=True, index_label=None) 'x‘变量是表的名称，'engine’变量来自这里。 engine = "mssql+pyodbc://MyServerName/MyTableName?driver=SQL Server Native Client 11.0?trusted_connection=yes" 当

浏览 16提问于2021-01-15得票数 0

回答已采纳

1回答

TypeError:难以理解的类型:使用熊猫多指标时的“dict”

python、pandas、dataframe

我尝试在另一个dataframe的顶部添加一个有2行和大约200列的dataframe，但是我得到了TypeError: unhashable type：'dict‘。这是我使用的代码: df是我试图添加到finaldata dataframe的2行和大约200列的第一个dataframe。 finaldata.columns = pd.MultiIndex.from_arrays([df.values[0], finaldata.columns]) 当我使用()类型检查数据格式时，我得到了pandas.core.frame.DataFrame

浏览 2提问于2017-03-27得票数 3

回答已采纳

1回答

如何连接多索引数据中的所有列？

python、pandas、dataframe

我有一个多索引df，我正在尝试连接它。各栏如下： a.columns MultiIndex([( 'Note', '507.3'), ( 'Note', '507.4'), ( 'Note', '507.5'), ( 'Note', '507.6'), ('St

浏览 4提问于2022-05-03得票数 0

回答已采纳

2回答

如何使用嵌套的for循环和熊猫的iloc定位具有1的行和列

python、pandas、dataframe

我对蟒蛇和熊猫比较陌生。我想复制一个战舰游戏。我的目标是定位有1的行和列，并将该位置存储为战舰位置。我创建了一个CSV文件，它看起来如下 col0,col1,col2,col3,col4,col5 0,0,0,0,0,0 0,0,0,0,0,0 0,0,0,0,0,0 0,1,0,0,0,0 0,0,0,0,0,0 0,0,0,0,0,0 这是将创建的CSV文件作为DataFrame读取的代码。 import pandas df = pandas.read_csv('/content/pandas_tutorial/My Drive/pandas/myBattleshipmap.

浏览 3提问于2020-08-13得票数 3

回答已采纳

1回答

按MultiIndex值删除数据行

pandas、indexing、multi-index

从具有布尔组合的DataFrame中，我想删除没有一个索引值为True的行： T000001 T000025 True False 1430.0 False True 301.0 False False 7950.0 将索引项视为布尔数组不起作用： df[~df.index.any()] TypeError Traceback (most recent call last) <ipython-input-35-caeaa0a17799> in <module> --

浏览 0提问于2019-03-06得票数 1

回答已采纳

3回答

熊猫:切片多指标多指标

python、pandas、indexing、slice

我有一个dataframe d，其中包含100,000,000行和3列。看起来是这样的： import pandas as pd In [17]: d = pd.DataFrame({'id': ['a', 'b', 'c', 'd', 'e'], 'val': [1, 2, 3, 4, 5], 'n': [34, 22, 95, 86, 44]}) In [18]: d.set_index(['id', 'val'], inp

浏览 0提问于2019-06-13得票数 4

回答已采纳

1回答

连接两个数据文件并根据条件删除重复行

python、pandas、dataframe、concat

我正在尝试连接两个dataframe，在重复的情况下，我想考虑具有C列最大值的行，我尝试了以下命令： df = pd.concat([df1, df2]).max(level=0) 因此，如果两行对A和B列的值相同，我将只将该行的最大值取为C列。

浏览 1提问于2018-12-13得票数 2

1回答

熊猫数据帧。添加合并所有列的附加行标题

python、excel、pandas、dataframe、xlsxwriter

我想使用pandas dataframe在我的excel中添加一个"second“头。excel有他的值和表头。但是我想在标题上添加一个新的行，只有一列(所有列标题的大小)。和文本居中。如下所示： ? 我该怎么做呢？

浏览 24提问于2021-06-21得票数 2

回答已采纳

2回答

熊猫MultiIndex:在顶部插入一行并隐藏第一级索引

python、pandas

在MultiIndex中： import pandas as pd a = [['a', 'b', 2, 3], ['c', 'b', 5, 6], ['a','c', 8, 9]] df = pd.DataFrame(a, columns=['I1', 'I2', 'v1', 'v2']) df = df.groupby(['I1', 'I2']).first() 我希望在顶部插入一行ex，并隐藏Mul

浏览 7提问于2022-05-20得票数 0

回答已采纳

1回答

在熊猫数据中添加列名(多个索引)

python、pandas、dataframe

浏览 3提问于2020-10-24得票数 2

回答已采纳

2回答

随机丢弃重复

python、pandas

在Pandas中，我们可以使用dataframe.drop_duplicates()删除重复数据，默认情况下保留重复数据的第一行。如果是keep_last = True，则保留最后一行。我们如何保持随机行，并使用熊猫drop_duplicate删除重复行？

浏览 3提问于2014-04-04得票数 5

回答已采纳

4回答

检测数据文件是否有MultiIndex

python、pandas

我正在构建一种将DataFrame解析为与文森特兼容的格式的新方法。这需要一个标准的Index (文森特不能解析MultiIndex)。有没有办法检测熊猫DataFrame是否有MultiIndex？ In: type(frame) Out: pandas.core.index.MultiIndex 我试过： In: if type(result.index) is 'pandas.core.index.MultiIndex': print True else: print False Out: False 如果我没有报价，我就会得到：

浏览 7提问于2014-01-12得票数 22

回答已采纳

2回答

如何将按层次结构命名的列添加到Pandas DataFrame

python、pandas、dataframe、hierarchical-data、multi-index

我有一个空的DataFrame： import pandas as pd df = pd.DataFrame() 我想添加一个按层次结构命名的列。我试过这个： df['foo', 'bar'] = [1,2,3] 但是它给出了一个名称是元组的列： (foo, bar) 0 1 1 2 2 3 我想要的是： foo bar 0 1 1 2 2 3 如果我以这种方式构造一个全新的DataFrame，我可以得到： pd.DataFrame([1,2,3], columns=pd.Mu

浏览 3提问于2016-11-03得票数 2

1回答

向现有数据框添加已分组的列标题

python-3.x、pandas

我们如何在现有的Pandas数据帧中添加两个子列标题之上的补充行上的列标题？搜索结果如下： ? 这是当前的代码，它添加了大写标题，但没有正确定位它。 import pandas as pd OWNER = 'OWNER' CAPITAL = 'CAPITAL' USD = 'USD' CHF = 'CHF' YIELD = 'YIELD AMT' df = pd.DataFrame({ OWNER: 2*['JOE']+3*['ROB'], USD: [

浏览 10提问于2021-04-13得票数 0

2回答

熊猫MultiIndex在0.15.2 ~ 0.18.0之间使用xs与loc的指数结构

pandas、multi-index

在使用.xs和.loc对DataFrame和MultiIndex进行数据切片的结果上，索引结构似乎在v0.15.2 & 0.18.0之间发生了变化。请参考使用不同版本的Pandas的ipython笔记本中的代码片段和输出。 import pandas as pd print 'pandas-version: ', pd.__version__ import numpy as np l1 = ['A', 'B', 'C', 'D'] l2 = sorted(['foo','bar

浏览 0提问于2016-04-06得票数 2

回答已采纳

1回答

编写Pandas multindex数据块的速度慢

python、pandas、dataframe

我有一个大型的for循环，计算了许多变量，最终我想要存储在Pandas多索引数据中。循环的每一步，我都需要写入数据文件的一个片段。数据报有两个行索引和许多列。每个操作都需要写入定义为:所有顶部索引、一个特定第二个索引和一个特定列的切片。下面是该操作的示例。 import numpy as np import pandas as pd n_paths = 1000 pathgrid=np.arange(1, n_paths + 1) dt = 0.25 T = 40 timegrid = np.arange(0, T + dt, dt) multiindex = pd.MultiIndex.fr

浏览 4提问于2021-01-28得票数 0

回答已采纳

1回答

在输出多头熊猫数据时去掉索引以实现excel

python-3.x、pandas

我有一只熊猫的资料如下： header = [np.array(['location','location','location','location2','location2','location2']), np.array(['S1','S2','S3','S4','S5','S6'])] df = pd.DataFrame(np.random.randn(5, 6), columns = hea

浏览 2提问于2019-03-04得票数 3

3回答

如何在连接后添加一行以提及数据文件的名称？

python、pandas、dataframe

我有3个相同格式的数据格式。然后我把它们水平地组合起来我想添加一行来表示每个数据的名称，即，通过将数据复制到MS并手动添加行，我获得了上面的表单。在Python中是否有直接用于显示的方法？ import pandas as pd data = {'Name': ['Tom', 'Joseph'], 'Age': [20, 21]} df1 = pd.DataFrame(data) data = {'Name': ['John', 'Kim'

浏览 5提问于2022-02-25得票数 1

回答已采纳

1回答

熊猫到Excel (合并的标题列)

python、excel、pandas

我希望将df转换为excel工作表，但也希望添加标题列来对所有列进行分类。用于复制： import pandas as pd # Create a Pandas dataframe from some data. df = pd.DataFrame({'Data': [10, 20, 30, 20, 15, 30, 45]}) # Create a Pandas Excel writer using XlsxWriter as the engine. writer = pd.ExcelWriter('pandas_simple.xlsx',

浏览 0提问于2018-12-10得票数 9

回答已采纳

2回答

pandas DataFrame仅打印一次索引值

python、pandas、dataframe

import pandas as pd li = [{"employee_id":1,"project_handled": "pas"},{"employee_id":1,"project_handled": "asap"},{"employee_id":2,"project_handled": "trimm"},{"employee_id":2,"project_handled": "fat"}] df

浏览 0提问于2018-04-13得票数 2

2回答

在带有索引和列的pd.DataFrame中选取元素

python、pandas

我有一个像这样的pandas.DataFrame B1 B2 B3 A1 0 1 2 A2 3 4 5 还有index=pd.Index(['A2', 'A1'])和columns=pd.Index(['B2', 'B3'])。我想得到的是[4, 2]，也就是A2-B2和A1-B3中的元素。在pandas中有没有一个聪明的内置操作来实现这一点？我用不同的表达方式搜索了一段时间，但没有任何线索。可能会有重复的问题，对于这种情况很抱歉。谢谢你来看这个。

浏览 47提问于2021-07-06得票数 1

3回答

熊猫DataFrame删除元组或列列表

python、list、pandas、tuples

当对一个drop使用pandas.DataFrame方法时，它接受列名列表，但不接受元组，尽管说"list-like“参数是可以接受的。我是否不正确地阅读文档，因为我希望我的MWE工作。 MWE import pandas as pd df = pd.DataFrame({k: range(5) for k in list('abcd')}) df.drop(['a', 'c'], axis=1) # Works df.drop(('a', 'c'), axis=1) # Errors 版本--使用Pyth

浏览 4提问于2017-08-17得票数 2