使用pandas连接多索引列_pandas多索引数据帧条件列连接_pandas列的多索引 - 腾讯云开发者社区

python、python-3.x、pandas

我有一张格式很差的excel表格。我想要使用的实际列名是跨两行的；例如，如果正确的列名应该是Labor Percent，则单元格A1将包含Labor，单元格A2将包含Percent)。我尝试加载文件，下面是我正在做的事情： import os os.getcwd() os.chdir(r'xxx') import pandas as pd file = 'problem.xls' xl = pd.ExcelFile(file) print(xl.sheet_names) df = xl.parse('WEEKLY NUMBERS', sk

浏览 2提问于2018-03-29得票数 0

1回答

将数据帧的标头设置为.csv导出的首行

python、pandas

我希望excel文件的第一行是数据帧的标题。(header=0做到了这一点) 当数据帧保存为.csv时，我希望标头位于.csv的第1行，就像它们在原始.csv中一样(这是我在实现时遇到的困难) 我已经尝试将.to_csv的header=设置为None或0，但都没有使头文件成为.to_csv文件的第1行。我现在正在尝试将第0行设置为df1并将其与df连接，但我得到了一个‘第一个参数必须是可迭代的pandas对象，你传递了一个类型为“Series”的对象。’ 有谁能提供一些关于如何实现这一点的见解，或者是否有更简单的方法？ import pandas as pd data = pd.read_

浏览 2提问于2021-11-09得票数 2

2回答

python面板通过丢失列名进行分组

python-3.x、pandas-groupby

有3列， ACCOUNT, DATE, AMOUNT 我正在尝试在pandas中做以下事情，并计划在group by output dataframe之后使用"sum“列来做更多的工作： df_group_by=df.groupby('account').agg({'amount': [np.size, np.sum]},as_index=False).reset_index() # equal to "SELECT ACCOUNT, SUM(amount) as sum FROM table GROUP BY ACCOUNT;" pr

浏览 1提问于2018-07-18得票数 0

1回答

如何强迫大熊猫数据栏成为正常索引

python、pandas、dataframe

我从字典中创建了一个DataFrame。我希望将键用作索引，将值用作单个列。到目前为止，这就是我所做的： import pandas as pd my_counts = {"A": 43, "B": 42} df = pd.DataFrame(pd.Series(my_counts, name=("count",)).rename_axis("letter")) 我得到以下信息： count letter A 43 B 42 问题是，我想(用pd.concat)将其与具有相

浏览 0提问于2018-01-19得票数 2

回答已采纳

1回答

Pandas中来自Dataframe行的Dataframe列

python、numpy、pandas、merge

我有两只熊猫DataFrames。我想将其他dataframe的行作为列添加到另一列中。我试着阅读了合并、加入和连接文档，但无法理解如何在Pandas中实现这一点。下面是我如何通过转换成numpy数组来做到这一点，但是在Pandas中肯定有一种聪明的方法可以做到这一点。 import pandas as pd import numpy as np df1 = pd.DataFrame(np.random.normal(size=8).reshape(4,2),index=[1,2,3,4],columns=['a','b']) df2 = pd.DataFr

浏览 2提问于2014-11-21得票数 1

回答已采纳

3回答

pandas read_csv index_col=None不使用每行末尾的分隔符

python、pandas

我正在阅读“Python for Data Analysis”这本书，但在“Example: 2012联邦选举委员会数据库”部分将数据读取到DataFrame时遇到了问题。问题是其中一列数据总是被设置为索引列，即使index_col参数设置为None也是如此。下面是指向数据的链接：。下面是加载代码(为了节省检查时间，我设置了nrows=10)： import pandas as pd fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None) 为了保持简短，我排除了数据列输出，但以下是我的输出(请不要使用索引

浏览 2提问于2012-10-19得票数 63

回答已采纳

3回答

熊猫可以使用多个索引的一列

python、pandas、concat

我正在尝试加入新的数据，在多个索引的一个列的每个值中都有一个值。一个基本的例子是： data = io.StringIO('''Fruit,Color,Count,Price Apple,Red,3,$1.29 Apple,Green,9,$0.99 Pear,Red,25,$2.59 Pear,Green,26,$2.79 Lime,Green,99,$0.39 ''') df_unindexed = pandas.read_csv(data) df = df_unindexed.set_index(['Fruit', '

浏览 0提问于2018-12-06得票数 2

回答已采纳

1回答

Pandas/Python中的Vectorized :作为一个新的dataframe循环遍历每个股票，还是将其全部放在一个dataframe中？

python、pandas、dataframe、loops、finance

我一直试图在Pandas/Python中构建我自己的简单的矢量化回溯测试器，以创建一种简单的方法来测试一些交易策略。我一直在使用这个作为指南，它非常有用。我想做一个简单的投资组合回溯测试，比如10只股票/ETF。对于每只股票，我将有一个数据，它将有一个日期作为一个行索引和列将是开放，高，低，收盘价为该日期(金融时间序列数据)。因此，我将有10个这样的数据文件，每列4列。做回溯测试的最有效的方法是什么：对每个数据进行单独的工作，通过循环并对每个数据进行我的计算，然后总结最后的利润。或将所有数据文件连接在一起，并只处理一个数据文件。在我一直使用的示例文章中，他只使

浏览 0提问于2021-06-30得票数 0

2回答

如何将具有多个索引的pandas.core.series.Series对象转换为填充了所有列的pandas Dataframe？

python、pandas、dataframe、pandas-groupby

我有一个具有多个索引的熊猫系列，就像这个图像"target"，"Lastnewjob"，"experienceGroup“。这是pandas.core.series.series类型。我想把它转换成一个数据帧(第二张图)，其中"experienceGroup“值将是列名，而"target"，"Lastnewjob”仍然是列。我想要查看的数据帧使用groupby获取序列的代码。 Job=df.groupby(['target','last_new_job'])['

浏览 1提问于2021-01-26得票数 0

1回答

Pandas通过多索引提取数据

python、pandas、multi-index

我正在把网站上的following data读成DataFrame。我使用以下脚本擦除数据： import pandas as pd fpath = r'https://www.apra.gov.au/annual-fund-level-superannuation-statistics' xl_data = pd.read_excel(fpath,sheet_name=['Table 3','Table 9']) returns = xl_data['Table 3'] returns.columns = returns.

浏览 19提问于2019-12-03得票数 0

1回答

pandas中的groupby打乱了行索引

python、pandas

我有一个包含三列的pandas df，purchase_day，customer_name，products_purchased。我想返回每个顾客访问商店的天数的数组。所以我用了 gpd = df.groupby(by=['customer_name', 'purchase_day']).count() 它返回一个如下所示的表：不幸的是，对于这个返回的表，我不能对它运行groupby，因为它的格式不常见( customer_name和purchase_days不在第一行，而在第二行)。有什么建议可以让我计算一下每个顾客访问商店的purchase_da

浏览 12提问于2017-02-21得票数 0

1回答

统计每个pandas列中数据出现的次数

python、python-3.x、pandas

我有以下数据帧： import pandas as pd df = pd.DataFrame({"E": ["X", "Y", "X", "X", "Y", "X"], "F": ["Y", "Y", "X", "Y", "X","Y"], "G": ["Y", "X", "X", "X", &

浏览 8提问于2018-07-29得票数 2

回答已采纳

1回答

使用pandas中的索引列查看或过滤？

python、pandas

使用Python的pandas库，我导入了一个csv并将多个列设置为我的索引。出乎意料的是，当我显示数据帧时，索引列不再存在，并且我不能使用索引列作为过滤器选项。这让我想知道我是否错误地认为pandas索引类似于SQL索引。 date, exchange, symbol, low, high, open, close, last exchange和symbol足以唯一标识一行。它是加快了查找速度，还是添加了一些对stack/unstack/pivot/groupby之类的东西有用的语义信息？它能减少内存使用量吗？为什么要将日期、交换和符号移出数据帧(并移到索引系列中？)？把它们留在dat

浏览 1提问于2014-09-19得票数 0

4回答

Python中的DataFrame切片失败

python、python-3.x、pandas、dataframe、slice

我想用Python分割我的数据。切片数据的基本任务会给我带来意想不到的错误。我的代码是： import pandas as pd test_file = pd.read_csv("C:/Users/Lenovo/Desktop/testfile.csv") test_select = test_file[["Category", "Shop"]] print(test_select[1,1]) 代码print(test_select[1,1])应该显示第二列的第二行。错误信息： pandas._libs.hashtable.PyObjec

浏览 0提问于2018-12-15得票数 1

回答已采纳

1回答

如何为pandas中的多索引切片赋值

python、pandas

import pandas as pd import numpy as np df = pd.DataFrame(np.zeros([4,1]), index=pd.MultiIndex.from_product([[0,1], ['a','b']])) df.loc[(slice(None), 'a'), 0] = pd.Series({1:2, 0:3}) df 给出我找到了几个建议将.values添加到右侧的地方，但这给出了错误的结果(它切换了2和3，因为我故意将右侧的序列放在“错误”的顺序中)，因为我确实需要pandas为我

浏览 0提问于2021-02-01得票数 0

1回答

Pandas如何在不丢失列标题的情况下连接两个数据帧

python、pandas

我有以下玩具代码： import pandas as pd df = pd.DataFrame() df["foo"] = [1,2,3,4] df2 = pd.DataFrame() df2["bar"]=[4,5,6,7] df = pd.concat([df,df2], ignore_index=True,axis=1) print(list(df)) 输出：[0,1] 预期输出：[foo,bar] (顺序并不重要) 如果我能保证两个数据帧的标题是唯一的，有没有办法在不丢失原始列标题的情况下连接两个数据帧呢？我想到了遍历这些列，然后

浏览 1提问于2017-04-14得票数 16

回答已采纳

1回答

对具有相同列、不同索引级别的DataFrames进行运算和对齐

python、pandas

我有两只熊猫DataFrames - weight有一个简单的索引Land Use列。concentration在Land Use和Parameter上有一个MultiIndex。 import pandas from io import StringIO conc_string = StringIO("""\ Land Use,Parameter,1E,1N,1S,2 Airfield,BOD5 (mg/l),0.418,0.118,0.226,1.063 Airfield,Ortho P (mg/l),0.002,0.001,0.001,0.002 Airfiel

浏览 0提问于2012-12-19得票数 5

回答已采纳

1回答

是什么改变了这个pandas代码中的日期类型？

python、pandas、datetime

我在Pandas中有一个数据框，其中包含日期和其他一些数据。日期是显式的datetime.date类型。在本例中，我手动强制执行此操作。在实际问题中，框架是从已经设置好的外部源导入的。在操作索引之后，我发现我的dates属于pandas._libs.tslib.Timestamp类，这会导致与后面的代码不兼容。是什么导致了类型/类的变化？最小工作示例(注意第3行和第7行之间的区别)： In [1]: df = pd.DataFrame({'date' : ['02/20/2015','01/15/2016','08/21/2015

浏览 9提问于2019-07-10得票数 1

回答已采纳

2回答

熊猫HDFStore表不接受多索引列

python、pandas、pytables

这样做很好： cols = ['X', 'Y'] ind = [('A', 1), ('B', 2)] ind = pd.MultiIndex.from_tuples(index, names=['foo', 'number']) df = pd.DataFrame(rand(2,2), columns = cols, index=ind) store.put('df', df, table=True) print store['df']

浏览 2提问于2014-01-02得票数 2

回答已采纳

1回答

熊猫多索引在给出一个元组时成功，但在列表中失败。

python、pandas、numpy、dataframe

我有一个列表数组的形式的数据，表单[['Manhattan', 142, 42], [...]]。我有一个包含多个索引的pd.DataFrame，其中包含一个名为VAC的列。下面引发一个ValueError for vac_bbl in vac_bbls: property_profiles['VAC'][vac_bbl] = None 回溯： --------------------------------------------------------------------------- ValueError

浏览 2提问于2016-07-11得票数 2

回答已采纳

1回答

AttributeError中可能存在的to_sql错误

python、sql、pandas

我不确定 (熊猫0.13.1)的这种行为是否是有意的。当我在没有列名的情况下创建一个dataframe，并尝试在sql db中写入 dfi = DataFrame(randn(3, 10)) dfi.to_sql(name = to_table, con=connection, flavor='mysql', if_exists='replace') 我得到以下错误： /usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-package

浏览 2提问于2014-04-09得票数 1

回答已采纳

1回答

在Python中合并具有数百万行的两个表

python、join、merge、pandas、pytables

我正在使用Python进行一些数据分析。我有两个表，第一个(让我们称它为'A')有1000万行和10列，第二个('B')有7300万行和2列。它们有一个具有公共ids的列，我想基于该列使这两个表相交。特别是，我想要表的内部连接。我无法将表B作为pandas数据帧加载到内存中，以便在pandas上使用正常的合并功能。我尝试在块上读取表B的文件，将每个块与A相交，并将这些交集连接起来(从内部连接输出)。这在速度上是可以的，但有时这会给我带来问题，并导致分段错误……不，太棒了。这个错误很难重现，但它发生在两台不同的机器上(Mac、OS、X、v10.6(雪豹)和UNI

浏览 0提问于2013-01-31得票数 13

回答已采纳

2回答

如何将按层次结构命名的列添加到Pandas DataFrame

python、pandas、dataframe、hierarchical-data、multi-index

我有一个空的DataFrame： import pandas as pd df = pd.DataFrame() 我想添加一个按层次结构命名的列。我试过这个： df['foo', 'bar'] = [1,2,3] 但是它给出了一个名称是元组的列： (foo, bar) 0 1 1 2 2 3 我想要的是： foo bar 0 1 1 2 2 3 如果我以这种方式构造一个全新的DataFrame，我可以得到： pd.DataFrame([1,2,3], columns=pd.Mu

浏览 3提问于2016-11-03得票数 2

1回答

Pandas将行组合为标题信息

python-3.x、pandas、dataframe、multi-index

这就是我如何使用pandas读取和创建数据帧 def get_sheet_data(sheet_name='SomeName'): df = pd.read_excel(f'{full_q_name}', sheet_name=sheet_name, header=[0,1], index_col=0)#.fillna(method='ffill') df = df.swapaxes(axis

浏览 95提问于2021-11-22得票数 0

回答已采纳

1回答

Python/Pandas:执行groupby应用时的意外索引

python、pandas

我在Python3上使用Pandas和Numpy，其版本如下： Python 3.5.1 (通过Anaconda 2.5.0) 64位熊猫0.19.1 Numpy 1.11.2 (可能与此无关) 下面是产生问题的最小代码： import pandas as pd import numpy as np a = pd.DataFrame({'i' : [1,1,1,1,1], 'a': [1,2,5,6,100], 'b': [2, 4,10, np.nan, np.nan]}) a.set_index(keys='a

浏览 3提问于2017-02-07得票数 4

回答已采纳

1回答

如何连接多索引数据中的所有列？

python、pandas、dataframe

我有一个多索引df，我正在尝试连接它。各栏如下： a.columns MultiIndex([( 'Note', '507.3'), ( 'Note', '507.4'), ( 'Note', '507.5'), ( 'Note', '507.6'), ('St

浏览 4提问于2022-05-03得票数 0

回答已采纳

1回答

Pandas多索引数据帧合并问题

python、pandas、dataframe、merge、multi-index

我想合并两个数据帧，df1和df2，它们有多个索引列： mi1 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2018')], names=['variable', 'year']) mi2 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2019')], names=['variable', 'yea

浏览 61提问于2020-12-15得票数 0

回答已采纳

3回答

pandas DataFrame对角线

python、numpy、pandas

求正方形DataFrame对角线的有效方法是什么？我期望得到的结果是一个具有两个级别的MultiIndex的Series，第一个级别是DataFrame的索引，第二个级别是DataFrame的列。设置 import pandas as pd import numpy as np np.random.seed([3, 1415]) df = pd.DataFrame(np.random.rand(3, 3) * 5, columns = list('abc'), index = list('ABC

浏览 3提问于2016-05-19得票数 34

回答已采纳

2回答

从Pandas数据帧中的字符串系列中获取总单词数

python、pandas

我有一个由tweet组成的2列Pandas数据框架:第二列是tweet本身。我想把所有的推文都算起来。数据框架如下所示： RT @PaulHaleAndMom: Four Hours After #Piedmont... RT @NatPoliceAssoc: Body camera video shows At... RT @XLNB: When Spanish Drake and Jamaican Drak... I almost cried this morning. My babies are ... @SebastianDanzig Hey Bassy are ticket

浏览 0提问于2018-08-08得票数 4

回答已采纳

2回答

具有多级列的Pandas数据帧:重命名特定级别的列，使其与另一级别相同

python、pandas、rename

对于这个看似混乱的标题，我很抱歉。我正在使用Pandas读取Excel数据。但是，原始Excel数据具有多行标题，并且某些单元格被合并。它看起来有点像这样： ? 它在我的Jupyter Notebook中显示如下 ? 我的计划是只将第二级作为我的列名，并删除level0。但是原始数据有大约15列，显示为"Unnamed..."，我想知道在删除level0列名之前是否可以重命名这些列。所需的输出如下所示： ? 我可能会重复这样做，所以我没有先将它保存为CSV，然后在Pandas中读取它。现在，我花了比我愿意承认的更长的时间来修复列名。我想知道是否有一种方法

浏览 7提问于2020-04-09得票数 1

回答已采纳

2回答

熊猫:分组和总和数据，同时增加最小和最大年。

python、pandas、dataframe

请考虑以下数据： import pandas as pd from pandas import DataFrame df = pd.DataFrame({'ID': ['A','A','A','B','B','B','C','C','C'], 'YEAR': [2000,2001,2002,2007,2008,2009,2015,2016,2017], 'ITEM-A'

浏览 7提问于2022-02-21得票数 1

回答已采纳

1回答

从系列中获取信息的Python熊猫多索引

python、pandas、multi-index

我从一个时刻表中创建了一个多索引熊猫系列，现在我想要阅读其中的数据。在我看到的所有示例中，本系列的列或级别都是命名的。然而，在我的系列文章中，情况并非如此。在这个多重索引中，第一级是日期，第二级是一天中的小时。数据列具有我想要读取的值。从我的系列中获取我想要的数据的最简单的方法是什么？下面的代码应该是非常清楚的。 import pandas as pd import numpy as np n = 1000 t = pd.date_range(start ='2012-01-01', periods=n, freq='10T')

浏览 2提问于2015-04-08得票数 1

回答已采纳

1回答

在pandas库中转换要用于PCA的Image数组

python、pandas、opencv、pca、mat

我正在尝试对一幅图像执行PCA，然后输出一个图像，其中的像素根据它们在PCA中所处的聚类进行着色。我在做无监督PCA。终极目标可通过以下链接查看：我目前正在使用pandas库(如果人们有其他更好的解决方案，我洗耳恭听)，同时也对图像处理开放。我试图加载b，g，r波段作为我的列，索引是一个像素，给出一个表，其中包含图像中所有像素的行(每个像素都有一列表示色带)。当填充数据时，我的图像中最终有300万个以上的像素，我让它填充，但对于每个像素来说，这需要大约5秒的时间，所以无法判断我的操作是否正确。有没有更好的方法？另外，如果人们知道如何使用PCA处理图像，我将非常感激。代码： import

浏览 2提问于2018-08-17得票数 0

回答已采纳

1回答

来自numpy数组的SFrame

python、numpy、pandas、dataframe、sframe

我想从NumPy数组创建一个。我特别想要的是： np.arange(16).reshape(4, 4) => +----+----+----+----+ | 0 | 1 | 2 | 3 | +----+----+----+----+ | 0 | 1 | 2 | 3 | | 4 | 5 | 6 | 7 | | 8 | 9 | 10 | 11 | | 12 | 13 | 14 | 15 | +----+----+----+----+ [4 rows x 4 columns] 如果我这样做了： print SFrame(np.arange(16).reshape

浏览 8提问于2016-07-26得票数 1

2回答

pandas在执行groupby并保留选择性列后重置索引

python、pandas

我想要取一个pandas数据帧，按列计算唯一元素，并保留其中的2列。但是我在groupby之后得到了一个多索引数据帧，我不能(1)展平(2)只选择相关列。下面是我的代码： import pandas as pd df = pd.DataFrame({ 'ID':[1,2,3,4,5,1], 'Ticker':['AA','BB','CC','DD','CC','BB'], 'Amount':[10,20,30,40,50,60], 'Date_

浏览 1提问于2018-09-14得票数 4

回答已采纳

2回答

pandas read_sql未读取所有行

pandas、sqlalchemy

我正在通过pandas的read_sql和一个外部应用程序(DbVisualizer)运行完全相同的查询。 DbVisualizer返回206行，而pandas返回178行。我试着根据上提供的信息逐个读取熊猫的数据，结果没有什么变化。造成这种情况的原因是什么，以及补救方法是什么？查询： select * from rainy_days where year=’2010’ and day=‘weekend’ 这些列包括:日期、年份、工作日、当天的雨量、温度、geo_location (每个位置的行数)、风量测量结果、前一天的雨量等。确切的python代码(减去连接细节)是： import

浏览 2提问于2016-03-07得票数 6

2回答

在pandas中向特定级别的透视表中添加列

python、pandas、pivot-table

我正在尝试使用pandas数据透视表来实现这种多索引形式。 ? 因为原始数据是这样的。 ? 我使用下面的代码table = pd.pivot_table(df, index=str(df.columns[0]), columns =list(df.columns[1:4]), values='Value')来获得这个结果 ? 但是现在我需要将这三列(预测，公差，基线预测)添加到每个子产品的透视表的最详细级别，就像在ECo下添加它们一样，我尝试了这个table[('OcP', 'CoC', 'tolerance'

浏览 51提问于2021-11-10得票数 1

回答已采纳

1回答

为数据帧创建多-Column索引

pandas、dataframe、multiple-columns、multi-index

是否可以将单级列数据帧更改为多列数据帧？如果我们有这样的数据帧， import pandas as pd df = pd.DataFrame({ 'a': [0, 1, 2, 3], 'b': [4, 5, 6, 7], 'c': [3, 5, 6, 2], 'd': [1, 5, 7, 0], }) 我们可以像下面这样更改它的列名吗？所以，简单地说，我尝试做的是在不改变数据帧的值的情况下拥有2级的列索引。 A B a b c d 0 0

浏览 10提问于2021-02-03得票数 0

回答已采纳

1回答

mysql通过建议定义索引

mysql、indexing

我有一个php/mysql应用程序，我有在我的项目中的所有行动的所有选择查询的日志。我想知道有没有可能得到任何关于select x, y from t1 where (con1 AND con2) OR con3 order by colx的建议，即哪些列必须被索引到我的日志中？我有很多这样的查询，也有连接。我听说EXPLAIN可以帮助我为这个查询建议哪些列必须是索引。我想知道怎样才能知道哪些列必须是索引。多列索引、单列索引。order by需要被索引等等。

浏览 1提问于2012-08-09得票数 0

2回答

使用多列调用set_index时，datetime.date值将转换为pd.tslib.Timestamps

python、pandas、dataframe、python-datetime

作为标题，熊猫在执行datetime.date时强制将set_index类型转换为set_index类型，但前提是索引中有多个列。这使得使用和合并不同的框架成为一个问题，因为有些以时间戳结束，而另一些则停留在datetime.dates。超级简单的例子： df = pd.DataFrame({'date':[datetime.date(2021,3,3),datetime.date(2021,3,4)],'player':['a','b'],'score':[10,9]}) print(type(df['

浏览 0提问于2021-03-16得票数 1

回答已采纳

1回答

ValueError:索引具有重叠值

python、pandas

我应该加入两个部分重叠列名的pandas DataFrames：Col1，Col2。其他列不重叠。我得到以下错误： ValueError: Indexes have overlapping values: Index(['Col1','Col2'] 连接过程如下所示： df1.join([df2], how='inner') 当然，我可以手动从DataFrames中删除Col1和Col2。但我想知道是否有更好的解决方案。我使用的是熊猫版的0.25。我正在搜索类似这样的东西(或者其他可以避免手动删除列的选项)： df1.join([df2],

浏览 27提问于2019-11-29得票数 0

1回答

在jupyter笔记本中从熊猫数据中选择单行时发生的Python键错误

python-3.x、pandas、dataframe、jupyter-notebook

我成功地用StackOverflow解决了许多问题，但这是我第一次在其他地方找不到问题，自己也解决不了. 我在jupyter笔记本上工作，里面有熊猫的数据，包括文字评论和亚马逊产品的评分。下面是我的代码： import pandas as pd data = pd.read_csv("AmazonSampleForStudentOffice.csv") reviews = data[['reviewText', 'score', 'len_text']] reviews.head(5) 其结果是： reviewText scor

浏览 0提问于2020-03-31得票数 1

回答已采纳

1回答

基于缺少列名的熊猫DataFrame切片错误

python、pandas、dataframe、reindex

我有一个包含多个索引和列的熊猫dataframe，我想根据某些列名对这个数据进行切片，但是有时给定的列名不在dataframe中。熊猫提出了使用.reindex而不是.loc的警告，但我发现了奇怪的结果。为了澄清，让我们加载dataFrame import pandas as pd d2 = pd.read_csv('https://docs.google.com/uc?id=1Ufx6pvnSC6zQdTAj05ObmV027fA4-Mr3&export=download', index_col=[0,1]) d2.head(3) 结果是： .............

浏览 4提问于2018-01-08得票数 4

回答已采纳

1回答

matplotlib:在dataframe行上绘制一条迭代行

python、pandas、matplotlib

在玩具例子dataFrame中有2组坐标: x，y和ex，ey。 d = {'x': [1, 2, 3, 4], 'y': [3, 3, 3, 3], 'ex': [1, 2, 3, 4], 'ey': [6, 6, 6, 6]} toy = pd.DataFrame(data=d) 每组都需要先绘制分散图，然后用一条线连接起来。 plt.scatter(toy['x'],toy['y'], color='b') plt.scatter(toy['ex'],toy[&

浏览 0提问于2018-11-01得票数 0

1回答

Python -重构Dataframe，将列名移动到行，重新构造dataframe

python、pandas、dataframe、reshape、reindex

我需要将df1转换为df2： import pandas as pd from pandas import DataFrame, Series import numpy as np df1 = pd.DataFrame(index=['date_1', 'date_2', 'date_3'], columns=["A_count", "A_dollar", "B_count", "B_dollar"], data=[[1

浏览 6提问于2017-04-04得票数 1

回答已采纳

1回答

在Pandas DataFrame样式中有使用CSS列组合器的方法吗？

python、css、pandas-styles

我使用的是Pandas DataFrame模板，并希望其他列(基于多个索引的第一层而不是硬代码)都具有灰色背景。我知道，使用CSS，您可以使用列组合器来表示如下 Th:nth-child(2n) || td 但它似乎与熊猫的造型不兼容。在我的DataFrame中，将多个索引的0级作为月份，然后将级别1作为其他列。最终目标是以某种方式每隔一个月强调一次。任何帮助都将不胜感激。

浏览 12提问于2021-07-07得票数 0

回答已采纳

1回答

使用熊猫将多个csv文件连接到一个文件夹中[MemoryError:]

python、pandas

我在一个文件夹中有5个csv文件，在这里我想将每个csv文件中的所有列连接到一个dataframe中。当我只加入2个csv文件时，它工作得很好，但是当我想加入5个csv文件时，我遇到了一个错误。我的代码如下： In [7]: import pandas import os import numpy as np import glob path =r'D:/PreprocessingITRC/output/All/' allFiles = glob.glob(path + "/*.csv") dataframe = pandas.DataFrame() for

浏览 4提问于2015-04-20得票数 2

回答已采纳

1回答

如何计算pandas多索引DataFrame中的分位数？

python、pandas

我有一个pandas多索引DataFrame，我想计算它在特定索引级别上的分位数。最好用一个例子来解释。首先，让我们创建DataFrame： import itertools import pandas as pd import numpy as np item = ('A', 'B') item_type = (0, 1, 2) location = range(5) idx = pd.MultiIndex.from_tuples(list(itertools.product(item, item_type, location)),names=('

浏览 5提问于2016-04-07得票数 5

1回答

熊猫组合多个数据或用作更新

python、pandas

是否有一种基于索引和列的连接、连接或合并数据格式的方法？例如，假设我有一个数据格式列表，并且我想要类似于 df = pandas.fullConcat(dfList) 其中，df.index应该是dfList、('outer' join)和df.columns中索引的结合，而df.columns也应该是dfList中列的联合。我认为所有的concat、join和merge方法都只是在索引或列上进行连接。我想解决方法是堆栈/解堆栈还是reset_index？我错过了什么吗？

浏览 1提问于2013-02-22得票数 0

回答已采纳

2回答

在Pandas中将列连接为索引

python、pandas

我正在将一个文本文件导入到pandas中，并希望将该文件中的3列连接起来以建立索引。我愿意在一个或多个步骤中做到这一点。我可以在创建DataFrame的同时进行转换，也可以创建DataFrame并用新创建的列重新构造它。知道如何使用这两种方法对我来说是最有帮助的。我最终希望索引是连接前3列中的值的值。

浏览 2提问于2013-07-24得票数 9

回答已采纳