如何使用pandas中的其他值重命名多索引索引值？_获取多索引pandas中的日期索引值_如何更改多索引Pandas数据帧中的索引值？ - 腾讯云开发者社区

indexing、pandas、nan

我读到NaNs是有问题的，但下面这些会导致我的数据实际损坏，而不是错误。这是一个bug吗？我是否遗漏了文档中的一些基本内容？我希望第二个命令给出一个错误，或者给出与第一个命令相同的响应： ipdb> df year PRuid QC data 18 2007 nonQC 0 8.014261 19 2008 nonQC 0 7.859152 20 2010 nonQC 0 7.468260 21 1985 10 NaN 0.861403 22 1985 11 NaN 0.878531 23 1985

浏览 0提问于2013-05-13得票数 1

回答已采纳

1回答

如何为pandas中的多索引切片赋值

python、pandas

import pandas as pd import numpy as np df = pd.DataFrame(np.zeros([4,1]), index=pd.MultiIndex.from_product([[0,1], ['a','b']])) df.loc[(slice(None), 'a'), 0] = pd.Series({1:2, 0:3}) df 给出我找到了几个建议将.values添加到右侧的地方，但这给出了错误的结果(它切换了2和3，因为我故意将右侧的序列放在“错误”的顺序中)，因为我确实需要pandas为我

浏览 0提问于2021-02-01得票数 0

2回答

Pandas将数据插入MySQL

python、python-2.7、pandas、csv、mysql-python

我尝试使用Pandas (Python)将我从.csv文件中提取的数据列插入到MySQL中。以下是我到目前为止拥有的代码。 import pandas as pd from pandas.io import sql from sqlalchemy import create_engine engine = create_engine('mysql://username:password@localhost/dbname') with engine.connect() as conn, conn.begin(): df = pd.read_csv('File.csv&

浏览 1提问于2017-07-25得票数 7

回答已采纳

1回答

如何向grouped by数据透视表Pandas中的列添加条件

python、pandas、dataframe、pivot、pandas-groupby

我使用了pandas包中的group by和pivot table来创建下面的表：输入： q4 = q1[['category','Month']].groupby(['category','Month']).Month.agg({'Count':'count'}).reset_index() q4 = pd.DataFrame(q4.pivot(index='category',columns='Month').reset_index()) 然后输出： categ

浏览 1提问于2018-09-23得票数 0

2回答

使用python将键值分散到多个列中。

python、pandas、dataframe

我正在尝试将df转到df_spread中。 import pandas df = {"Type": ("A", "B", "B", "C","D"), "Amount":(220, 68, 1400, 120, 99) } df = pandas.DataFrame(df) 我想要的输出是这样的： df_spread = {"A": 220, "B": 68, "B": 1400, "C": 120,

浏览 4提问于2022-05-25得票数 1

回答已采纳

1回答

将数据帧的标头设置为.csv导出的首行

python、pandas

我希望excel文件的第一行是数据帧的标题。(header=0做到了这一点) 当数据帧保存为.csv时，我希望标头位于.csv的第1行，就像它们在原始.csv中一样(这是我在实现时遇到的困难) 我已经尝试将.to_csv的header=设置为None或0，但都没有使头文件成为.to_csv文件的第1行。我现在正在尝试将第0行设置为df1并将其与df连接，但我得到了一个‘第一个参数必须是可迭代的pandas对象，你传递了一个类型为“Series”的对象。’ 有谁能提供一些关于如何实现这一点的见解，或者是否有更简单的方法？ import pandas as pd data = pd.read_

浏览 2提问于2021-11-09得票数 2

1回答

选择具有多级索引的特定行

python-3.x、pandas

我正在DataCamp学习Python，在那里我正在学习一门名为“熊猫数据操作”的课程。在一个练习中，我想从一个数据框架中选择一些行，但是我得到了一个错误，我真的不理解错误的信息。这是代码 # Load packages import pandas as pd # Import data sales = pd.read_pickle("https://assets.datacamp.com/production/repositories/5386/datasets/b0e855c644024f850a7df3fe8b7bf0e23f7bd2fc/walmart_sales.pkl

浏览 3提问于2020-03-12得票数 0

回答已采纳

2回答

更改大熊猫索引栏文本

excel、pandas

我带了下面的电子表格给熊猫看：我进口它时： import pandas as pd df = pd.read_excel("sessions.xlsx") 朱庇特像这样展示了它：然后，我将数据传输到 df = df.T 这导致了这个在这个阶段，我现在如何更改最左边索引列中的文本？我想将单词Day更改为服务，但我不知道如何处理该单元格/标头。我不能引用第0列并为此更改标题。同样地，我如何继续修改A，B，C，D文本，它现在是索引列？

浏览 1提问于2019-02-20得票数 0

2回答

在Ubuntu16.04上，熊猫重命名文档的示例不起作用

python、pandas、ubuntu-16.04

我正在尝试复制中的示例。 s = pd.Series([1,2,3]) s.rename("test") 这会抛出错误 Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python2.7/dist-packages/pandas/core/series.py", line 2264, in rename return super(Series, self).rename(index=i

浏览 1提问于2016-12-01得票数 0

回答已采纳

2回答

如何根据列值在dataframe中将单个行拆分为多行？

python、pandas

我有一个dataframe(如下所示)，我需要根据值列中的条件将每一行分解为几行，以便将来进行枢轴分析。(条件:如果列为空，则跳过) 原始数据： ID name apple pear banana 01 xyz 10 3 02 abc 9 10 5 03 def 8 9 04 fds 5 所需数据： ID Attribute1 Name value 01 xyz apple 10

浏览 0提问于2019-04-03得票数 0

回答已采纳

2回答

将2行连接为标题/列名称

python、python-3.x、pandas

我有一张格式很差的excel表格。我想要使用的实际列名是跨两行的；例如，如果正确的列名应该是Labor Percent，则单元格A1将包含Labor，单元格A2将包含Percent)。我尝试加载文件，下面是我正在做的事情： import os os.getcwd() os.chdir(r'xxx') import pandas as pd file = 'problem.xls' xl = pd.ExcelFile(file) print(xl.sheet_names) df = xl.parse('WEEKLY NUMBERS', sk

浏览 2提问于2018-03-29得票数 0

2回答

熊猫:分组和总和数据，同时增加最小和最大年。

python、pandas、dataframe

请考虑以下数据： import pandas as pd from pandas import DataFrame df = pd.DataFrame({'ID': ['A','A','A','B','B','B','C','C','C'], 'YEAR': [2000,2001,2002,2007,2008,2009,2015,2016,2017], 'ITEM-A'

浏览 7提问于2022-02-21得票数 1

回答已采纳

1回答

如何在Pandas merge中指定分层列？

python、pandas、dataframe、join、hierarchical-data

在对on在join中的工作方式产生了严重误解之后(剧透:与merge中的on非常不同)，下面是我的示例代码。 import pandas as pd index1 = pd.MultiIndex.from_product([["variables"], ["number", "fruit"]]) df1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=index1) index2 = pd.MultiI

浏览 12提问于2020-10-24得票数 0

回答已采纳

1回答

是什么改变了这个pandas代码中的日期类型？

python、pandas、datetime

我在Pandas中有一个数据框，其中包含日期和其他一些数据。日期是显式的datetime.date类型。在本例中，我手动强制执行此操作。在实际问题中，框架是从已经设置好的外部源导入的。在操作索引之后，我发现我的dates属于pandas._libs.tslib.Timestamp类，这会导致与后面的代码不兼容。是什么导致了类型/类的变化？最小工作示例(注意第3行和第7行之间的区别)： In [1]: df = pd.DataFrame({'date' : ['02/20/2015','01/15/2016','08/21/2015

浏览 9提问于2019-07-10得票数 1

回答已采纳

1回答

用大量字符串加快PyArrow Parquet到Pandas的数据格式

python、pandas、parquet、ray

我有一个熊猫DataFrame我想经常查询(射线通过一个API)。我试图加快它的装载，但它需要大量的时间(3+s)把它变成熊猫。对于我的大多数数据集，它是快速的，但这个不是。我猜是因为其中90%是字符串。 [742461 rows x 248 columns] 它在磁盘上大约是137 on。为了消除磁盘速度这一因素，我将.parq文件放置在tmpfs挂载中。现在我试过： pyarrow/parquetReading 用pyArrow Parquet (read_table)阅读，然后把它扔给熊猫(读到桌子上是即时的，但使用to_pandas需要3s)，玩了几乎所有我在pyArrow上能想到的

浏览 8提问于2020-05-28得票数 4

5回答

除了一些列外，如何在列名中添加后缀？

python、pandas

给定熊猫DataFrame，我如何在除Id和Name两列之外的所有列中添加后缀"_old“ import pandas as pd data = [[1,'Alex',22,'single'],[2,'Bob',32,'married'],[3,'Clarke',23,'single']] df = pd.DataFrame(data,columns=['Id','Name','Age','Status'])

浏览 0提问于2018-11-19得票数 12

回答已采纳

1回答

ValueError:新名称的长度必须为% 1，got为%2

python、pandas、dataframe、datetime、pandas-resample

我正在尝试重新采样时间序列，参考另一个表中的开始和结束数据，如下所示。数据如下：df1: Index Timestamp Data ID 2 1 2 2014-03-04 13:16:44.310 30.0 2 6 8 2014-03-04 13:17:01.777 30.0 2 37 47 2014-04-17 11:59:57.470 25.0 2 df2: ID Start Date End Date comment Name 8

浏览 197提问于2021-11-23得票数 0

1回答

用Pandas + xlsxwriter删除索引的边框

python、excel、xlsxwriter

似乎xlsxwriter会自动添加熊猫df索引的边框。在写入数据之后，如何删除边框？当我试着用这样的方法 worksheet.set_column('A:A', None, test_format) #test_format just makes borders = 0 它要么删除这些值，要么什么也不做. 下面是一个示例设置： import xlsxwriter import pandas as pd # Create a test df df = pd.DataFrame({'Name': ['Tesla','Tesla',

浏览 4提问于2020-04-22得票数 1

回答已采纳

1回答

熊猫-如何按括号和唯一的列值进行分组？

python、pandas

所以，我偶然发现了一个有趣的条形图我发现了，我正在尝试重新创建数据是如何按范围箱(我使用过pd.cut)和按国家分组的。下面是我迄今为止尝试过的代码，但是我得到了错误，(错误的)行被注释掉了。 import pandas as pd ## csv file in zip http://ec.europa.eu/eurostat/cache/GISCO/geodatafiles/GEOSTAT-grid-POP-1K-2011-V2-0-1.zip url="C:/Users/Simon/Downloads/GEOSTAT-grid-POP-1K-2011-V2-0-1/Ver

浏览 0提问于2018-06-25得票数 0

回答已采纳

1回答

用另一个pandas索引替换pandas索引

python、pandas

我正在尝试用另一个pandas索引值来重命名pandas索引列。代码如下： for (b,c) in zip(pearson.index, a['Company Name']): print(pearson.index.rename(columns={'b': 'c'})) 如果我只是print(b, c)，它工作得很好，但当我尝试执行上面的代码时，它给出了以下错误： TypeError: rename() got an unexpected keyword argument 'columns' 你能给我解释一下这个错误是

浏览 343提问于2021-06-07得票数 0

1回答

使用pandas创建多索引和转置数据，并将列作为附加索引

python、pandas

我已经尝试了多种方式来读取这个excel文件，并用pandas重塑它。我尝试过不同的函数，如merge()，pivot()，melt()，reset_index()，但我仍然不能理解它。有谁能给我指个方向吗？这是当前表：current 这是所需的输出：desired output 抱歉，格式化了。我是stackoverflow的新手，但我已经做过研究，似乎找不到答案。我有很多删除的代码，我尝试过，但没有工作，这里有几个例子，我试图做到这一点。 import pandas as pd df = pd.read_excel(file) df.iloc[0:,0].fil

浏览 18提问于2020-01-18得票数 0

回答已采纳

1回答

重塑/转化pandas.Dataframe

python-3.x、pandas、reshape

嘿，嘿，我有下面的pandas.DataFrame df = pandas.DataFrame({ "date": ["2016-12-11", "2016-12-12", "2016-12-13", "2016-12-14", "2016-12-15"], "dim1": ["dim11", "dim12", "dim12", "dim11", "dim13"], "dim2&#

浏览 1提问于2017-01-20得票数 1

回答已采纳

1回答

如何用两个新维度替换xarray对象的当前维度

python、pandas、multi-index、python-xarray、reindex

我是一名Pandas用户，正在迁移到Xarray，因为我使用的是地理空间3D数据。有些东西我只知道如何使用Pandas，很多时候转换成Pandas对象再转换成Xarray Dataset对象没有任何意义。我要做的是用两个新的维度替换Xarray object的当前维度，这两个新维度当前是Xarray object中的数据变量。我们从data是Xarray object这一点开始，就像： <xarray.Dataset> Dimensions: (index: 9) Coordinates: * index (index) int64 0 1 2 3 4 5 6 7

浏览 70提问于2020-07-25得票数 0

2回答

是否将Python Pandas Groupby()行与另一个Groupby()值相加？

python、pandas、dataframe、pandas-groupby

我仍然是python和Pandas的新手，但我已经创建了三个groupby dataframe来对我的电子表格进行排序，并使用以下命令返回每种类型的总计： a = (df.groupby('Type')['Income'].sum()) b = (df.groupby('Type')['Value'].sum()) c = (df.groupby('Type')['Price'].sum()) 对于这些组中的每个组，它们都返回如下内容： Type Object 1 0.00 O

浏览 30提问于2021-06-26得票数 0

回答已采纳

1回答

多索引移位中的Pandas DatetimeIndex

python、pandas、dataframe、multi-index、datetimeindex

我有一些Pandas (python)数据帧是通过大约每8毫秒收集一次数据来创建的。数据被分解成块，在块中序列重新启动。所有数据块都有一个标签，并且有一个时间戳列指示采集样本的时间(从文件的开头开始)。为了得到一个概念，框架看起来像这样： | | EXPINDEX | EXPTIMESTAMP | DATA1 | DATA2 | ----------------------------------------------------- | BLOCK | 0 | | | | | Block1 | 1

浏览 1提问于2016-01-30得票数 0

2回答

pandas -多索引切片未按预期调整索引值

python、pandas、timestamp、multi-index

在Pandas中，我试图过滤出数据帧中具有特定日期(设置为多索引的第一级)的行。过滤后，我想检查第一级的最后一个索引值是否与我的最新日期匹配。但是，我不能让Pandas返回正确的值。举个例子可能会有所帮助。我首先使用multiindex创建原始的df： index = pd.date_range('2016-01-01', freq='B', periods=10), ["AAPL", "GOOG"] df = pd.DataFrame(index=pd.MultiIndex.from_product(index)) prin

浏览 11提问于2017-01-09得票数 3

回答已采纳

1回答

每组只有一列()

python、pandas

Am从R切换到Python，满足了我的大多数数据分析需求，并遇到了以下问题。可能是我对groupby()的概念理解的结果。我有一个Pandas数据框架，并试图根据许多列来总结这些数据。下面的代码就是我想要的。 df = df[(df["Lead Source"] != "chase") & (df["Lead Source"] != "SNE")] ndf = df[["Date", "Lead Source", "Model Group", "Leads"

浏览 0提问于2014-10-01得票数 1

回答已采纳

3回答

ValueError:长度不匹配:在pandas数据帧中创建分层列时，预期的轴有0个元素

python、python-3.x、pandas、dataframe、multi-index

我浏览了有关Pandas中的分层索引的。我尝试测试其中的示例，以创建一个具有分层索引的空数据帧： In [5]: df = pd.DataFrame() In [6]: df.columns = pd.MultiIndex(levels = [['first', 'second'], ['a', 'b']], labels = [[0, 0, 1, 1], [0, 1, 0, 1]]) 但是，它会抛出一个错误： ValueError Traceback (most r

浏览 1提问于2017-04-04得票数 11

回答已采纳

1回答

mplfinance KeyError：“打开”

python-3.x、pandas

我试着用熊猫的mplfinance数据创建OHLC图表。原始数据存储在一个数据库中，其中包含date ( data )、time (hora)和last，因此，在尝试创建图表之前，我必须重采样到OHLC。 cur = conn.cursor() nameddict=({"ticker": "GFGC90.0JU"}) select="""SELECT EXTRACT(EPOCH FROM (fecha || ' ' || hora)::timestamp) as datetime, last from preci

浏览 3提问于2020-05-05得票数 0

1回答

使用pandas中的索引列查看或过滤？

python、pandas

使用Python的pandas库，我导入了一个csv并将多个列设置为我的索引。出乎意料的是，当我显示数据帧时，索引列不再存在，并且我不能使用索引列作为过滤器选项。这让我想知道我是否错误地认为pandas索引类似于SQL索引。 date, exchange, symbol, low, high, open, close, last exchange和symbol足以唯一标识一行。它是加快了查找速度，还是添加了一些对stack/unstack/pivot/groupby之类的东西有用的语义信息？它能减少内存使用量吗？为什么要将日期、交换和符号移出数据帧(并移到索引系列中？)？把它们留在dat

浏览 1提问于2014-09-19得票数 0

2回答

如何在Pandas中存储多个相关的时间序列

python、pandas、time-series、quantitative-finance

我是Pandas的新手，想从专业人士那里获得一些见解。我需要对金融证券每日开盘价、高价、低价、收盘价的>30个时间序列进行各种统计分析(多元回归、相关等)。每个系列都有500-1500天的数据。由于每个分析都着眼于多个证券，我想知道从易用性和效率的角度来看，将每个时间序列存储在单独的df中是更可取的，每个df都以日期作为索引，还是将它们全部合并到具有单个日期索引的单个df中，这实际上是一个3d df。如果是后者，对如何构建它有什么建议吗？任何想法都非常感谢。 PS。我正在努力处理跨多个时区的日内数据，但对于我的第一个pandas项目来说，这有点太多了；这是朝着这个方向迈出的第一步。

浏览 2提问于2014-03-19得票数 2

2回答

熊猫HDFStore表不接受多索引列

python、pandas、pytables

这样做很好： cols = ['X', 'Y'] ind = [('A', 1), ('B', 2)] ind = pd.MultiIndex.from_tuples(index, names=['foo', 'number']) df = pd.DataFrame(rand(2,2), columns = cols, index=ind) store.put('df', df, table=True) print store['df']

浏览 2提问于2014-01-02得票数 2

回答已采纳

2回答

从两个具有重叠但不相同的周期索引的数据框架中创建数据帧

python、pandas

我有两个数据帧，每个表示不规则的时间序列。下面是来自df1的一个示例： index 2014-10-30 16:00 118 2014-10-30 19:00 160 2014-10-30 22:00 88 2014-10-31 00:00 128 2014-10-31 03:00 89 2014-10-31 11:00 66 2014-10-31 17:00 84 2014-10-31 20:00 104 2014-10-31 21:00 82 2014-10-31 23:00 95 2014-11-01 02:00

浏览 6提问于2016-06-23得票数 0

回答已采纳

1回答

如何将dask数据帧的所有部分合并在一起

python、dataframe、merge、dask

我有一个sales DataFrame，它有28M行，还有一些其他数据帧，还有一个示例Product DataFrame。当我第一次将pandas数据帧转换为Dask数据帧时： sales_dd = dd.from_pandas(Sales, npartitions=3) #28M rows product_dd = dd.from_pandas(Product, npartitions=3) #600 rows 转换Dask Dataframe后，我可以使用； sales_dd.tail() Date ProductNo Total_

浏览 2提问于2018-05-27得票数 1

1回答

AttributeError中可能存在的to_sql错误

python、sql、pandas

我不确定 (熊猫0.13.1)的这种行为是否是有意的。当我在没有列名的情况下创建一个dataframe，并尝试在sql db中写入 dfi = DataFrame(randn(3, 10)) dfi.to_sql(name = to_table, con=connection, flavor='mysql', if_exists='replace') 我得到以下错误： /usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-package

浏览 2提问于2014-04-09得票数 1

回答已采纳

1回答

pandas多索引切片“级别类型不匹配”

python、pandas、slice、multi-index

我从0.13.1迁移到pandas版本0.17，在切片方面遇到了一些新的错误。 >>> df date int data 0 2014-01-01 0 0 1 2014-01-02 1 -1 2 2014-01-03 2 -2 3 2014-01-04 3 -3 4 2014-01-05 4 -4 5 2014-01-06 5 -5 >>> df.set_index("date").ix[datetime.date(2013,12,30

浏览 0提问于2015-11-19得票数 5

1回答

使用pandas面板创建3d矩阵

python、csv、pandas

我的目标是创建一个pandas面板，我目前有一个csv，示例如下： Year From country To country Points 2005 Albania Albania 0 2005 Albania Bosnia & Herzegovina 0 2005 Albania Croatia 2 2005 Albania Cyprus 7 2005 Albania

浏览 18提问于2017-03-08得票数 1

3回答

Pandas数据帧按索引切片

python、pandas、dataframe、indexing、slice

我正在尝试对带有索引的数据帧进行切片，但它给出了错误，因为'TypeError：'Int64Index(1，dtype='int64')‘是一个无效的键’ data = [['Alex', 10], ['Bob', 12], ['Clarke', 13]] df = pd.DataFrame(data, columns=['Name', 'Age']) index = df.index[df['Name'] == 'Bob'] print(index)

浏览 7提问于2019-03-01得票数 1

回答已采纳

1回答

在jupyter笔记本中从熊猫数据中选择单行时发生的Python键错误

python-3.x、pandas、dataframe、jupyter-notebook

我成功地用StackOverflow解决了许多问题，但这是我第一次在其他地方找不到问题，自己也解决不了. 我在jupyter笔记本上工作，里面有熊猫的数据，包括文字评论和亚马逊产品的评分。下面是我的代码： import pandas as pd data = pd.read_csv("AmazonSampleForStudentOffice.csv") reviews = data[['reviewText', 'score', 'len_text']] reviews.head(5) 其结果是： reviewText scor

浏览 0提问于2020-03-31得票数 1

回答已采纳

2回答

从另一个数据文件中查找元素，以便在Python中创建MultiIndex dataframe

pandas、indexing、hierarchical

有2个数据和一个等级指数(熊猫multiIndex)。Dataframe A有一个ID和名字的列表。Dataframe有一个名称组合列表和一个相似性评分。我希望，基于多个索引，从Dataframe中获取值，并检查DataFrame B中是否存在这种组合。如果是，我想给我的Multindex数据提供相似的分数，否则只有0。 DataFrame A(原始数据) test= pd.DataFrame({'row':['a','b','c','d'],'col_A' : ["Alexis"

浏览 0提问于2018-04-30得票数 0

回答已采纳

1回答

为什么在我使用pd.DataFrame之后我的txt文件被更改了？

python、pandas

原始数据是：输出数据是： import pandas as pd signal_data = pd.read_csv('B.txt').T print pd.read_csv('B.txt').T dates = pd.date_range('2015-10-1', periods=19) signal_data_df= pd.DataFrame(signal_data, index=dates, columns=['PCLN', 'SPY', &

浏览 6提问于2015-10-28得票数 2

回答已采纳

3回答

如何在pandas dataframe中添加新列的值？

python、pandas、dataframe

我想在Pandas数据帧中创建一个新的命名列，在其中插入第一个值，然后向同一列中添加另一个值：类似于： import pandas df = pandas.DataFrame() df['New column'].append('a') df['New column'].append('b') df['New column'].append('c') etc. 我该怎么做？

浏览 1提问于2018-07-24得票数 3

回答已采纳

1回答

Python Pandas Group By错误'Index‘对象没有属性'labels’

python、pandas、dataframe

我得到了这个错误： 'Index' object has no attribute 'labels' 回溯如下所示： Traceback (most recent call last): File "<ipython-input-23-e0f428cee427>", line 1, in <module> df_top_f = k.groupby(['features'])['features'].count().unstack('features') File &

浏览 0提问于2017-02-23得票数 11

回答已采纳

7回答

检查熊猫数据索引中是否存在值

python、pandas、ipython

我相信有一个显而易见的方法来做到这一点，但现在想不出任何光滑的东西。基本上，我不想提出例外，我想让True或False来看看熊猫df指数中是否存在一个值。 import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) 我现在的工作是： sum(df.index == 'g')

浏览 2提问于2014-05-08得票数 203

回答已采纳

1回答

将数据分配给多索引熊猫数据框架的子集的适当方法

python、pandas

以数据格式di为例，由以下人员创建： import pandas as pd data = { "Event": ['Biathlon', 'Ski Jump', 'Slalom', 'Downhill'], "Award": ['Gold', 'Bronze', 'Gold', 'Silver'], "Points": ['100', '10', '1

浏览 2提问于2016-02-27得票数 2

回答已采纳

1回答

Pandas中来自Dataframe行的Dataframe列

python、numpy、pandas、merge

我有两只熊猫DataFrames。我想将其他dataframe的行作为列添加到另一列中。我试着阅读了合并、加入和连接文档，但无法理解如何在Pandas中实现这一点。下面是我如何通过转换成numpy数组来做到这一点，但是在Pandas中肯定有一种聪明的方法可以做到这一点。 import pandas as pd import numpy as np df1 = pd.DataFrame(np.random.normal(size=8).reshape(4,2),index=[1,2,3,4],columns=['a','b']) df2 = pd.DataFr

浏览 2提问于2014-11-21得票数 1

回答已采纳

1回答

如何在Pandas中加载长面板数据集？

python、pandas

我有一个长格式的面板数据集，即观察数据在Panel_ID日级别。我有，比方说，m Panel_IDs，每个Panel_ID都有T(m)日观测。例如，数据应该是这样的。我展示了一个有2个面板ID (1和2)的例子，但是数据包含了很多它们。X是一个感兴趣的变量。 Panel_ID Day X 1 2-feb 5 1 3-feb 4.3 1 5-feb 3 2 2-feb 0 2 5-feb 0.5 2 8-feb 3.2 等等，不同的Panel_IDs不一定是相同的，每个Panel_ID都有自己的每日观测数。如何在Pandas中加载此数据集，

浏览 3提问于2015-05-27得票数 0

回答已采纳

1回答

将多索引数据中的所有匹配元素设置为一个系列

python、pandas、dataframe

以前，我一直使用pandas.Panel来存储多个数据，每个日期在一个日期列表中存储一个。由于面板的不推荐，我正在尝试转换为使用多个索引数据。例如，我有以下数据： dates = pandas.date_range('20180101', periods=3) stocks = ['AAPL', 'GOOG', 'MSFT', 'AMZN', 'FB'] 在反对之前，我可以创建一个面板，如下所示： pnl = pandas.Panel(items=dates, major_axis=stock

浏览 0提问于2018-06-28得票数 2

回答已采纳

4回答

Python中的DataFrame切片失败

python、python-3.x、pandas、dataframe、slice

我想用Python分割我的数据。切片数据的基本任务会给我带来意想不到的错误。我的代码是： import pandas as pd test_file = pd.read_csv("C:/Users/Lenovo/Desktop/testfile.csv") test_select = test_file[["Category", "Shop"]] print(test_select[1,1]) 代码print(test_select[1,1])应该显示第二列的第二行。错误信息： pandas._libs.hashtable.PyObjec

浏览 0提问于2018-12-15得票数 1

回答已采纳

1回答

熊猫索引行为出人意料: df[df.index[0]] => KeyError

python、pandas、dataframe

我使用了一个数据have (初始索引为0.9999)，并按年份进行了分区： requests_df = {year : df[df['req_year'] == year] for year in df['req_year'].unique()} 和往常一样，每个子帧保留自己的索引顺序。然后，在尝试对其中一个孤立帧(df_yr = requests_df[2015])进行索引时，我得到了一个非常出乎意料的行为： for idx in df_year.index: qty = frame[idx]['qty_tickets'] 原因

浏览 1提问于2017-02-21得票数 1

回答已采纳