如何使用pandas旋转数据帧，以显示有聚合和无聚合的值_如何聚合和扩展pandas数据帧中的频率值 - 腾讯云开发者社区

python、pandas、dataframe

我有一个由12列和900个条目组成的pandas数据帧，如下所示： In [1]: df Out[2]: Id BestInGen Ceiling Fitness Floor Generation Name Precision Runid SolutionId Timestamp Value 0 1 True 2.5 2.416582e+11 0.500 1 H1001Thickness1 0.010 20180214142319 4 2018-02-14 14:28:41.39190

浏览 0提问于2018-03-16得票数 0

1回答

如何使不同的列在holoviews / hvplot中呈现为不同的颜色？

pandas、holoviews

我有一个包含两列时间序列数据的pandas数据帧。在我的实际数据中，这些列足够大，如果没有数据着色器，渲染就会很笨拙。我正在尝试比较这两个时间序列中的事件。但是，我需要能够分辨出哪个数据点来自哪个列。下面是一个简单的函数示例。如何让A列和B列使用不同的颜色映射？ import numpy as np import hvplot.pandas import pandas as pd A = np.random.randint(10, size=10000) B = np.random.randint(30, size=10000) d = {'A':A,'B'

浏览 19提问于2019-01-12得票数 0

回答已采纳

2回答

KeyError使用s.loc和s.first_valid_index()

python、pandas、pandas-loc

我有类似于这篇文章的数据：也就是说，我有一些观察会议的数据，每一次会议都有一个焦点个人。这位协调人只被记录了一次，但我想在该届会议期间填写每一行的焦点ID数据。所以，数据看起来是这样的： Focal Session 0 NaN 1 1 50101 1 2 NaN 1 3 NaN 2 4 50408 2 5 NaN 2 基于上面链接的帖子，我使用了以下代码： g = data.groupby('Session') g['Focal'].transform(l

浏览 4提问于2013-09-24得票数 3

回答已采纳

1回答

Pandas:如何将DataFrame groupby的结果放入具有新列名的数据帧中？

python、pandas

我有一个有两个列'id‘和'time’的数据框架。需要计算ids的平均时间，并使用新的列名将结果放入新的数据框架中。输入数据框架： id time 0 1 1 1 1 1 2 1 1 3 1 1 4 1 2 5 1 2 6 2 1 7 2 1 8 2 2 9 2 2 10 2 2 11 2 2 我的代码： import pandas as pd my_dict = { 'id

浏览 3提问于2016-12-18得票数 1

回答已采纳

1回答

如何在dask中执行group-by聚集后保留分区

python、pandas、dataframe、distributed、dask

在我的应用程序中，我使用groupby对dask数据帧执行聚合，并按某个id排序。但是，我希望聚合保持分区划分，因为我打算执行与其他相同分区的数据帧的连接。 import pandas as pd import numpy as np import dask.dataframe as dd df =pd.DataFrame(np.arange(16), columns=['my_data']) df.index.name = 'my_id' ddf = dd.from_pandas(df, npartitions=4) ddf.npartitions #

浏览 0提问于2018-02-17得票数 4

1回答

在Dask中使用尚未实现的Pandas函数

python、pandas、dask、dask-distributed、dask-delayed

我相信在使用Dask数据帧时，我在Dask教程中看到了一个关于如何使用Dask框架中尚未实现的Pandas函数的建议，但我似乎看错了地方。例如，我想使用Pandas函数'ewm‘。作为一种变通方法，我将Dask数据帧转换为Pandas数据帧，在Pandas数据帧上运行ewm，然后将它们转换回Dask，以便以后进行更多内存密集型操作。效率不是最高的。有没有更好的策略呢？

浏览 10提问于2019-06-02得票数 1

回答已采纳

1回答

动态构建用于导出到csv的大型数据帧(spark或pandas)的方法

python、pandas、apache-spark、pyspark、databricks

我有一个csv，我使用spark.read导入到databricks中。这个大文件包含每日级别的记录/事务。我将数据帧减少到5列，并保持500,000行不变。我正在尝试构建这个源文件的汇总表，它在一个月级别(聚合)表示这些记录/事务。该脚本有一个filter/groupby/sum命令，该命令返回一行，将数据汇总为一个月的计数。查询返回的行将如下所示： +---------+---------+-------+-------------+ | Country|StockCode|YYYY-MM|sum(Quantity)| +---------+---------+-------+---

浏览 12提问于2020-07-12得票数 0

1回答

具有多索引和重复字符值的Pandas pivot_table

python、pandas、pivot-table、multi-index

我正在尝试旋转数据帧，比如 id1 id2 property value 1 2 p v1 1 2 p v2 形成 id1 id2 p 1 2 v1 & v2 到目前为止我的代码是 import pandas as pd df = pd.DataFrame(data= {'id1': [1, 1], 'id2': [2, 2], 'property': ['p', 'p'], 'value': [&

浏览 7提问于2020-05-19得票数 0

1回答

根据另一列从一列获取唯一数据

python、pandas

我有一个数据集，其中有状态和城市，现在状态有多个城市，我想按状态对它们进行分组，并将输出转换为JSON 数据帧 City State 0 A foo 1 B bar 2 D foo 3 C moo 4 E foo 5 F bar 我是这样做的： df = data[["City","State"]] df.groupby("State") 但我得到以下信息 <pandas.core.groupby.generic.Da

浏览 0提问于2020-06-05得票数 0

回答已采纳

1回答

为什么PySpark中的agg()一次只能汇总一列？

python、apache-spark、pyspark、apache-spark-sql、pyspark-sql

对于下面的数据帧 df=spark.createDataFrame(data=[('Alice',4.300),('Bob',7.677)],schema=['name','High']) 当我试图找到最小和最大值时，我只能在输出中得到最小值。 df.agg({'High':'max','High':'min'}).show() +-----------+ |min(High) | +-----------+ | 2094900| +-----------+

浏览 1提问于2017-06-06得票数 11

回答已采纳

2回答

Cumsum作为现有Pandas数据中的新列

python、pandas、dataframe、cumsum

我有一个pandas数据帧定义为： A B SUM_C 1 1 10 1 2 20 我想计算SUM_C的累积和，并将其作为新列添加到相同的数据帧中。换句话说，我的最终目标是拥有一个如下所示的数据帧： A B SUM_C CUMSUM_C 1 1 10 10 1 2 20 30 显示了生成新数据帧的可能性，其中列名SUM_C将替换为累积和。但是，我的要求是将累积总和作为新列添加到现有数据帧中。谢谢

浏览 11提问于2017-01-26得票数 31

回答已采纳

3回答

两只熊猫联盟DataFrames

python、pandas、dataframe、merge、concatenation

假设我有两个数据帧： df1： A 0 a 1 b df2： A 0 a 1 c 我希望结果是两个框架的联合，其中有一个显示该行所属的源数据框架的额外列。在重复的情况下，应删除重复项，并在相应的额外栏中显示这两个来源： A B 0 a df1, df2 1 b df1 2 c df2 我可以获得级联的数据帧(df3)，而不需要重复，如下所示： import pandas as pd df3=pd.concat([df1,df2],ignore_index=True).drop_duplicates().reset_index(drop=True) 我想/找不到一种方法来控制

浏览 0提问于2019-01-22得票数 13

回答已采纳

2回答

如何将数据集与熊猫群相结合

python、pandas、dataframe、lambda、pandas-groupby

我有一个dataframe df和一个列df['table']，这样df['table']中的每一项都是具有相同标题/列数的另一个数据same。我想知道是否有办法像这样做groupby：原始数据： name table Bob Pandas df1 Joe Pandas df2 Bob Pandas df3 Bob Pandas df4 Emily Pandas df5 在小组讨论之后： name table Bob Pandas df containing the appended df1, df3,

浏览 0提问于2020-10-07得票数 7

回答已采纳

1回答

Pandas -ValueError中的透视:索引包含重复条目，无法重塑

python、pandas、pivot

我是python和pandas的新手，我正在尝试转换一些数据。我有一个包含三列的数据集，如下所示： A B C col1 21-03-2019 1.2 col2 21-03-2019 23 col3 21-03-2019 45 col4 21-03-2019 2.4 col5 21-03-2019 78 col1 14-07-2019 0.1 col2 14-07-2019 AM col3 14-07-2019 CDM col

浏览 20提问于2020-04-03得票数 0

回答已采纳

1回答

Python Pandas中的交叉表分析

python、pandas、crosstab

所以我要做的是创建一个网页，用户可以在导入的数据文件的选定行和列上运行交叉制表分析。我将文件转换为pandas数据帧，然后使用pandas.crosstab对其进行处理。然而，因为交叉表输出一个“堆叠的”或多索引的表格，所以我必须旋转它，以便更容易地使用和输出回网页。我一直在尝试使用pandas的pivot函数，但是很难找到一个好的、动态的例子。一些我一直在看的pandas中旋转的文档，但它没有显示一个列和行标签是动态的示例。现在我的交叉表函数是： cross_tab = pd.crosstab([dataframe[row] for row in selected_rows], [dat

浏览 5提问于2018-02-06得票数 1

回答已采纳

2回答

Pandas dataframe:按一列分组，但按其他列连接和聚合

python、pandas

如何转换以下输入数据(从Excel文件输入的Pandas数据帧)： ID Category Speaker Price 334014 Real Estate Perspectives Tom Smith 100 334014 E&E Tom Smith 200 334014 Real Estate Perspectives Janet Brown 100 334014 E&E Janet Brown

浏览 0提问于2018-08-01得票数 2

1回答

Pandas DataFrame不会旋转。表示重复的索引

python-3.x、pandas、pivot-table

所以基本上我的数据框中有3列，如下所示： <class 'pandas.core.frame.DataFrame'> Int64Index: 158143 entries, 0 to 203270 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 users 158143 non-null int64

浏览 12提问于2020-04-14得票数 0

回答已采纳

1回答

Python Pandas:只透视DataFrame中的某些列，而保留其他列

python、pandas、pivot-table

我正在尝试重新安排一个DataFrame，它是我使用Pandas自动从json读取的。我找过了，但没有成功。我有下面的json (为了方便复制/粘贴，保存为字符串)，在'value‘标签下有一堆json对象/字典。 json_str = '''{"preferred_timestamp": "internal_timestamp", "internal_timestamp": 3606765503.684, "stream_name": "ctdpf_j_cspp_inst

浏览 0提问于2016-03-16得票数 14

回答已采纳

1回答

pandas后如何跨列求和？

python、pandas、dataframe

我正在对一个pandas数据帧使用groupby()操作。然后，我尝试对每一行的列求和。但是，在调用sum()时，我一直收到错误消息。我附上了我的代码如下： bike_use = bike_use.groupby(['road_name', 'count_point_id'])['pedal_cycles', 'two_wheeled_motor_vehicles'].sum(axis = 1) 我得到的错误是： TypeError: sum() got an unexpected keyword argument '

浏览 12提问于2020-12-04得票数 0

1回答

处理ValueError的便捷方法:不能从重复轴重新索引

python、pandas、datetime、indexing、concat

我能够搜索到显示此错误消息的“原因”的建议，但不知道如何解决它- 每次尝试通过连接两个现有列中的字符串值来向pandas数据帧添加新列时，我都会遇到这个问题。例如： wind['timestamp'] = wind['DATE (MM/DD/YYYY)'] + ' ' + temp['stamp'] 如果第一个项目和第二个与‘’合并的项目都是单独的dataframe/series，那么它就会起作用。这些尝试是将日期和时间合并到同一列中，以便它们被pandas库识别为日期时间戳。我不确定是我错误地使用了这个命令，还是panda

浏览 1提问于2018-08-22得票数 5

回答已采纳

1回答

更改DataType的GroupBy方法

pandas、pandas-groupby

使用Python3和Anaconda，我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后，我尝试对两列使用.groupby()，但它将数据类型从DataFrame更改为DataFrameGroupBy，并且我不能再对其运行数据框方法。我想不出任何可以尝试的东西。我对熊猫的经验很少，通过codecademy获得的。我的代码似乎可以在那里工作。 import os import pandas as pd totals = pd.read_csv('filename') band_gaps = totals.groupb

浏览 19提问于2019-06-21得票数 0

回答已采纳

2回答

以数据帧的形式返回聚合值

python、pandas

我有一个按两列分组的pandas DataFrame和一个自定义函数，该函数从每个分组的行集计算值的元组。我正在尝试收集数据帧中的结果，并使用原始的组索引进行索引。当我使用apply()时，我得到了一个带有正确索引的Series，但是值是以元组的形式出现的。我应该如何编写我的函数，以使结果成为数据帧，并按每个组的标签进行索引？这是一个基于本教程中的数据帧的示例。 df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar',

浏览 1提问于2017-02-27得票数 0

回答已采纳

2回答

ValueError: MultiIndex的名称应该类似于列表

python、pandas

如何避免旋转数据帧后的错误？ import pandas as pd import numpy as np df = pd.DataFrame({'foo': ['one', 'one', 'one'], 'baz': [1, 2, 3], 'zoo': ['x', 'y', 'z']}) df1 = df.pivot('baz', 'zoo', '

浏览 0提问于2018-05-20得票数 2

1回答

如何使用pandas旋转数据帧，以显示有聚合和无聚合的值

python、pandas

我想使用pandas来旋转我的数据帧，我的数据帧看起来像这样 Dataframe 我想与最大的item_cnt_day与最大售出的item_id按date_block_num降序排序的shop_id。我已经试过了 pd.pivot_table(sales1,index=['date_block_num', 'shop_id'], values=["item_cnt_day","item_id"], \ aggfunc={"item_id":lambda x: x.value_cou

浏览 8提问于2019-07-04得票数 0

1回答

如何根据另外两列中满足的条件对最后一列中的pandas DataFrame元素进行索引？

python、pandas、dataframe、indexing

pandas数据帧有4列： df.columns = ['col1', 'col2', 'question', 'answer'] 如何根据满足第一列的标准对数据帧进行索引，从而为'answer'列的单个条目编制索引？即： df['col1'=='apple' and 'col2'=='guitar'].answer

浏览 10提问于2021-01-11得票数 0

1回答

计算Python Pandas库中的百分比

python、pandas、pandas-groupby、data-wrangling

我有一个这样的Pandas数据帧： import pandas as pd df = pd.DataFrame( {'gender':['F','F','F','F','F','M','M','M','M','M'], 'mature':[0,1,0,0,0,1,1,1,0,1], 'cta' :[1,1,0,1,0,0,0,1,0,1]} ) df[&

浏览 22提问于2020-10-14得票数 1

回答已采纳

2回答

带有字符串的Pandas透视- ValueError:索引包含重复条目，无法重塑

python、pandas、group-by、pivot

给定此数据帧： import pandas as pd df=pd.DataFrame({'Field':['a','b','a','b'],'Value':['aa','bb','cc','dd'], 'indexer':[0,0,1,1]}) df Field Value indexer 0 a aa 0 1 b bb 0 2 a cc

浏览 8提问于2017-12-18得票数 2

回答已采纳

2回答

Python Pandas : group by in groups by and average，count，median

python、pandas

假设我有一个数据帧，如下所示 d = {'User' : ['A', 'A', 'B', 'C', 'C', 'C'], 'time':[1,2,3,4,4,4], 'state':['CA', 'CA', 'ID', 'OR','OR','OR']} df = pd.DataFrame(data = d) 现在假设我想要创建新的数据帧

浏览 16提问于2021-07-23得票数 1

回答已采纳

2回答

从pandas df更新数据库中的现有行

python、postgresql、pandas

我有一个PostgreSQL数据库。Pandas有一个“to_sql”函数，可以将数据帧的记录写入数据库。但我还没有找到任何文档，说明在我使用完dataframe时如何使用pandas更新现有的数据库行。目前，我可以使用pandas read_sql_table将数据库表读取到数据帧中。然后，我会根据需要处理数据。但是，我还不能弄清楚如何将该数据帧写回数据库以更新原始行。我不想覆盖整个表。我只需要更新最初选择的行。

浏览 73提问于2015-04-13得票数 25

1回答

使用相关矩阵中的目标变量列填充Python Pandas Dataframe

python、pandas、dataframe、class、correlation

我有一个由不同数据类型的45个变量组成的pandas数据框架，我正在使用'dython.nominal‘包来创建每个变量之间的关联矩阵。然后我想：答:子集我的数据帧(按地理位置过滤)，并在该子集上计算关联矩阵，然后 B:使用在步骤A中创建的数据帧中的目标变量的列，创建第二个pandas数据帧并添加到第二个pandas数据帧中。然后，得到的数据帧将是一个相关性矩阵，其中列索引是地理位置，行索引是其他44个变量。到目前为止，我拥有的代码是： import pandas as pd from dython.nominal import compute_associations t

浏览 0提问于2020-10-26得票数 2

2回答

化工厂重组数据与出口

pyspark

我尝试了这里显示的另一种方法：，它不适用于我的数据帧。我有一个数据文件，如下所示： Attribute Values ID Brand Model -------------------------------------------- Colour Red 1 Sony xyz Energy F 2 Samsung abc Year 2020 1 Sony xyz Energy C 1 Sony xyz Colou

浏览 5提问于2022-07-16得票数 0

6回答

如何在Pandas DataFrame中获取NaN值时的最大/最小值

python、pandas

因为我的pandas数据帧中有一列的值是错误的，所以当我想要获取该列的最大值时，它只会返回nan。 >>> df.iloc[:, 1].max() 'error:512' 如何跳过nan值并获得该列最大值？

浏览 76提问于2016-07-21得票数 18

回答已采纳

1回答

从现有数据帧的某些列创建新的pandas数据帧

python、pandas、dataframe

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

1回答

为什么networkx在添加边后会减少节点数量

python、python-3.x、pandas、graph、networkx

首先，我需要说明我的代码运行时没有任何错误消息，但是我不理解一些结果。我在networkx中从一个pandas数据帧创建了一个图，它有398595个整数ID。 # Create Graph G = nx.Graph() G.name = "Graph from Pandas" # Add Nodes to Graph G.add_nodes_from(test_df['ID'].tolist()) print(nx.info(G)) nx.info(G)的输出如下所示，这也是正确的，这是我所期望的： Type: Graph Number of nodes:

浏览 0提问于2020-09-28得票数 0

1回答

MongoDB聚合管道vs Pandas聚合

pandas、mongodb

我们目前使用了大量的MongoDB聚合管道来做一些数据处理。然而，我们经常遇到一些性能问题。我正在考虑将数据从MongoDB读取到Pandas数据帧中，并使用Pandas数据帧聚合来处理数据。有谁有比较这两种方法的经验吗？另外，MongoDB聚合管道是否利用了内部的某种并行性？

浏览 0提问于2020-05-15得票数 2

2回答

熊猫根据另一列获得真实值的位置(开始，结束)

python、pandas、numpy

我有以下df： import pandas as pd frames = [9,12,14,15,16,17,18,22,23,24,25,30] counter = [0,0,0,0,1,1,1,0,0,1,1,0] df = pd.DataFrame({'frames':frames, 'counter':counter}) print(df) frames counter 0 9 0 1 12 0 2 14 0 3 15 0 4

浏览 4提问于2022-09-20得票数 2

回答已采纳

3回答

Pandas:组内最大值和最小值之间的差异

python、pandas、numpy

给定一个如下所示的数据帧 GROUP VALUE 1 5 2 2 1 10 2 20 1 7 我想计算每组中最大值和最小值之间的差异。也就是说，结果应该是 GROUP DIFF 1 5 2 18 在Pandas中，有什么简单的方法可以做到这一点？在Pandas中，对于具有大约200万行和100万组的数据帧，执行此操作的快速方法是什么？

浏览 4提问于2016-10-22得票数 39

1回答

熊猫按每个组的唯一出现次数进行聚合

pandas

在pandas中，如果条件值出现一次，我会分析组。我已经在下面的第一步中包含了一个样例数据帧，试图识别这样的组。因此，假设在下面的数据框中，我希望过滤原始数据框中曾经具有大于6的花冠长度的虹膜物种。在最后一个命令中，我正在计算具有大于6的花冠长度的独特物种组的数量(因此，至少我可以计算它们)。但是，我真正想要的是原始数据帧，只有当物种的花冠长度大于6时，我才会分析行(因此，这将是一个没有物种"setosa“的数据帧，因为它们从来没有一个)。更详细的解释是，我有一个真实的用户数据集。每个用户在某些列中的值可能会超过感兴趣的阈值。我还没有想出如何分析拥有这些阈值的用户。也许循环会更好

浏览 0提问于2020-10-10得票数 0

1回答

Pandas中的列名(Python)

python、pandas

Python : Pandas :数据框:列名我有大量的列，列名也很大。我希望看到一些列和行，但视图变得限制在列名的大小上。如何在没有列名的Python中临时查看数据帧(仅显示数据)

浏览 12提问于2018-05-09得票数 2

1回答

旋转/重塑pandas数据帧

python、pandas

模拟pandas数据帧以进行透视： df = pd.DataFrame({'id': ['A','B','C'], 'year': [2012, 2014, 2016], 'val1': [1,2,3], 'val2': [5,6,7], 'val3': [9,10,11]}) 我想将pandas数据帧旋转以获得以下

浏览 6提问于2021-09-30得票数 1

4回答

Pyspark:有没有等同于pandas info()的方法？

python、pandas、apache-spark、pyspark

在PySpark中是否有与pandas info()方法等效的方法？我正在尝试获取有关PySpark中数据帧的基本统计信息，例如:列数和行数、空值数、数据帧大小 pandas中的Info()方法提供了所有这些统计信息。

浏览 4提问于2017-06-08得票数 6

1回答

计算时间序列占总时间序列的百分比

pandas、matplotlib

我正在查看县级采购数据(数百万账单)，并使用groupby使用matplotlib和pandas绘制时间序列 dataframe_slice.groupby(pd.Grouper(freq='1M')).bill_amount.sum().plot 其中bill_amount是一列浮点数，它显示了账单的金额。如何更改图表以将dataframe_slice显示为总数据帧bill_amount的百分比

浏览 13提问于2021-01-06得票数 0

1回答

具有相同值的多列的Groupby和sum

python、pandas、group-by

我正在处理Pandas数据帧，有以下数据帧： data =pd.DataFrame() data['HomeTeam'] = ['A','B','C','D','E'] data['AwayTeam'] = ['E','D','A','B','C'] data['HomePoint'] = [1,3,0,1,3] data['AwayPoint'] = [1,0,3,1,0

浏览 7提问于2018-07-24得票数 0

回答已采纳

1回答

Pandas:聚合后每组的计数器列

python、pandas

这里是pandas和dataframes的新手！初始数据帧： A 1238 100 A 1238 90 A 3784 200 A 3784 500 B 1222 274 B 1222 400 C 2747 800 C 1384 100 我需要这样的输出：(C列是A列和B列的分组数据的最小值，B列是分组数据的顺序计数器)： A 1 90 A 2 200 B 1 274 C 1 800 C 2 100 帮助!

浏览 2提问于2020-01-24得票数 2

1回答

对Pandas数据帧中的列进行分组和排序

python、pandas

我有一个有很多列的Pandas数据框，其中之一是“电影标题”，我想找到出现在最多行的前5个电影标题，并将它们按降序排列。例如： movie title Title 1 Title 2 Title 2 Title 3 Title 3 Title 3 应该变成： movie title count Title 3 3 Title 2 2 Title 1 1 它可以在同一数据帧中，也可以在新的数据帧中。我可能错过了一个简单的解决方案，因为我对Pandas非常陌生。谢谢你的帮忙!

浏览 0提问于2016-04-02得票数 1

1回答

覆盖数据帧中的数据，根据最大值

python、pandas

我在Pandas数据框中存储了一组数据，其中包含部件使用位置的跟踪信息。数据看起来像这样：在上图中，我需要能够用蓝色突出显示的值覆盖以橙色突出显示的值。此覆盖需要基于be表条目号(越高越低)以及项目名称。控件是"Item“和"Project Name”。在上面的例子中，第#2、#3、#4行将被98754-48覆盖。这将基于“项目”中具有该“客户工作ID”的最大值，并且“项目名称”是相同的。这在VBA中是相当直接的，但由于涉及的卷(每天100k个条目、多达50k个部件、100台计算机和100+客户端)，这很快就会变得难以实现有没有什么快速的方法可以使用数据帧来实

浏览 8提问于2020-05-06得票数 1

回答已采纳

1回答

计算Pandas Dataframe中多列的日平均值，然后插入一行

python、python-3.x、pandas、dataframe、csv

我使用Pandas向数据帧输入了一个CSV文件，并希望计算其中列的日平均值。有两个列不会被平均化，时间和日期(日期是数据分组的日期)。然后，我希望在该日期的最后一行下面插入一行，在date列中插入“Average”( time列中没有任何内容)，然后在正确的列中插入相应的平均值。我只使用了Pandas一段时间，所以我不知道最简单的方法是什么。任何帮助都将不胜感激。

浏览 12提问于2022-06-17得票数 0

3回答

Python Pandas:如何将Dataframe列值设置为X轴标签

python、pandas、matplotlib、dataframe

假设我有以下格式的数据： Region Men Women City1 10 5 City2 50 89 当我将其加载到数据帧中并绘制图形时，它将索引显示为X轴标签，而不是Region名称。如何获取X轴上的名称？到目前为止，我尝试了： import pandas as pd import matplotlib.pyplot as plt plt.style.use('ggplot') ax = df[['Men','Women']].plot(kind='bar', title ="P

浏览 3提问于2016-07-31得票数 25

回答已采纳

2回答

使用3列数据操作pandas数据帧

python、pandas

我想不出一个办法来完成我的任务。我有一个包含3列的数据帧：length, reachcode, and year。我的示例dataframe： year reachcode length 1988 1000 1.2 1988 1000 2.0 1990 1000 0.3 1993 1000 0.5 我试图找到一个年份内的“reachcode”重复项，然后对该年的“长度”求和。之后，我想要比较不同年份的相同“reachcode”和“length”值的总和，并保留最小的值。因此，在示例数据帧中，将1998年和reachcode =

浏览 2提问于2016-08-23得票数 1

3回答