使用agg函数时的pandas valueError_在agg函数中使用方程的Pandas组_Pandas agg应用具有多个参数的函数 - 腾讯云开发者社区

python、pandas、group-by、aggregation、mode

我有一个熊猫数据列表，我想对所有的熊猫执行一个模式操作。所有数据文件都有相同的布局： date是dt.date对象，感情是整数(-1、0或1)。我想得到一个数据组的日期，情感是原始的模式(或一个模式的列表，如果有更多)。我用它来聚合： df = df.groupby('date').agg(pd.Series.mode) 它可以很好地处理几乎所有的数据文件，其中只有一个返回一个错误： File "..\lib\site-packages\pandas\core\apply.py", line 420, in agg_list_like rais

浏览 15提问于2022-11-04得票数 0

回答已采纳

1回答

模式聚合在熊猫中不起作用(必须产生聚合值)

python、python-3.x、pandas、dataframe

运行此程序时： import pandas as pd df = pd.DataFrame(dict(x=[1, 1, 2, 2, 3, 3], group=["a", "a", "a", "a", "b", "b"])) df.groupby(["group"]).agg({ "x": [pd.Series.mode, "sum"] }) 返回此错误： ValueError Tr

浏览 9提问于2022-08-31得票数 0

回答已采纳

2回答

Python:不能同时执行聚合和转换操作，`.agg`的自定义函数会产生错误

python、pandas、dataframe

假设您有下面的Pandas DataFrame，df，4列和10行。这是一个MWE： data = {'age': [39, 50, 38, 53, 28, 37, 49, 52, 31, 42], 'education-num': [13, 13, 9, 7, 13, 14, 5, 9, 14, 13], 'workclass': ['State-gov', 'Self-emp-not-inc', 'Private', 'Private'

浏览 3提问于2021-06-22得票数 2

1回答

clean_list() -> ValueError:错误的项目数通过3，放置意味着1

python、pandas、dataframe、valueerror、keyerror

我从以前的员工那里继承了这段代码，我试图运行这段代码，但是我得到了一个错误。 def replaceitem(x): if x in ['ORION', 'ACTION', 'ICE', 'IRIS', 'FOCUS']: return 'CRM Application' else: return x def clean_list(row): new_list = sorted(set(row['APLN_NM']),

浏览 10提问于2022-11-24得票数 0

回答已采纳

1回答

DataFrame重采样没有结果(熊猫)

python、pandas

我有一个dataframe (df)，如下所示： Time Temp 2017-01-01 00:30:00 11.1 2017-01-01 01:00:00 10.8 2017-01-01 01:30:00 10.8 2017-01-01 02:00:00 10.8 2017-01-01 02:30:00 11.1 ..... .... 我试图获取临时数据的小时平均值，我用以下代码(时间是索引)来实现： df2 = df.resample('H').agg(['mean','std']) 但

浏览 3提问于2017-07-22得票数 4

回答已采纳

1回答

熊猫的数据，它只由一个计数器大于X的行组成

python、pandas

我想在一列中显示我拥有的组数，然后只显示那些有超过一个特定数目的组。考虑一下这个例子： import pandas as pd df = pd.DataFrame( { 'ColA': 'A A A B B C C C C D E E F F F F F F F G G H'.split(), 'ColB': '1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2'.split() } ) 如果我这样分组的话： print df.groupby(

浏览 4提问于2015-09-09得票数 1

回答已采纳

2回答

如何在Seaborn中绘制Pandas .groupby()对象-使用方法链接

python、pandas、method-chaining

如果有任何关于如何通过管道将Pandas .groupby()对象导入Seaborn的建议，我将不胜感激我正在尝试绘制.groupby()对象，但它给出了一条错误消息: ValueError:如果使用所有标量值，则必须传递索引 gapminder.\ groupby('year').\ agg({'pop' : ['sum'], 'lifeExp' : ['mean']}).\ reset_index().\ pipe((sns.relplot, "dat

浏览 7提问于2020-03-09得票数 0

2回答

使用agg函数时的pandas valueError

python、pandas、data-science

我正在熟悉熊猫，我遇到了一个我找不到答案的问题。我使用的是这里提供的数据集https://raw.githubusercontent.com/Shreyas3108/house-price-prediction/master/kc_house_data.csv 然后，我运行函数df.describe()，它会毫无问题地输出所有应该输出的内容。因为我目前只对min/max的min，max和diff感兴趣。我使用pandas中的df.agg函数通过运行以下代码来获取每列的最小/最大值 df.agg([min, max],axis=0) 当我运行这段代码时，我得到以下错误： ~/.vi

浏览 51提问于2019-03-12得票数 0

2回答

用熊猫计数(同一排有两个不同的数字)

python、pandas

我有一个csv文件，关于错误的停车罚款，它包含月，年，和罚款的原因。我想找到前10个原因(错误部分/主要原因)获得罚款。注意，Error section / main cause列中的一些行某些行有两个不同的原因来获得罚款( 0401 Parking Prohibited Area failure to comply with a traffic sign ; 2200 Parking next to the marked parking space ) 代码需要很长时间来响应，然后出现错误。(长列表) import pandas as pd from StringIO import St

浏览 2提问于2016-11-12得票数 0

回答已采纳

1回答

Pandas函数的滚动聚合列表。ValueError:无结果

python、pandas、aggregate、rolling-computation

滚动后的聚合方法不适用于函数列表。此代码将引发Valueerror。 df = pd.DataFrame({'col1':range(3), 'date':pd.date_range('2018-01-01', '2018-01-03')}) df.rolling('6D', min_periods=1, on='date', closed='left').agg([sum]) 但这段代码适用于单个函数。 df.rolling('6D', min_periods=

浏览 60提问于2019-09-02得票数 0

1回答

熊猫简易保存数据类型

pandas

下面的代码出现了一个简单的错误。我的目标是使用simpleimputer在一张照片中插入不同数据类型的缺失值。当我尝试这样做时，fit_transform似乎不像预期的那样工作。当不使用dtype参数时，代码工作得很好，但是最终的dataframe丢失了它的数据类型信息。当我在参数中包含dtype列表时，我会看到下面的错误。您应该能够通过在本地复制和粘贴来模拟错误。 import pandas as pd import numpy as np from sklearn.impute import SimpleImputer import sklearn print(sklearn.__v

浏览 2提问于2018-11-11得票数 2

回答已采纳

2回答

尝试将我的pandas图转换为plotly时，出现"min() arg is a into“

python、pandas、matplotlib、plotly

在尝试将pandas数据框图转换为plot时，我收到一个ValueError: min() arg is an empty sequence。以下是数据帧(包含NaNs)的示例： ttab.loc[:,:"Irish"] Group English (British) Americans (White) Canadians Scots Irish Year 1926 1 2 3 4 5 1946 3 1 2 5 4 1956 3 1 2 7 5 196

浏览 4提问于2015-10-07得票数 10

3回答

熊猫:组合成两栏的熊猫0.23.4

python、python-3.x、pandas

我对Python相当陌生。我在网上偶然发现了。不幸的是，这个被接受的答案不再适用于熊猫版本0.23.4 --这篇文章的目的是找出组变量的组合，并为值创建一个字典。也就是说，group_by应该忽略分组的顺序。以下是公认的答案： import pandas as pd from collections import Counter d = pd.DataFrame([('a','b',1), ('a','c', 2), ('b','a',3), ('b','a',3

浏览 0提问于2018-12-03得票数 3

回答已采纳

1回答

如何按多列值数分组汇总pandas DataFrame？

python、pandas、dataframe

如果这是个受骗者，请给我带路。我了几个，但是没有解决我的问题。我有一个虚拟的DataFrame，如下所示： grp Ax Bx Ay By A_match B_match 0 foo 3 2 2 2 False True 1 foo 2 1 1 0 False False 2 foo 4 3 0 3 False True 3 foo 4 3 1 4 False False 4 foo 4 4 3 0 False Fals

浏览 24提问于2020-05-23得票数 2

回答已采纳

1回答

为什么在应用程序中使用Lambda时出现错误

python、pandas

请求帮助以了解为什么出现以下错误？： import numpy as np from pydataset import data mtcars = data('mtcars') mtcars.apply(['mean', lambda x: max(x)-min(x), lambda x: np.percentile(x, 0.15)]) 我正在尝试为数据集mtcar的所有列创建一个具有平均值、最大-最小值和15%的数据框。错误消息： -------------------------------------------------------------

浏览 34提问于2021-07-27得票数 0

回答已采纳

1回答

ValueError:无法识别的后端字符串'gtkagg'：有效字符串为['GTK3Agg'，

python-3.x、tensorflow、matplotlib

import matplotlib matplotlib.use('GTKAgg') import matplotlib.pyplot as plt import numpy as np from sklearn import datasets, linear_model import pandas as pd ValueError: Unrecognized backend string 'gtkagg': valid strings are ['GTK3Agg', 'GTK3Cairo', 'MacO

浏览 5提问于2019-12-01得票数 0

1回答

如何在聚集熊猫数据时进行字符串操作？

python、pandas

我需要对熊猫的数据进行一些汇总。我用的是熊猫版本1.3.3。我似乎只能使用内置python函数(如max函数)来聚合包含字符串的列。试图使用任何自定义函数(即使是只调用内置max的函数)执行相同的操作会导致错误，如下面的示例所示。在这个例子中，有人能告诉我我做错了什么吗?使用自定义函数进行字符串聚合的正确方法是什么？ import pandas as pd # Define a dataframe with two columns - one with strings (a-e), one with numbers (1-5) foo = pd.DataFrame( data={

浏览 12提问于2022-03-03得票数 1

回答已采纳

1回答

Pandas数据帧使用用户定义的函数对多列进行分组聚合

python、pandas、dataframe、pandas-groupby、pandas-apply

我正在尝试通过数据框上的用户定义函数对多个列使用分组聚合。数据框应该是这样的。我想按monthEndDate和stock对卷和logRet组进行一些聚合数据框将如下所示 +---------------------------------------------------+ | date monthEndDate stock volume logRet | +---------------------------------------------------+ | 1990-01-01 1990-01-31 A 1 NA

浏览 14提问于2020-10-22得票数 1

2回答

我们如何将不同的格式应用于数据帧中的不同列？

python、python-3.x、pandas、dataframe

我在这里看到了一个问题，关于将不同类型的格式应用于数据帧中的不同列。用户的解决方案如下所示。 format_dollar = "${0:.2f}".format format_percent = "{0:.2f}%".format df_agg[['YTD Open', 'REV2', 'Real_Profit']] = df_agg[['YTD Open', 'REV2', 'Real_Profit']].applymap(format_dollar) df_a

浏览 15提问于2021-01-27得票数 0

回答已采纳

1回答

pandas.DataFrame.agg不适用于np.std？

python、pandas、numpy、aggregate、aggregate-functions

我正在尝试使用pandas.DataFrame.agg函数在第一列的上使用agg函数是numpy.std。我不知道为什么它适用于numpy.mean，而不是numpy.std。谁能告诉我在什么情况下会发生这种事。这是很奇怪的以下是我所面临的问题。我的线人是这样的 print(type(dataframe)) print(dataframe.head(5)) first_col = dataframe.columns.values[0] agg_df = dataframe.agg({first_col: [np.mean]}) print(agg_df) 然后，它将显示如下结果 &l

浏览 0提问于2021-05-25得票数 1

1回答

Pandas -为什么抛出ValueError？

python、pandas

有人知道熊猫为什么抛出ValueError以及如何修复它吗？我只想计算按"CurveName“和"Tenor”分组时"Value“列的差异。 Example

浏览 12提问于2020-09-04得票数 0

1回答

如何利用数据列作为函数的输入来计算rolling.agg('max')

pandas、user-defined-functions、valueerror

我在和一家kline数据中心合作。我正在向我的df中添加一个Swing_High和Swing_Low列。我发现了一个错误，在低波动期，我的== Swing_Low收盘价。这给我提供了一个inf错误，在我的另一个函数关闭/ Swing_Low。要解决这个问题，我需要根据是否关闭== Swing_Low来计算最大/分钟值。默认情况下，滚动期为10，但如果上述情况为真，则将滚动周期增加到15。下面是我如何计算Swing_High和Swing_Low直到遇到Inf错误。 import pandas as pd df = pd.read_csv('Data/bybit_BTCUSD_15

浏览 4提问于2022-11-18得票数 1

回答已采纳

2回答

Python Pandas agg错误

pandas、aggregation、python-3.x

我试图在Pandas中使用agg函数生成描述性统计数据。我在使用lambda函数的一行时遇到了麻烦。当我将它们作为单独的代码行运行时，它们可以工作，但当我将它们作为一行运行时，就会出现错误。任何指导都是非常感谢的。当我单独运行它们时，以下两行代码可以工作。第一行代码： bh_df.groupby('CAT.MEDV').agg( avg_Nox=('NOX', 'mean')) 第二行具有lambda函数。 bh_df.groupby('CAT.MEDV').agg( rng=("NOX", lam

浏览 0提问于2019-12-19得票数 1

1回答

Groupby不同数据类型的多个列并聚合到列表

python、pandas

输入df如下所示 Name num1 num2 key filter1 filter2 value TOM 1.1 2.1 a True False 1.0 TOM 1.1 2.1 b True False 2.0 TOM 1.1 2.1 c True False 3.0 TOM 1.1 2.1 d True False 4.0 SAM 1.2 2.1 a False True 5.0

浏览 13提问于2020-01-11得票数 2

1回答

Pandas DataFrame.Groupby.Agg字典中的自定义列选择

python、python-3.x、pandas-groupby

在选择要插入到Pandas.DataFrame.Groupby.agg中的列时，我遇到了问题。这是获取和准备数据的代码。 # Data Collecting and library import from pandas_datareader import data import pandas as pd symbol = 'AAPL' source = 'yahoo' start_date = '2018-01-01' end_date = '2019-04-24' stock = data.DataReader(symbol

浏览 2提问于2019-10-14得票数 1

回答已采纳

1回答

将mllib函数应用于中的组上

pyspark

我想将pyspark.ml.evaluation中的AUC函数应用到pyspark中的组中。我从数据库中选择了一个星火表，并列出了我的得分和观察栏： predictionAndSprScoreLabels_sda = spark.table('sda_model').filter((col('region_id') == region_id) & (col('weekend_day') == to_date(lit(execParams['date']), 'yyyy-MM-dd'))).sel

浏览 11提问于2022-11-08得票数 0

2回答

pandas:聚合时排除零

python、pandas

考虑一些示例pandas数据集： df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9], [0, 0, 0]], columns=['A', 'B', 'C']) 现在，我想聚合我想要排除零的每一列(比如计算平均值)。我可以看到有可以调用的agg函数，但我不知道如何在计算平均值时排除零。我知道在映射列时，我需要以某种方式过滤掉零，但我不知道如何将

浏览 23提问于2021-01-22得票数 1

2回答

如何在包含重复条目的列上创建一个数据透视表，这些重复条目应按另一列的值进行分组？

python、pandas、dataframe、pivot-table

假设我有一个这样的数据帧 import pandas as pd df = pd.DataFrame({'key1': ['id1','id1','id1','id1','id2','id2','id2','id3'], 'key2': ['MIN','MIN','MAX','MAX','MIN','M

浏览 47提问于2021-02-27得票数 3

回答已采纳

1回答

如何在Python中按列分组和按自己的函数进行汇总

python、r、pandas、group-by

让df成为我们来自Pandas的测试数据： import pandas as pd import numpy as np df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], 'B' : ['one', 'one', 'two', '

浏览 1提问于2017-03-03得票数 2

回答已采纳

1回答

预期字符串，在一个大文件上使用熊猫数据时找到的int

python、string、pandas、large-data

我已经问过了，但是当我对超过百万行的文件执行下面的代码时，我会遇到一个问题。代码： import numpy as np import pandas as pd import xlrd import xlsxwriter df = pd.read_excel('full-cust-data-nonconcat.xlsx') df =df.groupby('ORDER_ID')['ASIN'].agg(','.join).reset_index() writer = pd.ExcelWriter('Pyt

浏览 2提问于2017-02-17得票数 1

1回答

无法将DataFrame与<class 'pandas.core.groupby.DataFrameGroupBy'>类型的实例合并

python、pandas、dataframe、group-by

我正在尝试解决这个错误； ValueError: can not merge DataFrame with instance of type <class 'pandas.core.groupby.DataFrameGroupBy'> 我想合并由agg创建的两个数据帧；首先，我从主df创建了分组数据的df； resi_all_nooutliers_bysector = df_resi_rawdata_nooutliers.groupby(['postcode_sector']) resi_flats_nooutliers_bysector = d

浏览 0提问于2017-08-22得票数 2

1回答

如何用Python在海运中绘制聚合数据？

python、pandas、matplotlib、seaborn

我有一个跨越时间的测量数据，其中包含了副本。我正在尝试用海运绘制这个数据文件的聚合和汇总版本。数据如下： A = pandas.DataFrame({"measurement": [1, 1, 1, 1, 1, 2, 2, 2, 2, 2], "t": [1, 2, 3, 4, 5, 1, 2, 3, 4, 5], "value": [10, 10.5, 10.4, 10.6, 10.01, 10

浏览 2提问于2015-12-15得票数 1

回答已采纳

2回答

如何在熊猫agg函数中使用pd.Series对象的if语句

python、pandas

我试图聚合一个数据集，其中一个列包含一些URL。考虑以下数据集 import pandas as pd df = pd.DataFrame({"ID": [1, 1, 1, 2, 2], "Website": ["https://www.auctionbid.com", "https://www.google.com", "https://www.awesom

浏览 4提问于2017-02-22得票数 1

回答已采纳

1回答

是否可以将scipy.stat函数包含在熊猫的聚集函数中？

python、pandas、numpy、scipy

import pandas as pd import numpy as np import scipy.stats as st num = np.random.randint(20,100, size=10) df = pd.DataFrame(num, columns=["Weight"]) df.agg([np.sum, np.std, st.sem]) ，我收到了跟随错误。 RuntimeWarning:切片keepdims=keepdims的自由度<= 0 ValueError回溯(最近一次调用) ->1 df.agg(np.sum，np.std，st

浏览 5提问于2020-02-05得票数 0

1回答

无法从pandas分组数据中获取直方图

python、pandas、histogram、pandas-groupby、frequency-distribution

我有这个DF。 f = { 'Router_name':['count'] } a = a.groupby(['Week_end']).agg(f) 它会生成以下数据。 Router_name count Week_end 29 3 30 10 31 6 32 4 33 9 34 2 35

浏览 7提问于2017-12-28得票数 0

回答已采纳

2回答

如何将数据从长转换为宽，并在索引中按年对值进行分组？

python、arrays、pandas、dataframe、matplotlib

下面的代码与我使用的前一个csv一起工作，两个csv的列数量相同，列的名称也是相同的。运行的csv的数据没有的csv数据这个错误意味着什么？我为什么要犯这个错误？ from pandas import read_csv from pandas import DataFrame from pandas import Grouper from matplotlib import pyplot series = read_csv('carringtonairtemp.csv', header=0, index_col=0, parse_dates=True, squeeze=

浏览 3提问于2020-09-20得票数 6

回答已采纳

1回答

pandas.core.base.SpecificationError:使用partial作为agg函数时，函数名称必须是唯一的

python、pandas

重现问题： import pandas as pd from functools import partial def quantile_builder(portion, x): print(x) return x.quantile(portion) q90 = partial(quantile_builder, 0.90) q95 = partial(quantile_builder, 0.95) data = [('a', 1), ('a', 1),('b', 1),('a', 3),('b

浏览 52提问于2020-04-02得票数 0

回答已采纳

1回答

使用lambdas时聚合失败

python、dask

我正在尝试将我的应用程序的一部分从pandas移植到dask，但在dask DataFrame上的groupby中使用lamdba函数时遇到了障碍。 import dask.dataframe as dd dask_df = dd.from_pandas(pandasDataFrame, npartitions=2) dask_df = dask_df.groupby( ['one', 'two', 'three', 'four'],

浏览 3提问于2016-11-28得票数 6

1回答

如何在Bokeh的Box plot中添加水平线(``Span``)？

python、pandas、dataframe、data-visualization、bokeh

我想要的是渲染一个带有的，这样我就可以看到哪些值(用条形表示)超过了特定的阈值(水平线)。我的数据由Pandas dataframe表示。 from bokeh.plotting import figure, output_file, show from bokeh.charts import Bar from bokeh.models import Span from bokeh.io import save from pandas import DataFrame output_file('tmp_file') p = figure(plot_width=800, pl

浏览 4提问于2016-09-10得票数 0

回答已采纳

1回答

Python中聚合数据的描述性统计

python、pandas

我有一个已经聚合的数值数据集，即它包含对:原始值、计数(原始数据集中给定值出现的次数)。如何仅使用聚合数据集获取原始数据集的描述性统计信息。我正在寻找简单的解决方案(最好使用现有的库和函数)。示例：让我们假设原始数据集是[1, 1, 1, 1, 1, 2, 2, 2, 4]。我可以按以下方式计算描述性统计数据(例如使用Pandas)： data = [1, 1, 1, 1, 1, 2, 2, 2, 4] df = pandas.DataFrame(data, columns = ['value']) print(df.describe()) 输出： v

浏览 1提问于2019-09-18得票数 0

回答已采纳

2回答

查找熊猫Dataframe列的唯一行，第二列的所有值都是NaN

python、pandas、dataframe、pandas-groupby

嗨，我在努力解决以下问题：给定包含name和variable列的数据文件，我想创建两个列表： list_names_nan包含变量列中所有值都为nanlist_names_not_nan的名称，其中包含变量列中列表1中的值不是nan的名称。下面是一个例子 import pandas import numpy df = pandas.DataFrame(data=[['x',1],['y',2],['x',4],['z',numpy.nan], ['x',

浏览 6提问于2020-07-15得票数 3

回答已采纳

1回答

df (未分组)的命名聚合引发错误：“TypeError: aggregate()缺少1个必需的位置参数：”“func”

python、pandas、dataframe、aggregate

当我使用文档中的数据帧的命名聚合重现该示例时，我得到一个错误。Docs：https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.aggregate.html我在Python3.7上运行Spyder4.2.5，在另一台运行Python3.8和Python3的Jupyter Notebook上也得到了相同的错误。Pandas版本1.0.5。可重现的代码： import pandas as pd import numpy as np df = pd.DataFrame([[1, 2, 3],

浏览 16提问于2021-06-14得票数 2

1回答

grouped_agg : pandas_udf，Pyspark的多个参数

python、pandas、pyspark、user-defined-functions

我正在尝试应用一个带有两个参数的pandas_udf。但是我得到了这个错误。首先，我尝试使用一个参数，它是可以的： from pyspark.sql.functions import pandas_udf, PandasUDFType from pyspark.sql import SparkSession from pyspark.sql.types import * spark = SparkSession \ .builder \ .config('spark.cores.max', 100) \ .getOrCreat

浏览 24提问于2018-12-19得票数 3

2回答

Python :高效地将不同的函数聚合在不同的列上，并将结果列组合在一起

python、pandas、performance、aggregate、pandas-groupby

到目前为止，我对标题中描述的任务的处理方法是相当简单的，但它似乎有点低效/非unpythonic。我通常做的一个例子如下：最初的Pandas DataFramedf有6列：'open', 'high', 'low', 'close', 'volume', 'new dt' import pandas as pd df_gb = df.groupby('new dt') arr_high = df_gb['high'].max() arr_low = df_gb

浏览 0提问于2019-08-22得票数 0

回答已采纳

6回答

熊猫agg和应用功能有什么区别？

python、pandas、pandas-groupby

我不知道Pandas .aggregate函数和.apply函数之间的区别。以下面的例子为例:我加载了一个数据集，执行了一个groupby，定义了一个简单的函数，或者用户.agg或者.apply。正如您可能看到的，在使用.agg和.apply之后，函数中的using语句将产生相同的输出。结果，另一方面，是不同的。为什么会这样呢？ import pandas import pandas as pd iris = pd.read_csv('iris.csv') by_species = iris.groupby('Species') def f(x):

浏览 0提问于2014-02-17得票数 63

回答已采纳

1回答

将PySpark groupby collect_set迁移到Dask

python、pandas、dask

我正在将一个pySpark实现迁移到Pandas。为了转换大型数据集，我使用了dask包。 pySpark实现： df.groupBy('Key').agg(collect_set('ColumnA').alias('Items'), collect_set('ColumnB').alias('DocumentId')) 到Pandas df.groupby("Key")[['ColumnA','ColumnB']].agg(set).reset_index() 然

浏览 31提问于2021-08-16得票数 0

2回答

熊猫无法使用聚合函数列表进行聚合。

python、pandas、aggregate

如何指定自定义聚合函数，使其在pandas.DataFrame.aggregate的列表参数中使用时行为正确在熊猫里有两列数据. import pandas as pd import numpy as np df = pd.DataFrame(index=range(10)) df['a'] = [ 3 * x for x in range(10) ] df['b'] = [ 1 -2 * x for x in range(10) ] ..。在聚合函数规范列表上进行聚合不是一个问题： def ok_mean(x): return x.mean() df.

浏览 4提问于2019-02-26得票数 4

1回答

合并分类栏的问题

python、pandas

在聚合包含分类列的多个列时，我在pandas 0.25.2中遇到了一个问题。 import pandas as pd df = pd.DataFrame({ "col1": [1, 3, 4, 1], "col2": pd.Categorical(["b", "a", "c", "b"], categories=["a", "b", "c"], ordered=False), "col3": [4, 5,

浏览 5提问于2019-11-03得票数 4

回答已采纳

6回答

从pandas.core.series.Series中移除前导零点

python、pandas、time-series

我有一个带有数据的pandas.core.series.Series 0 [00115840, 00110005, 001000033, 00116000... 1 [00267285, 00263627, 00267010, 0026513... 2 [00335595, 00350750] 我想从序列中移除前导零。 x.astype('int64') 但得到了错误信息 ValueError: setting an array element with a sequence. 你能建议我如何在python3.

浏览 11提问于2018-01-07得票数 7

回答已采纳

1回答

Pandas错误“只能比较具有相同标签的DataFrame对象”

python、pandas、pandas-groupby

我有2个数据帧生成为 df_atn5_agg = df_atn5.groupby(['pipeline_name'], as_index=False).agg({'tot_map_comp_mins':['count', p25]}) df2_t1 = df_atn5_agg[df_atn5_agg['tot_map_comp_mins']['count'] > 1] df_prod_agg = df_prod.groupby(['pipeline_name'], as_index=Fals

浏览 41提问于2020-03-06得票数 0