使用apply()函数在pandas中的groupby之后创建列表_使用.apply()和Range函数在Pandas Dataframe中创建索引级列表_在Pandas GroupBy对象上使用'Apply‘的替代方法 - 腾讯云开发者社区

python、pandas

我有一个pandas dataframe，其中一列包含每个实例的唯一字符串列表： obj_movies['unique_genres'].head() 0 [Action, Fantasy, Adventure, Science Fiction] 1 [Action, Fantasy, Adventure] 2 [Action, Adventure, Crime] 3 [Action, Drama, Thriller, Crime] 4

浏览 18提问于2018-06-14得票数 0

回答已采纳

1回答

如何对组进行迭代

python、pandas、matplotlib

我正在尝试迭代组(由group.by在Pandas中生成)，以便应用一个函数(在MatPlotLib中创建一个图表)，并在DataFrame中获得每个组的结果。我想做这样的事情，但我知道有一个更好的/功能更好的方法： import pandas as pd DF = pd.DataFrame({'COL1': ['A', 'A','B','B'], 'COL2' : [1,1,2,2], 'COL3' :

浏览 0提问于2015-11-23得票数 0

2回答

如何对排序的pandas.Series进行分组？

python、pandas

给定排序的pandas.Series (或仅仅是list)对象，我希望创建组(例如列表或pandas.Series)，使组中相邻元素之间的差异小于某些阈值，例如： THRESHOLD = 2 sorted_list = [1, 2, 10, 15, 16, 17, 20, 21] # ... result = [[1, 2], [10], [15, 16, 17], [20, 21]]

浏览 1提问于2019-03-27得票数 2

回答已采纳

2回答

Pandas，未来警告:使用多个键进行索引

python、pandas

当我将一个函数应用于groupby对象的多个列时，Pandas抛出一个Future警告。它建议使用列表作为索引，而不是元组。我们该怎么做呢？ >>> df = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]]) >>> df.groupby([0,1])[1,2].apply(sum) <stdin>:1: FutureWarning: Indexing with multiple keys (implicitly converted to a tuple of keys) will be deprecated, us

浏览 2提问于2020-04-03得票数 36

回答已采纳

2回答

特定的Python cumsum

python、pandas

我目前正在使用Pandas开发python Dataframes。我需要使用另一个数据帧来创建特定的数据帧。第一个数据帧如下所示 Index | Value ______|_______ 0 | 1.1 0 | 0.3 1 | 1 2 | 0.2 2 | 3 2 | 1.3 我需要使用groupby()和cumsum()创建另一个数据帧。我希望cumsum()是一个向量。结果应该如下所示： Index | Value ______|_______ 0 | [1.1 , 1.4] 1 | [1] 2 | [0.2 ,

浏览 12提问于2020-07-06得票数 0

回答已采纳

1回答

用熊猫词典格式从python中的Excel中获取数据

python、python-3.x、pandas

我有这样的Excel数据 Category Item old apple new mango old grape new ginger 我需要用熊猫的字典格式来获取蟒蛇的数据，比如- {'old': ['apple', 'grape'], 'new': ['mango', ginger']} 从堆栈溢出的引用中，它们提供了如下代码 import pandas as pd df = pd.read_excel("Skills.xl

浏览 7提问于2022-10-27得票数 0

回答已采纳

2回答

如何在python pandas中使用groupby连接字符串？

python、pandas、grouping

我目前在顶部有数据帧。有没有办法使用groupby函数来获取另一个数据帧来对数据进行分组，并将单词连接成下面使用python pandas的格式？谢谢 [

浏览 0提问于2016-06-30得票数 8

回答已采纳

1回答

如何创建新的pandas列，该列是索引范围中不包括行值的每个值的列表

python、pandas、list、dataframe、indexing

我想知道是否可以在pandas dataframe中创建一个新列，它是每个值的列表，不包括行本身的值。例如，在下面的df中，对于列'list‘中的第一行，值b，c，以及行本身的值'a’。是否可以对每个索引执行此操作？我已经尝试过了，但它返回了每个索引组合的所有值的列表： import pandas as pd d = {'index': [1, 1, 1, 2, 2, 3], 'col1': ['a', 'b', 'c', 'd', 'e, f', 'g&

浏览 13提问于2020-05-29得票数 0

回答已采纳

1回答

使用Pandas groupby方法，查找每个组中的最大值

pandas

通过使用Pandas groupby，我获得了某些用户在一周中的任何一天平均有多少活动的数据。根据用户和日期分组，我计算了过去30天内几个用户的最大值和平均值。现在，我想要找出，对于每个用户，哪一天对应于他们的每日最大活动，以及该活动的平均大小。在pandas中执行这样的任务的方法是什么？原始数据如下所示： userID countActivity weekday 0 3 25 5 1 3 58 6 2 3 778 0 3 3 7820

浏览 9提问于2016-09-28得票数 1

回答已采纳

2回答

根据索引对Pandas行进行分组

python、pandas、dataframe

我有一个Pandas DataFrame，我正在尝试根据列值对行进行分组，并将一些行合并到列表中。请允许我详细说明：我拥有的DataFrame如下所示： industry index entities cars 0 ['Norway', 'it'] cars 0 ['Mercedes', 'they'] cars 0 ['it', 'EV', 'its'] nature

浏览 18提问于2019-07-15得票数 1

回答已采纳

1回答

Pandas.groupby.apply()中的内存泄漏？

python、memory-leaks、pandas

我目前正在使用Pandas与csv源文件约600‘m的项目。在分析过程中，我正在将csv中的内容读入一个dataframe，对某个列进行分组，并将一个简单的函数应用于分组数据。我注意到在这个过程中我要进入交换内存，所以进行了一个基本测试：我首先在shell中创建了一个相当大的数据帧： import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(3000000, 3),index=range(3000000),columns=['a', 'b', 'c']) 我

浏览 1提问于2014-08-05得票数 10

回答已采纳

1回答

按一组熊猫分组

python、pandas、group-by、set

我有一个例子df import pandas as pd import numpy as np df = pd.DataFrame({'name':['Josh', 'Paul','Ivy','Mark'], 'orderId':[1,2,3,4], 'purchases':[['sofa','sofa','chair'],

浏览 2提问于2021-11-10得票数 3

回答已采纳

1回答

在R中做dt[，y:=myfun(x)，by=list(a，b，c)]是怎样的？

python、r、pandas

假设我有一个具有列x, a, b, c的数据框架，并且我希望通过a, b, c进行聚合，以便通过函数myfun从x的列表中获得一个值y，然后复制每个窗口/分区中所有行的值。在data.table中的R中，这只是一行：dt[,y:=myfun(x),by=list(a,b,c)]。在Python中，我想到的唯一方法是这样做： # To simulate rows in a data frame class Record: def __init__(self, x, a, b, c): self.x = x self.a = a

浏览 0提问于2013-12-06得票数 7

回答已采纳

3回答

Python大熊猫:追加DataFrame行并删除附加行

python、pandas、dataframe

import pandas as pd df = pd.DataFrame({ 'id':[1,2,3,4,5,6,7,8,9,10,11], 'text': ['abc','zxc','qwe','asf','efe','ert','poi','wer','eer','poy','wqr']}) 我有一个包含列的DataFrame： id text 1 a

浏览 5提问于2017-04-17得票数 2

回答已采纳

4回答

使用apply()从两列创建新列

python、pandas、dataframe、apply

我想使用apply()创建一个带有Pandas DataFrame的列s['C']。我的数据集与此类似：在……里面 s=pd.DataFrame({'A':['hello', 'good', 'my', 'pandas','wrong'], 'B':[['all', 'say', 'hello'], ['good', '

浏览 1提问于2020-05-11得票数 10

3回答

展平Pandas Groupby后面的列表列

pandas、pandas-groupby、flatten

我有一个包含I和代码的pandas数据帧，它们的类型是list： df = pd.DataFrame({'ID': [1, 1, 1, 2, 2, 3, 3, 4], 'Code': [['A', 'B'], ['A', 'B'], ['A', 'B', 'C'], ['A'], ['A'], ['A', 'C'], ['D', &

浏览 27提问于2020-11-24得票数 0

1回答

DataFrameGroupBy中键、值的条件迭代

python、loops、dictionary、pandas、conditional

我在python (2.7)中有一个pandas (v0.12)数据帧data。我对data中的A和B列进行了groupby()，以形成类型为<class 'pandas.core.groupby.DataFrameGroupBy'>的groups对象。我想遍历groups中包含多行的数据帧并对其应用一个函数。我的代码如下，这里的每个数据帧都是键、值对中的value： import pandas as pd groups = data.groupby(['A','B']) len(groups) >> 1

浏览 1提问于2015-02-20得票数 0

2回答

计算群上的扩展标准差

python、pandas

我想计算一个组的扩展标准差。我试过以下几种方法： df['RunStdDev'] = df.groupby(['LEFT PORT DATE TIME'])['SPEED'].apply.pd.expanding_std() 我得到了错误： AttributeError: module 'pandas' has no attribute 'expanding_std' 我做错了什么？

浏览 1提问于2019-10-20得票数 0

回答已采纳

1回答

熊猫-列表值列(str类型)-查找与另一个列表的任何元素匹配(也是str类型)

python、pandas、string、list、dataframe

我有以下名为pro的Pandas property name 0 too Deliveroo 1 bar Gousto 2 baz Gousto 3 foobar Deliveroo 4 too Gousto 5 foobaz Deliveroo 应用下列代码时： property = pro.groupby('name')['property'].apply(list).reset_index(name='property'

浏览 2提问于2021-08-25得票数 0

回答已采纳

1回答

TypeError:在使用apply后跟groupby时，<lambda>()获得了意外的关键字参数'axis‘

python、pandas、pandas-groupby

我试图从按ID拆分的pandas Dataframe中提取值。但是，当我提供apply groupby时，它不允许我提供轴参数来按行应用函数 raw_data = {"id":{"0":"mergedshape_route_0009","1":"mergedshape_route_0009","2":"mergedshape_route_0009","3":"mergedshape_route_0009","4":"merge

浏览 726提问于2019-04-05得票数 2

回答已采纳

1回答

Dask/Pandas是否支持基于依赖于其他行的复杂条件删除组中的行？

python、pandas、dask、toolz

我正在使用Dask处理一堆csv格式的基于文本的记录，我正在学习使用它来解决内存问题太大的问题，并且我正在尝试过滤最符合复杂条件的组中的记录。到目前为止，我所确定的处理此问题的最佳方法是基本上使用Dash将记录分组为比特大小的块，然后用Python编写适用的逻辑： def reduce_frame(partition): records = partition.to_dict('record') shortlisted_records = [] # Use Python to locate promising looking records.

浏览 6提问于2019-07-25得票数 0

1回答

创建一个汇总变量，获取在Pandas/Python中根据字典中的多个列表检查多个变量的结果

python-3.x、pandas、iteration、multiple-columns、scanning

DXCODE1 DXCODE2 DXCODE3 A1 A2 B2 C2 D3 NaN B2 C2 A1 DXCODE_DICTIONARY = {'Code_Apple':['A1', 'A2', 'A3', 'A4'], 'Code_Banana':['B1', 'B2', 'B3'], 'Code_C

浏览 0提问于2018-09-21得票数 0

1回答

对于Pandas上的每个循环，每个类别

python、python-3.x、pandas

我有个问题。我有一张这样的桌子 TAC | Latitude | Longitude 1 | 50.4 | -1.5 在Pandas中，我想说：对于每个TAC，给我一个纬度和经度的压缩列表(每个TAC可以有很多行)。我尝试过下面的方法，但是我做错了一些事情！你能帮上忙吗？ df1['coordinates'] = list(zip(df1.Lat, df1.Long)) new_df = df1.iloc[ : , : ].groupby('TAC').agg(df1['coordinates']) 作为参考，DF1的创建方式如下 df

浏览 14提问于2019-10-10得票数 1

回答已采纳

1回答

pandas:如何在应用中同时使用groupby对象的名称和数据帧

python、pandas

我有一个pandas groupby对象，创建方法是 g = df.groupby(`id`) 在具有列id的dataframe df上。现在我还有一个接受id, group作为输入的函数func。我想对groupby对象中的每个id, group应用func。目前我使用的是一个循环： for id, group in g: func(id, group) 有没有更好(更快)的方法来使用apply或类似的方法来实现这一点？

浏览 0提问于2014-03-13得票数 1

1回答

如何在聚合字段中创建dict/对象/映射

python、pandas

我在熊猫中有以下groupedby对象： df_grouped = df.groupby(by=['resolution','media_type', 'asset_type']).file_name print (type(df_grouped)) # <class 'pandas.core.groupby.generic.SeriesGroupBy'> 如果我应用一个列表，它看起来是这样的： print (df_grouped.apply(list)) # resolution media_type asset

浏览 2提问于2020-08-14得票数 1

回答已采纳

1回答

从熊猫数据中生成一个名元组词典

python、python-3.x、pandas

目前，我正在使用Python3.6和Pandas来优化一个过程。这个过程是使用Pandas。这个过程的最后一步是生成一个namedtuples字典。我正在尝试使用apply过程有效地将熊猫groupby转化为namedtuples列表。 from collections import namedtuple import pandas as pd dfdata= [('cat01','t1', 50), ('cat01','t2',60) ,(

浏览 1提问于2018-01-16得票数 4

回答已采纳

2回答

用熊猫资料制作词典

python、python-3.x、pandas、dictionary

我有熊猫数据框架，，城镇，，它看起来像这样： **towns** Paris Berlin London etc.. 另外，我还有一个数据帧totalPopulation，它看起来像这样： ID-cell TOWNS NumberOfPopulation 1 Paris 444 1 Berlin 333 1 London 111 2 Paris 222 2 London 555 3 Paris 999 我需

浏览 0提问于2018-06-15得票数 1

回答已采纳

4回答

如何从Pandas Dataframe创建多个元组列表

python、pandas、list、tuples

我有一个Pandas数据框架，其中包含三列。我希望根据Project列中的值创建多个元组列表 print (df) Project Resource Time 0 P1 0 4 1 P1 2 4 2 P1 1 10 3 P1 3 3 4 P2 1 3 5 P2 3 10 6 P2 0 11 7 P2 2 3

浏览 6提问于2019-11-22得票数 1

回答已采纳

1回答

如何将熊猫系列按值分组并返回这些值的指数列表，而不首先显式地转换该系列？

python-3.x、group-by、series

我有一个熊猫系列，看起来是这样的： import numpy as np import string import pandas as pd np.random.seed(0) data = np.random.randint(1,6,10) index = list(string.ascii_lowercase)[:10] a = pd.Series(data=data,index=index,name='apple') a >>> a 5 b 1 c 4 d 4 e 4 f 2 g 4 h 3 i

浏览 3提问于2022-12-02得票数 1

回答已采纳

6回答

熊猫agg和应用功能有什么区别？

python、pandas、pandas-groupby

我不知道Pandas .aggregate函数和.apply函数之间的区别。以下面的例子为例:我加载了一个数据集，执行了一个groupby，定义了一个简单的函数，或者用户.agg或者.apply。正如您可能看到的，在使用.agg和.apply之后，函数中的using语句将产生相同的输出。结果，另一方面，是不同的。为什么会这样呢？ import pandas import pandas as pd iris = pd.read_csv('iris.csv') by_species = iris.groupby('Species') def f(x):

浏览 0提问于2014-02-17得票数 63

回答已采纳

1回答

对pandas groupby操作应用排序

python、pandas

如何对pandas groupby操作应用排序？下面的命令返回一个错误，指出'bool‘对象不可调用 import pandas as pd df.groupby('cokey').sort('A') cokey A B 11168155 18 56 11168155 0 18 11168155 56 96 11168156 96 152 11168156 0 96

浏览 1提问于2015-04-07得票数 14

回答已采纳

1回答

如何实现我自己的describe()函数，以便在resample()中使用

python、pandas

我正在处理表示向量(幅度和方向)的时序数据。我想要我的数据，并使用describe函数作为how参数。但是，describe方法使用标准平均值，我想使用一个特殊的函数来平均方向。因此，我在pandas.Series.describe()实现的基础上实现了我自己的describe方法 def directionAverage(x): result = np.arctan2(np.mean(np.sin(x)), np.mean(np.cos(x))) if result < 0: result += 2*np.pi return result d

浏览 1提问于2013-02-13得票数 5

回答已采纳

1回答

我想知道是否可以使用列表理解或数据挖掘的方法来实现pandas.groupby操作？

python-3.x、pandas

熊猫的数据处理方法包括一个群， import pandas as pd df=pd.read_csv('battle.csv') df[['region','location']].groupby('region').count() 此方法生成如下所示的数据 region count A 5 B 2 C 6 我试图使用df.apply()或列表理解来实现相同的操作，以熟悉python中的编码。请提出你的意见。

浏览 2提问于2017-01-05得票数 0

回答已采纳

3回答

python熊猫群/应用:到底传递给应用函数的是什么？

python、pandas、dataframe、pandas-groupby、pandas-apply

这里是Python新手。我正在努力了解熊猫群是如何工作的，并应用这些方法。我找到了的简单示例，我将其粘贴在下面： import pandas as pd ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings', 'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals

浏览 2提问于2019-09-01得票数 4

回答已采纳

1回答

Pandas使用两个(或更多)值进行分组聚合

python、pandas

我想知道是否有一个很好的方法来做下面的事情我有一个包含country, user_id, actual_value, prediction列的pandas df 我想计算每个国家的精确度。精确度方法需要两个数组。一个代表实际情况，另一个代表未来 import pandas as pd from sklearn.metrics import balanced_accuracy_score df = pd.DataFrame( [ ('DEU', 'a', 1, 1), ('DEU', 'b&#

浏览 8提问于2020-09-29得票数 1

回答已采纳

2回答

熊猫向numpy阵列的矢量化整形

python、pandas、numpy

我如何将熊猫的数据重新组合成一个数字数组，即为属于该条目的所有条的foo的每个离散值创建一个列表项，但不需要手动迭代(向量化)？ import pandas as pd d = pd.DataFrame({'foo':[1,1,1,2,2,2], 'bar':[1,2,3,4,5,6]}) display(d) 下列结构的 result = [[1,2,3], [4,5,6]] result

浏览 0提问于2021-05-15得票数 0

回答已采纳

4回答

使用Pandas groupby如何使用加法聚合一列列表？

python、pandas、numpy、pandas-groupby

我有一个dataframe，它有一个列，其中包含一个值列表。数据帧中的每一行都有一个相同长度的列表。我想使用Dataframe.groupby对数据帧中的数据进行分组，并按以下方式对列表求和：在： import pandas as pd #Sample data a = pd.DataFrame([['a', 'test', list([0,1,2,3,4])],['b', 'test', list([5,6,7,8,9])]], columns=['id', 'grp', 'valu

浏览 28提问于2018-09-05得票数 3

回答已采纳

4回答

按键分组的元组列表的字典的数据帧

python、pandas、dictionary、dataframe

我有一个数据帧df，它看起来如下所示： a b c d 0 8 xx 17 1.0 1 8 xy 19 1.0 2 8 zz 13 0.0 3 9 tt 8 5.0 我正在尝试创建一个字典，它有一个带有如下元组列表的键： {8:[(17,1.0),(19,1.0),(13,0.0)], 9:[(8,5.0)]} 这里，键来自列a，元组列表是将键作为a的列c和列d。我也将此方法应用于其他数据集，并已尝试过 df_new = df.groupby([&

浏览 4提问于2017-01-19得票数 1

4回答

在SeriesGroupBy上执行应用程序()之后，我如何“重新分组”我的系列？

python、pandas、pandas-groupby

我需要调整一个现有函数，该函数实质上执行一个Series.str.contains并返回结果的Series，以便能够将SeriesGroupBy作为输入处理。根据熊猫错误信息的建议无法访问“SeriesGroupBy”对象的属性“str”，请尝试使用“应用”方法我尝试在apply()对象上使用SeriesGroupBy，这在某种程度上是工作的，但会导致Series对象。现在，我想对这个Series应用与以前相同的分组。原始函数 def contains(series, expression): return series.str.contains(expression)

浏览 1提问于2019-08-26得票数 1

回答已采纳

2回答

Python 3:通过解析pandas数据帧来构造变量

python、pandas、dataframe

我有以下数据帧，其列为id、start、end、name A 7 340 string1 B 12 113 string2 B 139 287 string3 B 301 348 string4 B 379 434 string5 C 41 73 string6 C 105 159 string7 我正在使用pandas将其读入python3 import pandas df = pandas.read_csv("table", comment="#", header=None, names=["id",

浏览 28提问于2019-03-02得票数 0

回答已采纳

2回答

熊猫在列间操作上的分组和聚合

pandas、aggregate

我是一个R和data.table用户，试图使用更多的Python和pandas，当我想在pandas中执行以下操作时，我感到非常沮丧，因为似乎没有一种简单的方法： df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [0.2, 0.2, 0.2, 0.1], 'c': [10, 9, 10, 22], 'd': [2, 3, 3, 1]}) 在R中，如果我想对b和c的乘积进行求和，并对d之和进行除法(按a分组)，我只需这样做： df[, sum(b*c)/sum(d), by=a] ，但对我来说，

浏览 3提问于2022-05-02得票数 1

回答已采纳

2回答

KeyError与熊猫群比()应用()

python、pandas、dataframe、pandas-groupby、pandas-apply

在这里，我将时间添加到只有日期的数据中。值之间有5分钟，每个日期有288个值。当输入数据为1天(288行)或更短时，代码工作，但在输入时间较长时会出现错误。知道我错过了什么吗？提前谢谢。守则的有关部分： import datetime as dt print("Print df_raw:\n", df_raw) df = df_raw[:288] # df = df_raw[:289] # Gives KeyError, see traceback below print("\nPrint df BEFORE groubpy/apply:\n", df)

浏览 0提问于2020-02-12得票数 2

回答已采纳

1回答

将数组从DatafFame传递到函数，并对数组进行分组和展平

python、pandas、dataframe、pandas-groupby、pandas-apply

我有一个数据帧，其中包含数百名参与者的X位置数据，以及三个分组变量(每个参与者的X数据长度为1000个点)。数据帧预览： X Z participantNum obsScenario startPos targetPos 16000 -16.0 -5.0 6950203 2 2 3 16001 -16.0 -5.0 6950203 2 2 3 16002 -16.0 -5.0 6950203

浏览 15提问于2021-02-05得票数 2

回答已采纳

1回答

如何用Python中的groupby删除list中的dups？

python、pandas、pandas-groupby

有一个大的数据文件，在这里我需要移除行中的陷阱。我使用groupby对ID进行分组，然后将12列的值添加到列表中。我需要的最后一步是删除列表中的重复值。我知道set()将删除传统列表中的陷阱，但我不确定这在我的groupby中是否有效，或者是否有更好的方法。 import pandas as pd df = pd.read_csv("Test.csv") grouped = df.groupby('<ID>')['fb1','fb2','fb3'].apply(lambda x: x.value

浏览 0提问于2019-05-09得票数 1

回答已采纳

4回答

计算列表中包含空字符串的元素数。

python、pandas

我在计算DataFrame列中列表中的元素数时遇到了困难。我的问题来自这样一个事实:在导入输入csv文件后，本应包含空列表[]的行实际上被解析为包含空字符串[""]的列表。下面是一个可重复的例子，让事情变得更清楚： import pandas as pd df = pd.DataFrame({"ID": [1, 2, 3], "NETWORK": [[""], ["OPE", "GSR", "REP"], ["MER"]]}) print(df) ID

浏览 30提问于2022-10-03得票数 0

回答已采纳

1回答

熊猫群转换:同时应用多个函数和自定义名称

pandas、multi-index、pandas-groupby

正如标题所示，我希望能够做以下工作(最好用一些代码来解释)，pandas 0.20.1是必需的 import pandas as pd import numpy as np a = pd.DataFrame(np.random.rand(10, 4), columns=[['a','a','b','b'], ['alfa','beta','alfa','beta',]]) def as_is(x): return x def power_2(x):

浏览 3提问于2017-05-21得票数 3

回答已采纳

2回答

Python、Pandas、DataFrame，添加与SQL GROUP_CONCAT等效的列

python、pandas、dataframe

我的问题与这里问的但没有回答的问题非常相似我有一个熊猫DataFame，我想将它组合成一个数据帧 +------+---------+ | team | user | +------+---------+ | A | elmer | | A | daffy | | A | bugs | | B | dawg | | A | foghorn | +------+---------+ 成为 +------+---------------------------------------+ | team

浏览 0提问于2021-01-09得票数 1

1回答

将列拆分为Pandas中的列表

python、pandas、dataframe

我有一个下面的示例DataFrame： | id | lang | text | _______________________________ | "1" | "en" | "text1" | | "2" | "ua" | "text2" | | "1" | "en" | "text3" | | "2" | "en" | &#

浏览 1提问于2018-03-13得票数 1

回答已采纳

1回答

Pandas条件聚合和非条件聚合在一起

python、pandas、dataframe、aggregate-functions、aggregation

我是一个重度SQL用户，并且我是Python和Pandas的新手。我有一台DataFrame。 import pandas as pd data=[[1,100,'a'],[1,200,'b'],[2,300,'a'],[2,400,'a'],[3,500,'b'],[3,600,'a'],[3,700,'b']] df=pd.DataFrame(data,columns=['Group','Amount','Condition']

浏览 6提问于2019-11-01得票数 0

回答已采纳

5回答

Apply function to pandas groupby

python、pandas

我有一个pandas数据帧，它有一个名为my_labels的列，其中包含字符串：'A', 'B', 'C', 'D', 'E'。我想计算每个字符串出现的次数，然后将计数的数量除以所有计数的总和。我试着在Pandas中这样做： func = lambda x: x.size() / x.sum() data = frame.groupby('my_labels').apply(func) 这段代码抛出一个错误，'DataFrame对象没有'size‘属性。我如何在Pandas中应用函数

浏览 5提问于2013-03-13得票数 53

回答已采纳