在pandas中创建新列时应用lambda函数时出错_每次运行函数时，Pandas都会创建新列_在处理NaN时在Python Pandas中创建新列 - 腾讯云开发者社区

python、pandas

我想应用一个自定义函数并创建一个名为population2050的派生列，该列基于我的数据框架中已经存在的两列。 import pandas as pd import sqlite3 conn = sqlite3.connect('factbook.db') query = "select * from facts where area_land =0;" facts = pd.read_sql_query(query,conn) print(list(facts.columns.values)) def final_pop(initial_pop,growt

浏览 4提问于2016-11-01得票数 33

回答已采纳

3回答

应用具有多个参数的函数来创建新的pandas列

python、pandas

我想通过将函数应用于两个现有列来在pandas数据框中创建一个新列。有了这个，当我只需要一个列作为参数时，我就能够创建一个新列： import pandas as pd df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]}) def fx(x): return x * x print(df) df['newcolumn'] = df.A.apply(fx) print(df) 但是，当函数需要多个参数时，我不知道如何做同样的事情。例如，如何通过将列A和列B传递给下面的函数来创建新

浏览 15提问于2013-11-12得票数 215

回答已采纳

1回答

Pandas对列应用函数

pandas

为什么Pandas在尝试将此函数应用于列时抛出错误？ import pandas as pd import math data = [ ['LAT', "LON"], [49.00, -83.04], [41.00, -83.04], [26.00, -83.04], ] df= pd.DataFrame(data[1:], columns=data[0]) print(df) print((math.cos(49.00) * 69.172) /.25) df['LAT'] = df['LAT

浏览 2提问于2018-02-28得票数 1

回答已采纳

2回答

Python和Pandas:如何计算具有特定条件的列

python、anaconda

浏览 24提问于2020-07-13得票数 0

2回答

如何将多个变量传递给pandas dataframe，以便将它们与.map一起使用来创建新列

python、pandas

要将多个变量传递给一个普通的python函数，您只需编写如下代码： def a_function(date,string,float): do something.... convert string to int, date = date + (float * int) days return date 在使用Pandas DataFrames时，我知道您可以基于一个列的内容创建一个新列，如下所示： df['new_col']) = df['column_A'].map(a_function) # This m

浏览 2提问于2015-05-22得票数 6

3回答

为每个熊猫单元格设置相同的字典

python、python-3.x、pandas

我有一本简单的Python字典。我想在Pandas Dataframe中添加一个新列，其中该列中的每一行都等于字典。 import pandas as pd df = pd.DataFrame(data=[[1,2,3],[4,5,6]],columns=['A','B','C']) df['D'] = {'AA': 'BB', 'CC': 'DD'} 期望输出 A B C D 0 1 2 3 {

浏览 15提问于2019-06-19得票数 1

回答已采纳

1回答

如何在创建后更新lambda函数的源代码散列？

amazon-web-services、aws-lambda、terraform、terraform-aws-modules

我使用Terraform创建AWS函数，并将包存储在S3桶中。为了简洁起见，我不包括所有的代码 // Create S3 Bucket resource "aws_s3_bucket" "this" { bucket = var.s3_bucket } // Create lambda function resource "aws_lambda_function" "middleware" { function_name = var.function_name s3_bucket = var.s3_buc

浏览 8提问于2022-06-24得票数 0

4回答

使用apply()从两列创建新列

python、pandas、dataframe、apply

我想使用apply()创建一个带有Pandas DataFrame的列s['C']。我的数据集与此类似：在……里面 s=pd.DataFrame({'A':['hello', 'good', 'my', 'pandas','wrong'], 'B':[['all', 'say', 'hello'], ['good', '

浏览 1提问于2020-05-11得票数 10

2回答

为什么我们需要添加:当使用.iloc函数定义新列时

python、pandas

当我们在pandas中的dataset中创建新列时 df["Max"] = df.iloc[:, 5:7].sum(axis=1) 如果我们只获取从索引5到索引7的列，为什么我们需要传递: as所有列。

浏览 26提问于2021-08-09得票数 0

2回答

pandas.DataFrame.assign:如何引用新创建的列？

python、python-3.x、pandas、dataframe

我试图在Pandas 1.5.2中使用pandas.DataFrame.assign。让我们考虑一下下面的代码，例如： df = pd.DataFrame({"col1":[1,2,3], "col2": [4,5,6]}) df.assign( test1="hello", test2=df.test1 + " world" ) 我正面临这个错误： AttributeError: DataFrame对象没有属性“test1” 但是，它明确指出：可以在同一个assign中分配多个列。**kwargs中的

浏览 1提问于2022-11-28得票数 1

回答已采纳

1回答

Python & Pandas:构造条件

python、pandas

可能是个新手问题，但我对Python和Pandas还不熟悉，而且还在学习语法。我正在开发一个脚本，在该脚本中，我希望构造一个条件，该条件可以将单元格值乘以整个列。以下是test.csv的结构我想要创建一个列error_count_score，如果它大于3(作为一个error_count公式，它应该是：=IF(C2<=3,0,(C2*3)) )，它可以将error_count单元格中的值乘以3。在本例中，新列的值为0和12。我怀疑有多种方法可以解决这个问题，但我不确定如何构造代码。下面是我的工作代码尝试： import pandas as pd df = pd.read_

浏览 1提问于2021-07-27得票数 0

回答已采纳

1回答

如何在pandas中使用series.map()或series.apply()将函数正确应用于序列

python、pandas

我正在尝试使用pandas将一个预定义函数(myfunc)应用到我的DataFrame中的一个新系列。该函数将检查旧列(对于每行)中的每个索引中的值是否大于前一列中的值，如果是，则返回1，如果不是，则返回0。我还尝试过series.apply()函数，我得到的结果是:跨越新创建的列中的所有行。 def myfunc(x): for i in range(0,86): if x.iloc[i + 1] > x.iloc[i]: yield 1 else: yield 0 df2['Highe

浏览 8提问于2019-07-23得票数 0

3回答

Pandas Apply/Lambda返回数据帧，而不是单行

python、pandas、dataframe、lambda

这是Python和Pandas的新手，所以请耐心听我说。我已经创建了一个10行的数据帧，其中有一个名为'Distance‘的列，我想用apply和我创建的一个lambda函数来计算一个新列(TotalCost)。该函数的以下代码片段 def TotalCost(Distance, m, c): return m * df.Distance + c 其中Distance是数据帧df中的列，而m和c只是我之前在主代码中声明的常量。然后，我尝试以以下方式应用它： df = df.apply(lambda row: TotalCost(row['Distance']

浏览 4提问于2019-11-28得票数 0

2回答

使用带有重复密钥名称的Pandas从csv文件创建JSON对象

python、pandas、csv

Python 3.9.5/Pandas 1.1.3 我一直在使用Pandas从csv文件创建JSON文件-- JSON文件中的键名是从csv文件中的头名生成的。我遇到了一个问题，我必须不止一次地使用相同的键名(在嵌套对象中)，但是我不能在csv文件中有两个同名的头。示例：到目前为止，我的csv文件将有4列：id、data、type、location。我需要从这些文件中获得一个JSON对象(包括嵌套对象)的文件，并使用以下代码完成了该文件： import pandas as pd import json import os csv = "/Users/me/file.csv"

浏览 0提问于2021-09-13得票数 2

回答已采纳

1回答

如何将字典中的项目转换为pandas数据框架中的新列？

python、json、pandas、dataframe、dictionary

方法1:我已经使用pandas读取了json文件，并且我手中有一个数据帧，但是正如你在图片(链接)中看到的那样，在某些列中，元素本身是一个dict，我如何在当前的dataframe中使用dict的键创建列，作为具有各自值的列。方法2:我附加了另一个图像，在这个图像中，我使用'with open‘读取了文件，所以它将是一个列表，然后使用json.normalize()将其转换为pandas数据帧。当我使用它时，我可以很容易地得到我想要的东西。那么，在使用方法1的同时，如何使用新列转换我的数据帧呢？看看两张图片中的“Type”栏，你能明白我的意思吗？附言:我没有足够的徽章来上传照片感

浏览 0提问于2020-05-18得票数 1

4回答

在处理调查数据时，如何合并pandas中的列？

python、python-3.x、pandas、dataframe

我有一个调查，我想创建一个合并所有结果的行？ survey = pd.DataFrame({ 'username':['Mat', 'Ryan', 'Judith', 'John'], 'choice [Website]':['Yes', 'No', 'No', 'No'] , 'choice [Friend]':['No', 'Yes', 'No', 'N

浏览 65提问于2019-05-24得票数 4

回答已采纳

1回答

在Python中将图像分配给pandas数据帧的元素

python、pandas、dataframe

我有一个pandas数据帧，其中一列是图像( numpy数组格式的单通道uint8 2d图像)。我使用iterrows()遍历各行，并处理图像，我希望将结果(其他图像，格式相同)传递给dataframe的其他列的元素。我有一个关于图片的专栏。 for index,row in df.iterrows(): image=df['image'] processed=process_image(image) df.loc[index,'processed_image']=processed 但是，当我尝试使用.loc或.at (或.iloc，

浏览 11提问于2020-12-22得票数 0

2回答

将函数应用于使用2列并创建新列的所有行

python、pandas、dataframe、lambda

我有一个包含两列的Dataframe (date作为索引) date col_a col_b 1.1.2020 23 34 我想应用一个函数，使用两列并创建第三列(错误) date col_a col_b col_error 1.1.2020 23 34 0.4 这是我的数据帧 ? 下面是带有TypeError的代码(抱歉，我无法提供数据:( ) def mean_absolute_percentage_error(y_true, y_pred): y_true, y_pred = np.array(y_

浏览 15提问于2020-01-21得票数 0

回答已采纳

2回答

是否根据同一行的其他列中的值对数据框列元素应用函数？

python、pandas、numpy

我有一个数据框架： df = pd.DataFrame( {'number': ['10', '20' , '30', '40'], 'condition': ['A', 'B', 'A', 'B']}) df = number condition 0 10 A 1 20 B 2 30 A 3 40 B 我想对number列

浏览 1提问于2017-02-01得票数 14

回答已采纳

2回答

python 3、pandas和创建新列失败，并出现keyerror

python、pandas、lambda、apply

我一直在数据帧上使用apply方法来创建新列。因此，如果我有一个如下所示的df： stdf.columns Index(['Username', 'First Name', 'Last Name', 'Class', 'Screens Typed','Time Spent', 'Avg Speed', 'Avg Acc'], dtype='object') 我一直在使用这样的语法来创建新列 stdf['uid'] = stdf[

浏览 0提问于2017-10-26得票数 5

1回答

使用字符串匹配并基于if-else条件创建新列

python、pandas、if-statement、conditional-statements

我有一个数据帧，其中列“url_text”包含来自OCR的文本输出。我正在尝试创建一个新的列“阻塞”，如果满足条件，行等于1，否则等于0。 df[df['url_text'].str.contains('blocked you')] # detect all rows in 'url_text' column # that contain 'blocked you'. Code works. 我尝试在以下函数中插入上述代码。但是，当我将该函数应用于数据帧时，会出现以下错误： def f(row): if row[&#

浏览 1提问于2021-12-30得票数 0

回答已采纳

3回答

使用apply在pandas数据帧中创建新列

python-3.x、pandas、dataframe、lambda、apply

我希望使用apply在基于其他列值的pandas数据框中创建新列。我收到这个错误，但我不明白原因： File "C:\dev\Anaconda3\lib\site-packages\pandas\core\frame.py", line 2448, in _setitem_array raise ValueError('Columns must be same length as key') ValueError: Columns must be same length as key 我是不是误解了应用函数？是否可以使用单个apply调用来更新/创建多个

浏览 2提问于2018-10-01得票数 0

6回答

Aws lambda未与Dynamo Db连接

amazon-web-services、lambda

当我试图触发时，我得到了这个错误。创建触发器时出错:无法访问流arn:aws:dynamodb:us-east-2:xxxxxx:table/xxxx/stream/2017-09-18T07:47:01.834.请确保角色可以在IAM中对您的流执行GetRecords、GetShardIterator、DescribeStream和ListStreams操作。请帮帮我,

浏览 1提问于2017-09-18得票数 11

2回答

用Python将十六进制转换为负int

python、pandas、hex

我想将列x中的十六进制转换为正确的负int，如列"true“中所看到的，但是我得到了y列的结果。 x y true fdf1 65009 -527 我试过了(我知道这不对) df["y"] = df["x"].apply(int,base=16) 从这个中，我知道了这个函数： def s16(value): return -(value & 0x8000) | (value & 0x7fff) a = s16(int('fdf1', 16)) print(a) 可以将单个值转换为正确

浏览 0提问于2018-11-28得票数 2

回答已采纳

1回答

使用CDK在不同项目拥有的其他AWS资源(如Lambda)上创建带有依赖项的Step函数

amazon-web-services、aws-lambda、aws-cdk、aws-step-functions

我们在应用程序中使用AWS Step函数。我们使用CDK作为Repository应用程序A部署的一部分创建了一个step函数。这个step函数需要包含一个lambda函数作为步骤之一。我们面临的问题是，这个lambda函数是在不同的存储库(Repository )中独立创建和维护的。当两个资源的创建在两个不同的地方独立进行时，我们不确定将一个AWS资源(AWS Lambda)连接到另一个AWS资源(AWS步骤函数)的最佳方法。我们不希望在每个环境中手动创建lambda或step函数(或两者都创建)。这很费时，容易出错，我们会有很多这样的情况发生。我们目前最好的想法是，我们可以让Applic

浏览 10提问于2022-05-05得票数 0

回答已采纳

1回答

将函数应用于极性中的2列

python-polars

我想应用一个自定义函数，它接受2列，并根据这些列输出一个值(基于行) 在Pandas中，有一种语法可以根据多列中的值应用函数。 df['col_3'] = df.apply(lambda x: func(x.col_1, x.col_2), axis=1) 极地的语法是什么？

浏览 13提问于2022-11-14得票数 0

回答已采纳

2回答

对熊猫列应用/组合函数N次，每一行N不同

python、pandas

假设我们有一个简单的pandas.DataFrame： import pandas as pd df = pd.DataFrame( columns=['quantity', 'value'], data=[[1, 12.5], [3, 18.0]] ) >>> print(df) quantity value 0 1 12.5 1 3 18.0 我想创建一个新列，比如modified_value，它将函数N次应用到value列，N是quantity列。假设这个函数是new_value

浏览 3提问于2020-03-31得票数 5

回答已采纳

2回答

不合适的功能？

python

我想要定义一个函数并将它应用于我的数据。我以为我能创建一个函数，但它没有工作。 data是我的数据的名称，a1是包含1或0的列。数据中0表示男性，1表示女性。 def sex(a1): if data['a1'] == 0: return '男性' else: return '女性' data.apply(sex) 我执行了它，得到了下面的错误消息。 ValueError追踪(最近一次通话)在->1 data.apply(性别) c:\users\jupyter-notebook\lib\s

浏览 0提问于2019-08-20得票数 2

回答已采纳

1回答

新列的日期和月份比现有的日期和月份晚一天，并且偏移一行

date、pandas

我有一个DataFrame，其中YEAR、END_DAY和END_MONTH的列是整数，我需要为START_DAY和START_MONTH设置新的列。开始日期应该比前一行中的结束日期晚一天(第一行的START_DAY和START_MONTH都应该等于1)。我的问题是，我无法让pandas创建一个日期列，然后我可以将时间增量应用到该列。这是我令人讨厌的一句话： aws['END_DATE'] = pandas.to_datetime(aws['YEAR'], aws['END_MO

浏览 2提问于2014-12-09得票数 0

3回答

如何通过数据帧中的列循环函数并添加到新列中

python、python-3.x、pandas

我将创建一些测试数据： import numpy as np import pandas as pd test_df = pd.DataFrame(np.random.randn(10,4), columns=['a','b','c','d']) 我试图传递列变量的函数是： def standard(x): return (x - x.mean()) / x.std() 然后，我想要做的是使用一个for循环在每个列变量上运行函数standard，并使用标准化的数据将新列添加到数据框架中。但是，除了简单的for循环之外，我

浏览 0提问于2018-10-27得票数 0

回答已采纳

4回答

如何获取一列中每个元素的长度

python、pandas

在csv文件中，有一个名为"no_pun“的列。里面有一些标记词。我想得到这个列中每个元素的长度。这在python中很容易实现。但我有个错误。我的代码： for i in range(0,len(data['no_pun'])): data["len_desc"][i] = len(data["no_pun"][i]) KeyError： KeyError Traceback (most recent call last) /anaconda3/lib/python3.6/site-packages/pandas/core

浏览 0提问于2019-04-07得票数 2

3回答

Python pandas使用NaN值拆分列

python、pandas

大家好，我亲爱的程序员们，我是个编程新手，偶然发现了一个问题。我想拆分我在Python中通过pandas导入的csv文件的一列。列名为CATEGORY，包含1、2或3个用逗号分隔的值(IE: 2343、3432、4959)，现在我想将这些值拆分为名为CATEGORY、SUBCATEGORY和SUBSUBCATEGORY的单独列。我试过下面这行代码： products_combined[['CATEGORY','SUBCATEGORY', 'SUBSUBCATEGORY']] = products_combined.pop('CATEG

浏览 24提问于2018-07-27得票数 0

回答已采纳

1回答

在新的列创建Pandas中对所有行应用函数

python、pandas

我有以下数据集，我在其中进行预测，并且历史上我知道这些预测的标准差： d = {'Name': ['Jim', 'Matt','Alex','Nathan','Dom'], 'Predict': [2.901826509,3.212149337,2.388237651,3.744206058,1.944415024]} df = pd.DataFrame(data=d) df['Mean'] = 4 df['StDev'] = 6 df.head(5

浏览 17提问于2021-09-18得票数 1

回答已采纳

2回答

如何在pandas中设置两列的值

python、pandas

我有一个函数，它在python中返回一个包含两个元素的元组。我将使用此函数在pandas中的dataframe中创建两个新列。这是我现在拥有的代码 df['A','B'] = df.apply(lambda x: my_fun (X['A'], x['B'], other_arguments)[0:2], axis=1) my_fun返回包含5个元素的元组，我将使用前两个元素来创建新列。但是，它只创建一列，并将该列的值设置为my_fun返回的元组。如何创建两列而不是一列？

浏览 18提问于2019-02-12得票数 1

回答已采纳

1回答

pandas:如何在应用中同时使用groupby对象的名称和数据帧

python、pandas

我有一个pandas groupby对象，创建方法是 g = df.groupby(`id`) 在具有列id的dataframe df上。现在我还有一个接受id, group作为输入的函数func。我想对groupby对象中的每个id, group应用func。目前我使用的是一个循环： for id, group in g: func(id, group) 有没有更好(更快)的方法来使用apply或类似的方法来实现这一点？

浏览 0提问于2014-03-13得票数 1

3回答

pandas中几个函数在变换中的应用

python、pandas、transformation

在groupby之后，当使用agg时，如果传递了columns:functions的dict，则函数将在相应的列中应用。然而，这种语法不适用于transform。有没有其他方法可以在transform中应用多个函数让我们举个例子： import pandas as pd df_test = pd.DataFrame([[1,2,3],[1,20,30],[2,30,50],[1,2,33],[2,4,50]],columns = ['a','b','c']) Out[1]: a b c 0 1 2 3 1 1

浏览 7提问于2017-06-21得票数 3

回答已采纳

3回答

使用两列作为输入- Pandas

python、pandas

我正在尝试创建一个新列，它来自两列的计算。通常，当我需要这样做时，但是只有一个列，我使用.apply()，但是现在有两个参数，我不知道如何做。使用一种方法，我将执行以下代码： from pandas import read_csv, DataFrame df = read_csv('results.csv') def myFunc(x): x = x + 5 return x df['new'] = df['colA'].apply(myFunc) df.head() 有两个，我以为是像下面这样，但不是。 from pandas

浏览 4提问于2020-11-15得票数 0

回答已采纳

1回答

如何在hy中使用pandas应用方法

pandas、dataframe、functional-programming、apply、hy

我想使用.apply方法在pandas中创建一个新列，在该方法中我可以传递一个自定义函数 df["newcol"] = df["oldcol"].apply(lambda x: x + 1) or df["newcol"] = df.apply(lambda row: row["oldcol"]+1) 如何在hy中实现这一点？到目前为止，我能做到 (setv (get df "newcol") (. (get d "oldcol") apply) 它只是将newcol设置为oldcol，但不知道

浏览 15提问于2020-11-06得票数 0

回答已采纳

2回答

将( Pandas)应用于多列

python、pandas

我试图运行一段代码来重命名一个或多个列中的字段，使用.类似于这个。然而，我并没有试图取得成功。我注意到，如果只使用一个列，则可以运行函数重命名。 import pandas as pd df = pd.DataFrame({'Município': {0:'Águas De Sao Pedro', 1:"Santa Barbara d'Oeste", 2:'Moji-Mirim'}, 'Dept. Água': {0:'Cia. De Abastecimen

浏览 5提问于2020-03-15得票数 1

1回答

Pandas -基于id向每一行添加单独的Z分数

python、pandas、dataframe

因此，我有一个包含game_id、player_id和playtime列的Pandas数据帧。我想为每一行添加一个z-score评分，以了解在游戏时间方面，他们对每个给定的游戏有多大的偏差。我如何遍历这些分数并将每个分数添加到数据框的新列中？如果有什么我需要澄清的请告诉我。

浏览 5提问于2021-01-03得票数 1

回答已采纳

1回答

如何将具有多个变量的函数应用于pandas数据帧的一列(当无法更改func中变量的顺序时)

python、pandas、apply

我想将函数应用到熊猫DataFrame的一个专栏中。这样的函数需要DF的一个字符串和一列。如下所示： def check_it(language,text): print(language) if language == 'EN': result = 'DNA' in text else: result ='NO' return result df = pd.DataFrame({'ID':['1','2','3']

浏览 22提问于2021-09-19得票数 0

回答已采纳

2回答

如何使用现有的列名和值在Pandas dataframe中创建新的列表列？

python、pandas、dataframe

我目前正在使用R进行数据科学，我正在学习Python和Pandas来扩展我的工具包。我希望使用现有的列名和值，在Pandas dataframe中创建一个新的列表列。关于以下Pandas dataframe： test1 test2 test3 1 0 1 1 2 0 1 0 3 1 1 1 4 1 0 0 5 0 0 0 一个新列将包含每个行的列表，这些行在任何有'1‘值的地方取列名，去掉'test’前缀，并使用

浏览 1提问于2018-03-05得票数 0

回答已采纳

2回答

在R中是否有类似于complete.cases的等效Python函数

python、pandas

我正在删除pandas数据框架中的一些记录，该数据框架在4列框架中包含不同的NaN组合。我已经创建了一个名为complete_cases的函数来提供满足以下条件的行的索引:行中的所有列都是NaN。我已经尝试过下面的函数： def complete_cases(dataframe): indx = [] indx = [x for x in list(dataframe.index) \ if dataframe.loc[x, :].isna().sum() == len(dataframe.columns)] retu

浏览 32提问于2019-07-30得票数 1

3回答

使用parse_dates解析pandas中多个列的日期

python-3.x、pandas

我有一个文本文件，其中的月、日和年在不同的列中。我想将它们合并到一个列中，并将其转换为日期格式。我正在尝试使用pandas read_table中的parce_dates选项。但是它不起作用，并给出错误file structure not yet supported dateparse = lambda x: pd.datetime.strptime(x, '%m-%d-%y') date = pd.read_table("date.txt", sep = ' ', parse_dates = {'date':['mont

浏览 2提问于2018-10-01得票数 2

1回答

Pandas.groupby.apply()中的内存泄漏？

python、memory-leaks、pandas

我目前正在使用Pandas与csv源文件约600‘m的项目。在分析过程中，我正在将csv中的内容读入一个dataframe，对某个列进行分组，并将一个简单的函数应用于分组数据。我注意到在这个过程中我要进入交换内存，所以进行了一个基本测试：我首先在shell中创建了一个相当大的数据帧： import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(3000000, 3),index=range(3000000),columns=['a', 'b', 'c']) 我

浏览 1提问于2014-08-05得票数 10

回答已采纳

3回答

Python Pandas:基于其他列添加列

python、pandas

我刚接触pandas，对此感到相当困惑，特别是与列表和使用列表理解相比。我有一个有4列的数据帧。我想在第四列"m“的基础上创建第五列"c”。我可以通过对"m“列中的每一行应用我的函数来获得"c”的值。如果"m“是一个列表，并且使用列表理解，那么它将是 c = [myfunction(x) for x in m] 如何将此“逻辑”应用于数据帧？

浏览 0提问于2016-02-16得票数 5

回答已采纳

3回答

如何从pandas groupby().sum()的输出创建新列？

python、pandas、group-by、pandas-groupby

正在尝试从groupby计算创建新列。在下面的代码中，我为每个日期获得了正确的计算值(请参阅下面的组)，但是当我尝试使用它创建一个新列(df['Data4'])时，我得到的是NaN。因此，我尝试在数据帧中创建一个新列，其中包含所有日期的Data3和，并将其应用于每个日期行。例如，2015-05-08在2行中(总数为50+5 = 55)，在这一新列中，我希望这两行都有55行。 import pandas as pd import numpy as np from pandas import DataFrame df = pd.DataFrame({ 'Date&

浏览 4提问于2015-05-15得票数 114

5回答

在原始DataFrame中作为新列的广播群结果

python、pandas、dataframe、group-by、pandas-groupby

我试图在Pandas dataframe中创建一个新列，该列基于分组数据based中的两列。具体来说，我试图复制这个R代码的输出： library(data.table) df = data.table(a = 1:6, b = 7:12, c = c('q', 'q', 'q', 'q', 'w', 'w') ) df[, ab_weighted := sum(a)/sum(b), by = "c"]

浏览 1提问于2018-12-12得票数 5

回答已采纳

1回答

TypeError：("x()获得意外的关键字参数'result_type'"，‘出现在索引1')，pandas 0.23.4

python、pandas、dataframe

我在使用result_type关键字将函数应用于数据框以添加2列时遇到类型错误。我可以看到通常的原因是由于pandas版本，但我运行的是0.23.4，并收到了这个错误。 def parse_allocation(x): direction = {'En':'entry', 'Ex':'exit'} point = x['Name'].split(' ') if len(point) > 4: curvename = 'Allocation.&

浏览 3提问于2021-03-30得票数 0

2回答

如何计算Pandas Dataframe中所有列的哈希值？

python、python-3.x、pandas

df.apply是一种方法，可以将某个函数应用于数据帧中的所有列或所需的列。但是，我的目标是计算字符串的散列:该字符串是与所有列对应的行中的所有值的串联。我当前的代码是返回NaN。当前代码为： df["row_hash"] = df["row_hash"].apply(self.hash_string) 函数self.hash_string为： def hash_string(self, value): return (sha1(str(value).encode('utf-8')).hexdigest()) 是的，合并Pand

浏览 0提问于2019-02-04得票数 1