Python Dataframe如何基于条件创建新列值_Python Pandas DataFrame基于条件的新列_基于Spark Dataframe中的条件创建新列 - 腾讯云开发者社区

python、apache-spark

我正在使用下面的python代码从spark dataframe创建一个交叉表。 age_matter = df[df['y']=='yes'].stat.crosstab("age", "y").orderBy("age_y", ascending=True).show(100) 我想知道如何创建基于此代码的直方图。另一方面，我正在基于spark dataframe中的另一列创建一个新列，我希望使用如下代码，但这是徒劳的。 if df['age']<=24: df['group

浏览 0提问于2021-02-23得票数 0

2回答

基于其他列中的值在python 3(熊猫)中创建新列

python-3.x、pandas、dataframe

我有一个熊猫的dataframe，在这里我需要创建新的列基于值从其他列在dataframe。这是数据文件人城国家美国芝加哥伊利诺伊州美国亚利桑那州凤凰城美国加州圣迭戈我想根据状态中的值创建两个新列创建新列df"city-north“= df'city‘，其中state = "Illinois"Create新列df"city-south”= df'city’，其中的州不等于“伊利诺斯州”。我试过了 df.loc[((df['state'] == 'Illinois')), 'city-north

浏览 6提问于2020-08-16得票数 1

回答已采纳

1回答

指定列，同时将冰雪公园Python Dataframe追加到表

snowflake-cloud-data-platform、snowpark

所以现在，我使用Python中的session.createDataFrame()创建了一个Dataframe。其目的是将此Dataframe附加到雪花中现有的表对象中。但是，源dataframe的架构与目标表的模式不完全匹配。在斯诺dataframe中，DataFrameWriter对象具有option() 方法，该方法允许指定列顺序，因此允许跳过数据文件中的列，因为列的名称可以匹配。然而，斯诺公园Python目前还缺少option() for DataframeWriter。这迫使雪花查找模式和列数(源和目标之间)匹配，否则会引发错误。还不确定Python的斯诺Python何时会收到

浏览 12提问于2022-08-28得票数 2

2回答

引用与列标题对应的DataFrame值

python、pandas、dataframe、indexing、row

我试图在我的DataFrame中添加一列，该列基于指示的列名引用的值。我有以下DataFrame： Area 1 2 3 4 Select ----------------------------------------------------------- 0 22 54 33 46 23 4 1 45 36 54 32 14 1

浏览 4提问于2021-08-29得票数 2

回答已采纳

1回答

基于两个现有列创建新的df列

pandas

我有一个包含两列的DataFrame：‘性别’(可能的值M和F)和'IsChild‘可能的值(真或假)。创建一个基于Sex和IsChild值的新列(儿童、男性、女性)的最有效方法是什么？

浏览 0提问于2020-07-14得票数 0

2回答

Danfo dataFrame -按索引、列替换值

pandas、dataframe、danfojs

在python中的python中，用列和索引来替换值非常简单。示例DataFrame： df = pd.DataFrame({'A': [1, 2, 3], 'B': [200, 300, 400]}) A B 0 1 200 1 2 300 2 3 400 替换值就像下面这样简单： df['A'][0] = 800 A B 0 800 200 1 2 300 2 3 400 如何在Danfo DataFrame中按列和索引替换值？

浏览 6提问于2021-02-24得票数 1

1回答

通过有条件地检查两个单独的数据格式创建新的DataFrame

python、pandas

我对Python和Pandas也相当陌生。我想通过有条件地检查两个现有的/单独的数据框架来创建一个新的数据框架。dataframes和我打算创建的新的dataframes都具有相同的大小和索引。现有的数据文件相当于以下内容： df1 = pd.DataFrame(np.random.randn(5, 4), columns=['1', '2', '3', '4']) df2 = pd.DataFrame(np.random.randn(5, 4), columns=['1', '2', '

浏览 4提问于2015-08-27得票数 0

1回答

如何将名为"group“的列添加到DataFrame多索引中

python-3.x

我是一个python的新手，我有一个问题是如何在DataFrame中添加多个索引级别。例如，我有这样的DataFrame 如何将名为"group“的列添加到DataFrame多索引中，如下所示谢谢

浏览 6提问于2017-06-13得票数 0

2回答

如何在数据框某些行的所有列上使用pandas apply函数

python、pandas、data-manipulation

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

1回答

使用不同的变量无条件地更新数据框的多个列值

scala、dataframe

我有大约10列的dataframe。我从这10列中选择了4列，并清除了它们的值(通过调用一些外部API并使用它的响应)。我想现在创建新的dataframe (因为旧的不能更新)，并用它的清理值(由API返回)更新这4列，并保持其他6列不变。我尝试过探索.na.replace和.withColumn，但它们都在列的某些条件下工作。 val newdf = df.withColumn("col1", when(col("col1") === "XYZ", cleanedcol1) .otherwise(col("col1

浏览 11提问于2019-09-28得票数 1

2回答

为“熊猫数据”列赋值

python、pandas、dataframe、slice

我有一个从更大的dataframe切分的临时dataframe temp (如下图所示)。如果帮助我将每一行的item_price值分配给与model关联的相关列，我将不胜感激，如下所示：注意:原始和更大的dataframe包含一些具有不同型号和价格的相同品牌名称的品牌、价格和模型，因此我将这些相似的记录切片到temp数据格式中，并尝试为每条记录指定与 model 相关的相关列的价格。提前感谢！

浏览 2提问于2021-08-28得票数 0

回答已采纳

2回答

Python或Pandas的绑定或分组技术是什么？

python、pandas、dataframe、machine-learning、regression

我对Pandas相当陌生，我理解处理数据--在它们中创建虚拟变量，甚至在DataFrame中创建新列--这通常是一个很好的实践。然而，我遇到了这些代码行，无法理解它做了什么。它的目的是按年龄将数据of1分类列分组为3列。 ratings_df.loc[(ratings_df['age'] <= 40), 'age_group'] = '40 years and younger' ratings_df.loc[(ratings_df['age'] > 40) & (ratings_df['age'

浏览 1提问于2021-05-21得票数 0

回答已采纳

1回答

R:使用来自多列的数据创建因子

r、refactoring、grouping、multiple-columns

我想创建一个专栏，用来说明病人是否有抑郁症的共同诊断。问题是，诊断可以记录在以下四栏之一： ComorbidDiagnosis； OtherDiagnosis； DischargeDiagnosis； OtherDischargeDiagnosis。我一直在用 levels(dataframe$ynDepression)[levels(dataframe$ComorbidDiagnosis)=="Depression"]<-"Yes" 对于所有4列，但我不知道如何编码那些在任何列中没有诊断的人。我试过： levels(datafr

浏览 1提问于2014-12-05得票数 0

1回答

先更改n行

scala、apache-spark、apache-spark-sql

我有一个dataframe，我想添加另一个列，对于前n行是一个值，其余的是另一列中的值.像这样的东西 frame.select("*") .withColumn("newColumn", if(row number < 5) "hello, world" else col("someth_else"))

浏览 2提问于2017-03-16得票数 0

回答已采纳

3回答

编写简单计数器的脚本

python、pandas、dataframe

我想要创建一个简单的脚本，它计算一个列中的值，这个值在另一个列中更高： d = {'a': [1, 3], 'b': [0, 2]} df = pd.DataFrame(data=d, index=[1, 2]) print(df) a b 1 1 0 2 3 2 我的职能： def diff(dataframe): a_counter=0 b_counter=0 for i in dataframe["a"]: for ii in dataframe["b"]:

浏览 9提问于2022-06-02得票数 0

回答已采纳

2回答

如何从熊猫数据集中创建1行数据

python、python-3.x、pandas、dataframe

我有一个包含许多行和列的.csv文件。为了进行分析，我想从数据集中选择一个行号，并将其作为熊猫的数据格式传递。与其在dict中写入列名和输入值，我如何使其更快呢？现在我有： df= pd.read_csv('filename.csv') df2= pd.DataFrame({'var1': 5, 'var2': 10, 'var3': 15}) var1、var2、var3是df列。我想用df数据建立一个独立的数据格式。可以选择随机行，也可以选择给定的行号。谢谢你的帮助。

浏览 4提问于2022-08-16得票数 0

1回答

当列介于两个值之间时，汇总Pandas数据

python、pandas

在python中，我有一个Pandas dataframe (df)，可以在下面进行复制。 import pandas as pd data = [['2021-09-12', 'item1', 'IL', 5], ['2021-09-12', 'item2', 'CA', 7], ['2021-08-13', 'item2', 'CA', 8], ['2021-06-12', 'item3', 'NY'

浏览 1提问于2021-09-21得票数 1

回答已采纳

2回答

Pandas:基于来自另一列的映射值创建新列

python、python-3.x、pandas、dataframe

我想根据Python中另一个列的条件创建一个新列。更具体地说，我在dataframe中的一列是： Kilos: 1. 8.0 2. 16.0 3. 12.0 4. 10.0 5. 5.0 ... 我希望新列基于此列，每次您找到(在kilos列中)千位数为8.0的行时，新的列行将写入'X2 + parts'，当该列为16.0时，新列的行将写入'X8 + parts‘，对于其他列，我不在乎。它们可以是空白的，也可以是其他任何内容。

浏览 2提问于2020-03-26得票数 1

2回答

如何检查pandas.Dataframe中的重复列？

python、python-3.x、pandas、csv、duplicates

我必须处理部分原始、部分提取的数据。我怀疑这两列是重复的。在SQL中，我可以这样做 SELECT col1, col2 FROM table where col1 != col2 但是我如何在pandas.Dataframe的Python中做类似的事情呢？更具体地说，我如何比较csv文件和/或Dataframe对象的两列，然后查看符合或不符合比较条件的值或行。

浏览 1提问于2018-10-13得票数 0

2回答

如何获取DataFrame行中超过阈值的列数

python-3.x、pandas、dataframe

我有一个简单的python3.8DataFrame，有8列(简单标记为0、1、2等)。差不多吧。3500排我想要这个DataFrame的一个子集，其中每行至少有2列在1以上，我不想单独检查每一列，而是能够检查所有列。我知道我可以使用.any(1)来检查所有的列，但是我需要至少有两个符合阈值的列，而不仅仅是一个。任何帮助都将不胜感激。示例代码如下： import pandas as pd df = pd.DataFrame({0:[1,1,1,1,100], 1:[1,3,1,1,1], 2:[1,3,1,1,4],

浏览 4提问于2021-11-30得票数 1

回答已采纳

3回答

我在Python上使用了dropna()，但它没有删除任何行

python、pandas、nan、drop

我的DataFrame有两列，它们都有NaN值。我只需要在列user_email上删除带有NaN的行。但是，我使用了df['user_email'] = df['user_email'].dropna()，但它返回了完全相同的DataFrame，第二列上的所有NaN值都完好无损。如何删除第二列中带有NaN的行？

浏览 0提问于2020-07-04得票数 0

1回答

如何通过过滤另一个数据框的列来创建新的数据框

python、pandas、dataframe

我有几个数据集共享相同的列，所以我将它们连接在一起形成一个大的dateframe。我的想法是通过> .5过滤goals_per_90列，这样它就会创建一个新的数据帧，在新的数据帧中显示所有玩家的整行，其中的值大于.5。我现在正在考虑这样的事情，但是当我被卡住的时候 def gettopplayers(Dataframe): if Dataframe.loc[Dataframe['goals_per_90_overall'] > .5]: apply. 我迷路了，不知道要把这一行追加到哪里。任何帮助都将不胜感激。谢谢!

浏览 28提问于2020-08-22得票数 0

1回答

基于另一列中的文本在pandas中创建列

python、pandas、string、dataframe

我在python中有一个pandas Dataframe，它有一个名为"Description“的列，其中包含一组由"\n”分隔的文本元素。我想通过拆分文本元素在相同的Dataframe中创建新列。例如，我有： Description '\nA: Elephant\nB: Cats\nC:Dog' 我想用关联的元素获得相应的列数，如下所示： Description A B C '\nA: Elephant\nB: Cats\nC:Dog' Elephant

浏览 11提问于2021-01-21得票数 0

1回答

变量用于不同任务时的Python内存使用情况

python、memory-management

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0

3回答

解析dataframe列以创建新的dataframe

python、pandas、dataframe

我有一个dataframe，其中的colmuns具有嵌套的属性值对。我如何解析这个dataframe列并获得这些值来为它创建一个新的dataframe？这是其中一个列值： {'BikeParking': 'False', 'BusinessAcceptsCreditCards': 'True', 'BusinessParking': "{'garage': False, 'street': True, 'validated': False, 'lot

浏览 0提问于2019-01-04得票数 0

1回答

突出显示表中的最大出现量。

excel、excel-formula、excel-2010、vba

我创建了A列和B列的枢轴表。A列与B列有一对多的关系。我想在B列中突出显示其作用域中多次出现的值和A列中的值。例如，在下表中，我希望在ABC中突出显示10，对XYZ范围突出显示15。 COLA COLB ABC 10 ABC 10 ABC 15 XYZ 10 XYZ 15 XYZ 15 如果有一个平分，任何一个值都需要突出显示。干杯！！

浏览 2提问于2016-04-13得票数 0

回答已采纳

3回答

在Python熊猫中，从1开始行索引，而不是0，而不创建额外的列。

python、pandas、indexing、dataframe

我知道我可以像这样重新设置索引 df.reset_index(inplace=True) 但这将从0开始索引。我想从1开始。如何做到这一点，而不创建任何额外的列，并保留索引/reset_index功能和选项？我不想创建一个新的dataframe，所以inplace=True应该仍然适用。

浏览 6提问于2015-08-27得票数 63

回答已采纳

7回答

修改pandas数据帧中的行子集

python、pandas

假设我有一个包含两列的pandas DataFrame，A和B。我想修改这个DataFrame (或者创建一个副本)，这样每当A为0时，B总是NaN。我该如何做到这一点？我尝试了以下几种方法 df['A'==0]['B'] = np.nan 和 df['A'==0]['B'].values.fill(np.nan) 没有成功。

浏览 0提问于2012-09-07得票数 168

回答已采纳

1回答

创建空的dataframe Java Spark

java、dataframe、apache-spark

关于如何使用Spark Scala/Python创建空的dataframe/Dataset，有很多示例。但是我想知道如何在Java Spark中创建一个空的dataframe/Dataset。我必须创建一个空的dataframe，其中只有一列，标题为Column_1，类型为String。

浏览 27提问于2020-07-14得票数 0

回答已采纳

2回答

从Python DataFrame中选择行

python、dataframe、select、rows

我有一个名为"x“的Python DataFrame，如下所示： 363108 05:01:00 363107 05:02:00 363106 05:03:00 363105 05:04:00 363104 05:05:00 ... 4 16:57:00 3 16:58:00 2 16:59:00 1 17:00:00 0 17:01:00 "time“列是字符串类型。我想从"x“中的所有行创建一个名为"m”的新DataFrame，这样分钟就是"00“。我尝试过m= x.loc[x"time“== "00

浏览 21提问于2020-09-24得票数 0

1回答

使用列表中的if、else语句创建新列

python-3.x、dataframe、if-statement

我需要使用if和else语句从A、B列中创建一个新列C，如下所示下面的代码不返回任何内容，谁能通知我正确的代码 import numpy as np import pandas as pd a = np.arange(10) b = [0.1,0.3,0.1, 0.2, 0.5, 0.4,0.7,0.56, 0.78, 0.45] df= pd.DataFrame(data=b, columns=['B']) df2= pd.DataFrame(data=a, columns=['A']) A = df2['A'] B = df['

浏览 11提问于2019-03-21得票数 0

回答已采纳

1回答

如何在定义新行主键的同时复制表中的一行？

sql-server-2008、primary-key

我想在定义PK列值(2) (tblSpills.Year，tblSpills.Complaint)时复制或复制表(tblSpills)中的一行。我已经有一个存储过程，它插入一个带有自定义PK值的新行，并且每隔一列(大约30列)为空。到目前为止，我已经执行了现有的存储过程来创建新的行，并将新的PK值作为新的Duplicate存储过程的变量，但是我不知道如何将剩余的列从同一个表中的一行复制到新创建的行。感谢您能提供的任何帮助。

浏览 3提问于2011-04-22得票数 1

回答已采纳

1回答

Python Pandas DataFrame数据标识

python、excel、csv、pandas

我从.xlsx文件中提取数据并将其存储在数据帧中。数据帧称为df，数据帧的大小为(51,3)。51行。3列。列是未命名的，编号为0、1、2。行的索引从0到50。在python中，我将使用什么语法从带有pandas的数据帧中提取数据并将其放入csv？我知道我会使用DataFrame.to_csv("outputFile.csv" )，但是我不确定如何识别特定的数据(行/列对)，所以我可以将它放在csv表中的新位置，而不是旧的excel表。

浏览 1提问于2016-03-09得票数 0

4回答

为什么AnalysisException失败了: AS子句中提供的别名数量与列数不匹配.？

apache-spark、apache-spark-sql

这是我的数据 +------------------------------------------ |value +------------------------------------------ |[0.0, 1.0, 0.0, 7.0000000000000036, 0.0] |[2.0000000000000036, 0.0, 2.9999999999999996, 4.0000000000000036, 5.000000000000002] |[4.000000000000006, 0.0, 0.0, 6.000000000000006, 7.000000000000004

浏览 7提问于2018-01-03得票数 9

回答已采纳

3回答

使用str_detect函数在R数据中有条件地创建一个新列？

我有一个包含值的A列的dataframe： **Channel** Direct Paid social Organic social 我想做的是:创建一个名为groupedChannel的新列，其中str_detect在A列中搜索字符串以在groupedChannel中添加一个值。 Condition: IF row in Column A matches regex "direct" THEN Column B value = "Direct" ELSE IF row in Column B matches regex "social" TH

浏览 3提问于2020-04-29得票数 0

回答已采纳

2回答

Python:使用len()根据其他列的值创建新列

python、pandas、count、series、literals

我的dataframe是一个熊猫dataframe，有许多行和列。现在，我希望基于对象列的值创建一个新列(系列)。例如： df.iloc0，'oldcolumn‘输出为0，应该在新列中给出，并且 df.iloc1，'oldcolumn‘输出为'ab%$.’。应该在相同的新列中给我5 (包括文字数量)。空间)。此外，是否有办法避免循环或自己的函数？谢谢你

浏览 7提问于2020-08-29得票数 0

2回答

Python3熊猫使用length添加了一个列，如果是if，则语句

pandas、if-statement、conditional-statements、python-3.5、calculated-columns

在Python3Pandas中使用dataframe，需要创建一个新列。我有两个具有不同长度字符串的类似列。新列应返回具有13个字符长度的第1或第2列。在excel中，我会把它写成：c2=if(len(b2)=13,b2,a2)，然后把公式复制下来。我需要解释的代码是： df = pd.read_csv("example15.csv") #create a new column with if-then statment df['13_digit_#'] = (df.column1 len = 13 or df.column2 len = 13) 我该怎么改

浏览 1提问于2016-10-03得票数 2

回答已采纳

2回答

如何键入星火DataFrame列？使用火花放电

apache-spark、pyspark

我以以下方式创建了一个DataFrame： from pyspark.sql import SparkSession spark = SparkSession \ .builder \ .appName("Python Spark SQL basic example") \ .getOrCreate() df = spark.read.csv("train.csv", header=True) 我的DataFrame的架构如下： root |-- PassengerId: string (nullable = true) |-- S

浏览 3提问于2018-10-18得票数 0

回答已采纳

1回答

Python -使用groupby和条件语句

python、pandas

如何根据一列对DataFrame进行分组，检查每个组(或任何其他条件)中另一列上的最高值，并使用分组期间找到的所有值的行创建一个新的DataFrame？如果我在感兴趣的列上使用groupby，然后检查我想要的条件，我将得到的唯一结果是一个包含两列的df，但我希望返回原始df的所有列。代码： df_best = df.groupby('Type 1')['Total'].max() 我知道为什么我上面的代码在这种情况下不能工作，但我想不出一种方法来获得我想要的…… 提前感谢！

浏览 27提问于2020-04-30得票数 0

1回答

如何在spark sql dataframe中映射一列以创建新列？

python、pandas、dataframe、apache-spark

在python和pandas中，我可以创建一个新的专栏，如下所示：使用pandas dataframe中的两列来创建字典。 dict1 = dict(zip(data["id"], data["duration"])) 然后，我可以应用这个字典在第二个dataframe中创建一个新列。 df['id_duration'] = df['id'].map(lambda x: dict1[x] if x in dict1.keys() else -1) 如果我有一个数据帧id_duration (有两列：id和duration)和

浏览 38提问于2021-01-22得票数 0

回答已采纳

2回答

用for循环迭代熊猫数据范围

pandas、dataframe、loops

我正在尝试迭代dataframe的每一行中的时间戳，以查看该时间戳是在特定日期之前还是之后。此外，我希望在dataframe中创建一个新列，该列指定日期是在指定日期之前还是之后。这是我使用的代码： df['created_at'] = pd.to_datetime(df['created_at'], errors='coerce') for row in df.iterrows(): if df[(df['created_at'] >= '2019-03-15')]:

浏览 0提问于2019-05-21得票数 1

回答已采纳

2回答

从pandas Dataframe中提取在特定列中具有特定值的所有行

python、pandas、dataframe

我是Python/Pandas的新手，正在努力从pd.Dataframe中提取正确的数据。我实际拥有的是一个包含3列的Dataframe： data = Position Letter Value 1 a TRUE 2 f FALSE 3 c TRUE 4 d TRUE 5 k FALSE 我想要做的是将所有真正的行放入一个新的Dataframe中，这样答案将是： answer = Position Letter Value 1 a TRUE 3

浏览 1提问于2013-07-02得票数 11

回答已采纳

1回答

熊猫索引与复制错误

python、pandas

我的dataframe中有Data2列。我试图通过向NewCol列应用一个筛选器来创建一个新列(‘Data2’)。下面的代码工作，新列的结果是正确的。但在运行代码时，我会得到以下错误消息。我怎么才能解决这个问题？我认为这会影响性能。 C:\Python27\lib\site-packages\IPython\kernel__main__.py:2: SettingWithCopyWarning:值试图在来自DataFrame的片的副本上设置。请参阅文档中的注意事项： # In[1]: import pandas as pd import numpy as np from pandas im

浏览 2提问于2015-08-27得票数 0

2回答

如何使用Python DataFrame检查A列的内容是否包含在B列中？

python、pandas、dataframe

我在熊猫DataFrame中有两个专栏：authors和name。我想创建第三列:如果相应行的name包含在相应行的authors中，则单元格的值为False，否则为False。因此，结果将看起来像下面的图片。我尝试过.str.contains()、.str.extract()、.str.find()、.where()等，但是Python返回了一个错误：'Series‘对象是可变的，因此它们不能被散列。有人知道如何在Python中创建第三列吗？

浏览 5提问于2016-04-29得票数 3

回答已采纳

1回答

pandas中面向对象的数据帧清理模式

python、dataframe、oop

我需要在面向对象模式下编写python代码的帮助。我正在尝试使用pandas标记数据帧中的列值。有没有人可以帮助我如何入门，或者向我推荐一些资源？如何声明一个全局变量并指定温度和湿度的范围，然后编写一个函数来标记超出该范围的值？下面是我的代码： import pandas as pd filename = 'data.csv' #Read the dataframe and display the column names in the dataframe df = pd.read_csv('data.csv', encoding="Latin&#

浏览 15提问于2020-05-08得票数 0

1回答

如何应用以多个dataframe列作为参数的函数？

python、pandas、dataframe、function

我试图在熊猫数据栏中计算一个新列，基于其他列，以及我创建的函数。与使用for循环不同，我更喜欢应用带entires dataframe列的函数。我的代码是这样的： df['po'] = vect.func1(df['gra'], Se, df['p_a'], df['t'], Tc) 其中df‘’gra

浏览 5提问于2021-12-29得票数 1

回答已采纳

2回答

Pandas根据布尔数组就地修改列值

python、pandas

我知道如何使用apply或np.where基于另一列的值创建新列，但是我想不起一种选择性地更改现有列的值的方法；我怀疑其中是否涉及df.ix？我说得对吗？例如，下面是一个简单的dataframe (我的数据帧有数万行)。如果名称以字母‘e’结尾，我想更改'flag‘列中的值(假设为'Blue')： >>> import pandas as pd >>> df = pd.DataFrame({'name':['Mick', 'John', 'Christine',

浏览 0提问于2014-05-01得票数 9

回答已采纳

2回答

Python/DataFrame:当值大于零时计算出现次数/行的百分比

python、python-3.x、pandas、dataframe

给定以下DataFrame： import pandas as pd import numpy as np df = pd.DataFrame(np.random.uniform(-1,1,size=(6, 2)), columns=list('AB')) A B 0 0.179713 0.341367 1 -0.439868 0.999864 2 -0.253476 -0.816107 3 -0.829449 -0.562657 4 0.174300 0.055969 5 0.922375 0.987108 如何计算特

浏览 239提问于2020-08-15得票数 1

回答已采纳

2回答

如何通过搜索列表中给出的关键字值在Python熊猫中添加新列？

python-3.x、pandas、list-comprehension

我想根据已识别的关键字在dataframe中添加新列：这是当前数据(Dataframe= df)： Topic Count 0 This is Python 39 1 This is SQL 6 2 This is Paython Pandas 98 3 import tkinter 81 4 Learning Python 94 5 SQL Working 85 6 Pandas and Work 67

浏览 6提问于2020-09-11得票数 2

回答已采纳

1回答

数据报添加带有条件的新列，并基于另一列

python、pandas

我有客户rfm的数据。示例数据如下： df_cust = pd.Dataframe( 'CustNo' = [001, 002, 003, 004], 'Recency' = [5,10,200,150], 'Frequency' = [1, 3, 10, 1] ) 我想创建一个新的列‘score_ create’。我也有两个计算分数的函数(通常我使用lambda函数来创建列pandas)。 def cal_new_cust(recency): return score # logic code with new cust fr

浏览 10提问于2021-05-23得票数 0