我有一只熊猫的数据,“Column1”和“Column2”每一行都包含单词列表。我需要为每一行创建一个新列,列1的列表和column 2的列表中重复的单词数。例如,在一个特殊的行,我可以有‘苹果’,‘香蕉’在Column1,‘香蕉’,‘橙色’在Column2,我需要添加第三个新的列包含'1',因为只有一个单词(香蕉)在两个列表中。
我试着这样做:
for index, row in df.iterrows():
value = len(list(set(row['Column1']) & set(row['
目标从第一列创建第二列
column1, column2
Hello World, #HelloWord
US Election, #USElection
我有一个简单的文件,只有一个列
columnOne
Hello World
US Election
Movie Night
我写了以下函数
>>> def newColumn(row):
... r = "#" + "".join(row.split(" "))
... return r
然后我用熊猫创建了第二篇专栏文章
df['column2'
我正在尝试创建一个新列,其中填充的值将在比较dataframe的两列之后。以下是我尝试过的:
def determinecolor(row,column1,column2):
if row[column1] == row[column2]:
val = 'k'
elif row[column1] > row[column2]:
val = 'r'
else:
val = 'g'
return val
datasetTest['color_original
在Python3Pandas中使用dataframe,需要创建一个新列。我有两个具有不同长度字符串的类似列。新列应返回具有13个字符长度的第1或第2列。在excel中,我会把它写成:c2=if(len(b2)=13,b2,a2),然后把公式复制下来。
我需要解释的代码是:
df = pd.read_csv("example15.csv")
#create a new column with if-then statment
df['13_digit_#'] = (df.column1 len = 13 or df.column2 len = 13)
我该怎么改