首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >尝试使用列表填充dataframe列

尝试使用列表填充dataframe列
EN

Stack Overflow用户
提问于 2019-03-05 03:49:18
回答 1查看 39关注 0票数 -1

我有一个数据帧(df),我想创建一个名为country的新列,它是通过查看region列和region值出现在EnglandRegions列表中的位置来计算的,然后将country值设置为England,否则它就是region列中的值。

关于我想要的输出,请看下面:

代码语言:javascript
复制
    name  salary         region B1salary country
0  Jason   42000         London    42000 England
1  Molly   52000     South West          England
2   Tina   36000   East Midland          England
3   Jake   24000          Wales            Wales
4    Amy   73000  West Midlands          England

您可以看到,country中的所有值都被设置为英格兰,除了分配给Jakes记录的值被设置为Wales (因为Wales不在EnglandRegions列表中)。下面的代码产生以下错误:

代码语言:javascript
复制
  File "C:/Users/stacey/Documents/scripts/stacey.py", line 20
    df['country'] = np.where((df.loc[df['region'].isin(EnglandRegions)),'England', df['region'])
                                                                      ^
SyntaxError: invalid syntax

代码如下:

代码语言:javascript
复制
import pandas as pd
import numpy as np

EnglandRegions = ["London", "South West", "East Midland", "West Midlands", "East Anglia"]

data = {'name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 
        'salary': [42000, 52000, 36000, 24000, 73000], 
        'region': ['London', 'South West', 'East Midland', 'Wales', 'West Midlands']}
df = pd.DataFrame(data, columns = ['name', 'salary', 'region'])
df['B1salary'] = np.where((df['salary']>=40000) & (df['salary']<=50000) , df['salary'], '')
df['country'] = np.where((df.loc[df['region'].isin(EnglandRegions)),'England', df['region'])
print(df)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-05 04:30:48

该错误所指的具体问题是缺少一个]来括起您的.loc。然而,修复这个问题无论如何都不会起作用。尝试:

df['country'] = np.where(df['region'].isin(EnglandRegions), 'England', df['region'])

不管怎么说,这基本上就是你在B1salary上面已经有的东西了。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54990537

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档