根据条件替换Pandas DF列中的值

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (191)

我是Python的新手,所以我提前为这个可能粗略的代码道歉。我正在尝试完成一个网络抓取项目,我目前有一个带有价格列的数据框(目前为字符串)。我的困境是我想迭代每一行,如果价格显示为每周(包含pw),那么我想将价格更新为每月; 即乘以4.对于价格已经是月度的行,我想什么都不做。

mydf = pd.DataFrame({"prices":["350pw", "1000pm", "600pw", "1000pm", "1000pm"], "Column2":["H", "E", "L", "P", "!"]})

产生:

    prices Column2
0    350pw       H
1   1000pm       E
2    600pw       L
3   1000pm       P
4   1000pm       !

我能够找到行并提取数字。从那里我转换为int,乘以4但是我无法使用带有整数的替换函数。

for x in mydf[mydf['prices'].str.contains('pw')]['prices']:
    weekly_price = int(x[0:3])
    monthly_price_int = weekly_price * 4

不知道从哪里开始....

最终结果将是:

    prices Column2
0   1400pw       H
1   1000pm       E
2   2400pw       L
3   1000pm       P
4   1000pm       !
提问于
用户回答回答于
import pandas as pd
def preprocess(x):
    if(x['position']>=0):
        x['prices']=str(int(x['prices'][:x['position']])*4)+"pm"
        return x
    return x

mydf = pd.DataFrame({"prices":["350pw", "1000pm", "600pw", "1000pm", "1000pm"], "Column2":["H", "E", "L", "P", "!"]})
mydf["position"]=mydf.prices.str.find('pw')
mydf=mydf.apply(preprocess, axis=1)
mydf.drop(['position'],axis=1,inplace=True)

print(mydf)

用户回答回答于

这更像是一个pandas问题,但这就是你应该如何做到这一点:

import pandas as pd

mydf = [your df above]

#define a function to convert from weekly to monthly
def make_monthly(cell):
    if 'pw' in cell:
        weekly_price = int(cell[0:3])
        monthly_price_int = weekly_price * 4
        new_cell = str(monthly_price_int)+'pm' #you need to update the period designation as well
        return new_cell
    else:
        return cell

最后,根据需要修改“价格”行中的值:

mydf['prices'] = mydf['prices'].map(make_monthly)

输出:

   prices   Column2
0   1400pm  H
1   1000pm  E
2   2400pm  L
3   1000pm  P
4   1000pm  !

扫码关注云+社区

领取腾讯云代金券