前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >盘点一个Python自动化办公的问题

盘点一个Python自动化办公的问题

作者头像
Python进阶者
发布2024-06-24 20:35:39
720
发布2024-06-24 20:35:39
举报

大家好,我是Python进阶者。

一、前言

前几天在Python铂金交流群【逆光】问了一个Python自动化办公的问题,问题如下:问题 我现在有两个表a、b ,for 循环a、b ,如果a的条件满足b,则把b的值赋给a ,目前a有7万条数据,b有300条。我写的代码20分钟都没跑完。这是代码,请问改怎么解决?

二、实现过程

这里【瑜亮老师】给了个思路如下:

【瑜亮老师】:数据是在df中?

【逆光 】嗯嗯,是的

【瑜亮老师】:那你不能这么写,熊猫一见for循环,思路基本就玩完。

【逆光 】:请问那咋整呢?

【瑜亮老师】:你的需求是根据jd mergeTotal['付款公司编码']列中元素 在 JD_zhekou中查找对应的公司名。结果保存在jd_mergeTotal['公司']列中,Total['付款公司编码']列是和zhekou['公司组织编码']对应的,都是公司的组织编码。

【逆光 】:对的,本来可以用merge 但是后期可能会添加total的单量满足折扣的条件才能匹配,所以我用了for循环。

【瑜亮老师】:先merge,后期如果需要添加条件,只需要加一行对结果的筛选即可。

【逆光 】:对结果的筛选?

【瑜亮老师】:先筛选,后merge。这样可以减少运算时间。而先merge后筛选,可以复用merge后的df,做更多筛选动作。看你的需求了。

【逆光 】:因为我是初学哈,我不是很懂,如果先merge 那不是一对多了吗?

【瑜亮老师】:什么一对多?

【逆光 】:第二个表,可能是这样啊,如果加入单量条件的话,主键编号就不是唯一的了。如果是多个关键字连接的话,单量是个范围,怎么弄进行判断呢?

【瑜亮老师】:远程吧,或者你发一个脱敏的两个表的数据。最好是你发一个脱敏数据。

【不上班能干啥!】:如果先merge,就匹配完再筛选。先筛选再匹配跟上面的结果是一样的,只是先merge过程产生的数据会多。别说加一个单量条件了,你加很多的条件也是这样的,总之先merge。

【瑜亮老师】:是的,先筛选省时,先merge可多次筛选。

【逆光 】:先merge ,后再筛选,咋个筛选呢?

【瑜亮老师】:主要是根据需求。如果只是筛选一次,那就先筛选。如果后期还是会有各种筛选,那就先merge。你发一个脱敏数据吧。无非是两行代码先后顺序的问题,这个不用纠结。

【逆光 】:我不知道怎么弄筛选?

【不上班能干啥!】:new_df = df1.merge(df2) new_df = new_df[new_df['判断列'] = 条件],不就这样吗,等于,大于,小于,包含,没别的了。

【逆光 】:我好像懂你的意思了,我去试一试。

【小小明】:你发个测试数据,我可以帮你写。。。你可以想个可能出现的条件,可以不用merge。给出的具体代码如下:

代码语言:javascript
复制
companies = []
nums = []
for row in jd_MergeTotal.itertuples(False):
    tmp = JD_zhekou.query(f"公司组织编码=='{row.公司编码}'")
    companies.append(tmp.公司.iat[0])
    discount_dest = None
    for _, _, num, discount in tmp.itertuples(False):
        min_v, max_v = map(int, num.split("-", maxsplit=1))
        if min_v <= row.单量 <= max_v:
            discount_dest = discount
            break
    nums.append(discount_dest)
jd_MergeTotal["公司"] = companies
jd_MergeTotal["折扣"] = nums
jd_MergeTotal

顺利地解决了粉丝的问题。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【斌】提出的问题,感谢【瑜亮老师】、【不上班能干啥!】、【小小明】给出的思路,感谢【莫生气】等人参与学习交流。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、实现过程
  • 三、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档