寂寂花时闭院门,美人相并立琼轩。
大家好,我是我是Python进阶者。
前几天Python铂金有个叫【Lee】的粉丝问了一个数据分析的问题,这里拿出来给大家分享下。
现在的问题是:如何实现这里面老师所对应的国家呢?想要利用Python作数据分析,想了解来自美国的老师有多少个,怎么实现?针对这个demo,一开始我想的也比较简单,只需要统计其中国家的数量即可。
但是问题来了,如下图所示:
那么再用我的那个想法,就有点那个了!下面一起来看看Python是如何处理的吧。
这里【🌑(这是月亮的背面)】大佬给出了两个解决方法,第一个是merge()方法,另外一个是join()方法。
代码如下:
可以看到顺利的满足了粉丝的要求
import pandas as pd
data1 = {"学校": ['哈佛', 'MIT', '清华', '早稻田'], "国家":['美国', '美国', '中国', '日本']}
data2 = {"学校": ['哈佛', 'MIT', 'MIT', '清华', '清华', '早稻田'],
"老师": ['John', 'Mike', 'Jason', '李明', '韩磊', '武田康福']}
data1 = pd.DataFrame(data1)
data2 = pd.DataFrame(data2)
print(data1)
print(data2)
data2.merge(data1, how='left').value_counts('国家')
print(data2.merge(data1, how='left').value_counts('国家'))
print(data2.merge(data1, how='left'))
不过这还不够,粉丝后来又提需求了,如下所示:
不慌,直接将value_counts()函数去掉即可,如下:
如此,完美的满足了粉丝的需求:
代码如下:
join原来是用index做key连接的,这样也是可以满足粉丝的需求的。
大家好,我是Python进阶者。这篇文章基于粉丝提问,在实际工作中运用Python工具实现了数据批量分组的问题,在实现过程中,巧妙的运用了pandas.merge()函数和pandas.join()函数,顺利的帮助粉丝解决了问题,加深了对该函数的认识。
最后感谢粉丝【Lee】提问,感谢【🌑(这是月亮的背面)】大佬给予的思路和代码支持,感谢粉丝【aVen】、【冫马讠成】、【水方人子】等人参与探讨和学习。
文中针对该问题,给出了两个方法,小编相信肯定还有其他的方法,欢迎大家积极尝试。
小伙伴们,快快用实践一下吧!
------------------- End -------------------