前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >当我用python爬了公司BD王同事的微信好友...

当我用python爬了公司BD王同事的微信好友...

作者头像
CDA数据分析师
发布2018-02-08 11:15:08
7970
发布2018-02-08 11:15:08
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

某日,BD王同事找我聊天,聊着聊着就抱怨起来,这一年跑市场跑太猛了,工作微信的好友加到了5000人上限,只能换个双微信的手机了,但是这个X刚买没多久啊......5分钟的唠叨中,我只get到了一个重点,BD王居然有5000个微信好友!!如果这些好友信息用来分析下...于是...

首先获得微信好友数据:

1.安装python

2.安装itchat、jieba等包(pip install itchat)

3.获取BD王的微信授权

4.将数据导入到DataFrame,并筛选出微信名、备注名、性别、省份、城市、个性签名五个字段

5.看下数据的前五行

探索分析:

1.好奇看下BD王的微信好友是否真的有5000!结果发现有5006,不是上限5000吗...

2.根据用户习惯,微信名称各式各样的都有,而为了方便沟通,一般交流较多的好友都会设置备注。对BD王的微信好友进行统计,发现有34%的好友没有设置备注,侧面反映BD王虽然好友很多,但有一部分并没有深入沟通,还有很大价值可以挖掘,继续加油...PS:其中微信名称为个人姓名,不需要修改备注的情况较少,本次将不考虑...

3.接下来分析下BD王的微信好友性别占比,以BD王堪比华北吴亦凡的相貌,女性好友数量占比应该奇高,但是...结果如下图!大数据相关岗位要求是有技术并且有良好的沟通能力,并且工作强度较大,男性从业人员数量是高于女性的。

4.接下来对BD王的微信好友地域分布进行分析,因为上篇文章被吐槽作图太丑...这次尝试使用Excel的Power Map插件中的三维地图,发现BD王虽然人在北京,但上海、深圳、广州、西安、成都、沈阳、武汉、杭州、南京等城市也勾搭了好多人,业务能力极强,该考虑涨工资了...这也反应出目前大数据相关产业都集中在一二线城市,这些城市的人员对大数据的认知度和参与度更高。

上张图主要是炫,具体咱们放大一点看看..

5.针对BD王的微信好友的个性签名,做了词云统计,看下他的朋友圈属性是什么?生活、努力、自由、时间、梦想、自己...果然文艺青年的朋友圈是这样纸的....积极向上的生活态度,可以推断BD王的朋友年龄分布偏年轻,可以说大数据行业从业人员年轻化,公司有活力,将创造更大的价值。

6.我想建个模型...但是数据维度不够用...这次就这样吧...如果想交流数据分析可以加我微信18010116775看不看得到随缘...

PS:会一些数据分析,会发现生活很有趣,如果想要学习数据分析技能,可以参加CDA数据分析就业班,三个月转行数据分析师。点击阅读原文了解课程详情,或者联系马老师。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-01-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档