首先,在终端安装一下itchat包。
sudo easy_install itchat
打开pycharm,输入代码
importitchat
itchat.login()
#爬取自己好友相关信息, 返回一个json文件
friends = itchat.get_friends(update=True)[:]
#初始化计数器
male = female = other =
#friends[0]是自己的信息,所以要从friends[1]开始
foriinfriends[1:]:
sex = i["Sex"]
ifsex ==1:
male +=1
elifsex ==2:
female +=1
else:
other +=1
#计算朋友总数
total =len(friends[1:])
#打印出自己的好友性别比例
print("男性好友: %.2f%%"% (float(male)/total*100) +"\n"+
"女性好友: %.2f%%"% (float(female) / total *100) +"\n"+
"不明性别好友: %.2f%%"% (float(other) / total *100))
defget_var(var):
variable = []
foriinfriends:
value = i[var]
variable.append(value)
returnvariable
#调用函数得到各变量,并把数据存到csv文件中,保存到桌面
NickName = get_var("NickName")
Sex = get_var('Sex')
Province = get_var('Province')
City = get_var('City')
Signature = get_var('Signature')
frompandasimportDataFrame
data = {'NickName': NickName,'Sex': Sex,'Province': Province,
'City': City,'Signature': Signature}
frame = DataFrame(data)
frame.to_excel('weixin.xlsx',index=True)
然后会弹出来一个二维码,扫描登录,就可以获取信息了
(别问我咋这么有勇气po出来自己的二维码验证,因为有时效性,你登录不上去的,哈哈哈)
(哈哈哈,暴露了,我这里男女比例)
信息获取后,就这样待着,显然是没有什么卵用的,接着进行进一步分析,我这里暂且只分析看看我好友都来自哪个地区。
我对爬取的信息进行了简单的处理,然后进行操作。
(不得不说,Mac电脑的excel太鸡肋了,没有数据分析的功能)
接着,我用了下Matlab,画出了箱图,然而我自己都看不懂这是啥,算了,用spss吧。
好吧,spss打不开了,文件损坏。。。
这可怎么办,于是我用windows 10系统的电脑,进行处理,然而,我还是不会用excel处理这些数据去画个直方图,难道就这样放弃了吗??
不行,再苦也要坚持,于是用了最笨的办法,替换查询功能,挨个看。。。
最后,统计成功,辽宁地区最多,其次是没有标注地区的。
所以,经历了这次,我决定好好学一学数据分析,爬虫自动化爬数据虽然很流畅,但是分析上却很笨拙,这实在是说不过去了。
领取专属 10元无门槛券
私享最新 技术干货