微信好友信息采集-python爬虫

首先,在终端安装一下itchat包。

sudo easy_install itchat

打开pycharm,输入代码

importitchat

itchat.login()

#爬取自己好友相关信息, 返回一个json文件

friends = itchat.get_friends(update=True)[:]

#初始化计数器

male = female = other =

#friends[0]是自己的信息,所以要从friends[1]开始

foriinfriends[1:]:

sex = i["Sex"]

ifsex ==1:

male +=1

elifsex ==2:

female +=1

else:

other +=1

#计算朋友总数

total =len(friends[1:])

#打印出自己的好友性别比例

print("男性好友: %.2f%%"% (float(male)/total*100) +"\n"+

"女性好友: %.2f%%"% (float(female) / total *100) +"\n"+

"不明性别好友: %.2f%%"% (float(other) / total *100))

defget_var(var):

variable = []

foriinfriends:

value = i[var]

variable.append(value)

returnvariable

#调用函数得到各变量,并把数据存到csv文件中,保存到桌面

NickName = get_var("NickName")

Sex = get_var('Sex')

Province = get_var('Province')

City = get_var('City')

Signature = get_var('Signature')

frompandasimportDataFrame

data = {'NickName': NickName,'Sex': Sex,'Province': Province,

'City': City,'Signature': Signature}

frame = DataFrame(data)

frame.to_excel('weixin.xlsx',index=True)

然后会弹出来一个二维码,扫描登录,就可以获取信息了

(别问我咋这么有勇气po出来自己的二维码验证,因为有时效性,你登录不上去的,哈哈哈)

(哈哈哈,暴露了,我这里男女比例)

信息获取后,就这样待着,显然是没有什么卵用的,接着进行进一步分析,我这里暂且只分析看看我好友都来自哪个地区。

我对爬取的信息进行了简单的处理,然后进行操作。

(不得不说,Mac电脑的excel太鸡肋了,没有数据分析的功能)

接着,我用了下Matlab,画出了箱图,然而我自己都看不懂这是啥,算了,用spss吧。

好吧,spss打不开了,文件损坏。。。

这可怎么办,于是我用windows 10系统的电脑,进行处理,然而,我还是不会用excel处理这些数据去画个直方图,难道就这样放弃了吗??

不行,再苦也要坚持,于是用了最笨的办法,替换查询功能,挨个看。。。

最后,统计成功,辽宁地区最多,其次是没有标注地区的。

所以,经历了这次,我决定好好学一学数据分析,爬虫自动化爬数据虽然很流畅,但是分析上却很笨拙,这实在是说不过去了。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180116G0ESKJ00?refer=cp_1026

同媒体快讯

  • 常见Dos命令

    2018-10-22

相关快讯

扫码关注云+社区