374名10万+知乎大V(一):相互关注情况

一、前言

两个月前,今日头条签约了300多名知乎大V,随后引发广大关注和讨论,具体可见:如何看待今日头条一口气签了 300 多个知乎大 V 的传闻?

现在虽然热度已消逝,但一些困惑依然存在,到底知乎有多少大V(此处以“10万关注为标准”),他们都是谁?彼此的关注情况如何?存不存在亲疏远近,乃至抱团的情况......

正所谓有人的地方就有江湖,挖掘下上述数据,或许能窥见到不一样的知乎大V生态圈。

二、爬虫思路

本回以知乎第一大V张佳玮为种子ID,爬取其关注的85名用户,再依次爬取各自的关注列表,几层下去,获得几十万用户ID及相互关注情况,其中10万以上关注数的共有374人,1万以上关注数的有4139人。下图便是张公子所关注的用户:

继续用RAWGraph 绘制成“跳棋”样:

两个月前也爬取过知乎数据:《爬取张佳玮138w+知乎关注者:数据可视化》,本回发现反爬变得严格多了,此处先不做展开。

三、Gephi绘制关注图谱

获取得到374名知乎大V和25090条关注的数据后,依旧选择用开源网络分析和可视化神器“Gephi”来绘制大V们的关注图谱。

由于此前已用过一次,操作过程基本与上回相同,不再赘述,可按照英文操作一步步进行:

《Gephi绘制微博转发图谱:以“@老婆孩子在天堂”为例》

GEPHI – Introduction to Network Analysis and Visualization

虽然本次研究从1万+小V的16万条关注情况,聚焦到10万+大V的2.5万条关注情况,但由于总共就374名大V,人均有67条关注,还是有点密集。

运行算法后网络图谱有所分离,但最后的成果图依旧和上次一样不算很满意。闲言少叙,多图预警。

先来个GIF动图,看看大V们在一开始是如何的如胶似漆、厮混作一团的

运行老半天后,图形不再有明显变化

看到最后成果是这么一团网络也是一口老血吐在上面:

所有的节点情况:

一小部分节点和边,轮子哥@vczh已经出现,求带逛

一步步增加节点和边:

中心区域,关注情况(边的数量)逐渐加重:

一眼看到了在上面的程浩:伯爵在城堡。R.I.P.

底部的还有:

最终的成果图差不多就是这样。由于关注和被关注混在了一起;网络也不够分散,后续可能需要继续筛选出更精华、更少的数据,来绘制更直观的图谱,本次先简单的放放图,具体的解读,可以大家自行进行。还是能看到平时互相点赞的大V确实在图谱里非常靠近的。

另外绘制了七种颜色的图谱,大概是又一次被Gephi搞得吐血,只能填几个色,安慰自己了。逃...就不放图坑流量了。

四、小结

没有分析,没有解读,没有小结,放完图就携小姨子跑了。后面应该还会根据手头的数据写几篇相关文章,大家可以留言对什么感兴趣。知乎数据、Gephi软件(薛定谔的官网下载)、图表等,后续会放到公众号:牛衣古柳,(Deserts-X)。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏逍遥剑客的游戏开发

VRDC2017: Eagle Flight Technical Postmortem

43260
来自专栏CDA数据分析师

扫盲!SPSS,SAS,Stata,R有何区别,你选哪个?

对于各式各样的数据统计分析软件,你了解多少呢?经过潜心搜集,整理,我总结了一些软件的大体介绍及区别,欢迎大家指正和补充。 这里先略过Excel和Eviews这...

46460
来自专栏Data Analysis & Viz

爬取简书26万+用户信息:数据可视化

简书上有哪些优质用户?有多少大V粉丝数上万,获赞数上万?小透明的自己能排到多少位?大V之间相互关注情况如何?签约作者有多少人......

11330
来自专栏CDA数据分析师

扫盲!SPSS、SAS、Stata、R有何区别,你该学哪个?

来自经管之家 对于各式各样的数据统计分析软件,你了解多少呢?经管之家的这篇帖子经过潜心搜集,整理,总结了一些软件的大体介绍及区别,欢迎大家指正和补充。 这里先略...

99260
来自专栏云飞学编程

看金牌讲师重新制作微信跳一跳python辅助工具,这次是自动版!

9510
来自专栏Material Design组件

心理学与用户体验设计

5、只提供人们真正需要的功能,而不是想当然的提供 —— 席克定律(选择越多时间越长)、用户调研

8920
来自专栏PPV课数据科学社区

数据可视化实践之美

开篇主要是介绍了一些常用的数据可视化工具和图表,让各位看官对数据可视化有一个较为全面的认识。后续篇章会深入介绍如何运用工具绘制精美图表的技术细节。 随着DT时代...

51760
来自专栏PPV课数据科学社区

【学习】R语言书籍导读-入门到高级电子书下载推荐

R语言的资料非常多,R语言的书籍也聆郎满目啊。如何选择R语言书籍阅读呢?在此,我给大家分享一张自己做的R语言书籍导读的心智图。 ? 这个心智图,一共包括预备知...

44630
来自专栏CDA数据分析师

Python 爬取淘宝商品数据挖掘分析实战

? 作者 孙方辉 本文为CDA志愿者投稿作品,转载需授权 项目内容 本案例选择>> 商品类目:沙发; 数量:共100页 4400个商品; 筛选条件:天猫...

64750
来自专栏量子位

Google开源机器学习示例库:浏览器上可运行,免费GPU后端支持

13720

扫码关注云+社区

领取腾讯云代金券