专栏首页萝卜大杂烩用Python探索红楼梦里的关系

用Python探索红楼梦里的关系

拜读过徐麟兄(公众号“数据森麟”)发布的《“水泊梁山“互联网有限公司一百单八将内部社交网络》,真的是引人深思,辗转反侧啊(我已经不知道用什么词来形容了

)。于是乎,自己也仿照着,来理一理红楼里的那些关系

憋慌,这绝对不是你想象的那样的文章

01.准备

 1. 红楼TXT版本电子书一本
 2. 红楼人物小全一份(之所以叫小全,是因为只包括宝玉和十二钗)
 3. 安装好Python3并且安装pandas和pycharts库
 4. 找个夜黑风高,无人打扰的夜晚(毕竟这是个技术活

02.编码

Action 1

数据准备阶段

首先对TXT文本做下简单的处理,以空格作为分割标准,再使用pandas读取人物excel列表,并把每个人物出现的次数存入其中。

Action 2

用图表展示人物出场次数

这里使用pyecharts来作图

到目录下找到该HTML文件,打开查看

啥也不说,宝玉妥妥的NO.1,谁叫人家是块顽石呢

,最没想到的是,我们的黛玉小姐姐竟然只能排第三,辣凤子稳居第二,看来古时这种川妹子类型的就很受欢迎呀

Action 3

产生相互之间的关系,因为后面要使用Gephi,所以这里产生三列,Source、Target和Weight

其实就是两层循环,把共同出现在一个段落里的人物的次数拿出来

03.产生相互的关系

使用Gephi,突然发现这真的是一个强大的工具啊,感觉在以后的数据可视化中会大展拳脚的(就是需要后面好好研究下

)。

这里我还是调试了很久的,后面有机会写一下这个软件的相关学习总结吧,这里直接上图了。

导出之后能看的更加清楚

妥妥的“铁”三角啊

,然后凤姐、湘云等在外围插科打诨

04. 后话

最后,放上代码地址:https://github.com/zhouwei713/honglou,点击“阅读原文”也可跳转到GitHub。

最后的最后,撸完代码,又有重新再看一遍红楼梦的冲动了,冲鸭!

本文分享自微信公众号 - 萝卜大杂烩(zhouluoboluandun),作者:萝卜大杂烩

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-12-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

 • 小白刷力扣之整数反转与回文数

  题目描述: 给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。

  周萝卜
 • 数据分析入门系列教程-K-Means实战

  上一节我们讲解了 K-Means 算法的原理,并且手动实现了一个 K-Means 算法函数,今天我们一起来完成相关的实战内容。

  周萝卜
 • 揭开互联网公司的神秘面纱,数据解读那些slay整个行业的互联网公司

  作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据

  周萝卜
 • VB 中chr(10)、chr(13)和vblf、vbcr、vbcrlf的分别

     cr是回车,只有回车,是到本行的最头上;lf是换行,到下一行;crlf是到下一行的最头上

  令仔很忙
 • CSS盒子模型

    2.盒子的边框:border(border-top、border-right、border-bottom、border-left).

  阿豪聊干货
 • JavaScript依赖注入的实现思路

  JavaScript依赖注入的实现思路 如今各个框架都在模块化,连前端的javascript也不例外。每个模块负责一定的功能,模块与模块之间又有相互依赖,那么问...

  用户1289394
 • 经典面试题(三)之网络通信题目集锦

  1. TCP/IP协议栈层次结构 2. TCP三次握手需要知道的细节点 3. TCP四次挥手需要知道的细节点(CLOSE_WAIT、TIME_WAIT、MSL)...

  范蠡
 • 糟糕的程序员面试

  “谷歌式”面试真心是让人又爱又恨,它糟糕透了:好的应聘者落选,坏的应聘者背背答案就能通过,呵呵。

  哲洛不闹
 • 开源公共组件仓库的更新日志应该如何写

  在 GitHub 或 Gitlab 等开源的公共组件仓库里面,应该需要维护更新日志 CHANGELOG.md 文档,方便让用户和开发人员更简单明确的知晓项目在不...

  林德熙
 • 一个同学的疑问:“做久了前端培训,再回开发岗位,会不会被嫌弃?”

  说实话这种问题我以前还真没想过,因为一般能讲就能做嘛。你都能教别人了,自己还能不会嘛。 回到标题中的疑问哈,只要能力到位,一般不会被嫌弃的。用人单位都愿意雇佣你...

  web前端教室

扫码关注云+社区

领取腾讯云代金券