前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python数据分析之基情的择天记

Python数据分析之基情的择天记

作者头像
Python中文社区
发布2018-01-31 17:41:00
7120
发布2018-01-31 17:41:00
举报
文章被收录于专栏:Python中文社区Python中文社区

專 欄

罗罗攀,Python中文社区专栏作者

专栏地址:

http://www.jianshu.com/u/9104ebf5e177

人一生都可能无法逆天改命,但你却是要去奋斗一把。本文章主要通过最简单的共线性关系,利用gephi工具绘制择天记的人物关系图。 准备工作

在网上下载《择天记》小说以及创建小说人物的txt。

jieba库 需要下载gephi软件 注意:安装路径不能有中文字;需要安装java环境,不然无法使用gephi。

定义数据结构

names用于存入小说人物和出场次数;relationships保存人物关系的有向边,该字典的键为有向边的起点,值为一个字典edge,edge的键是有向边的终点,值是有向边的权值,代表两个人物之间联系的紧密程度;linenames存入每行小说出现的人物;all_names是小说所有人物。 添加人名到jieba词库中

jieba库分词可能并不能把小说的人物都切开,我们需要把这些人名添加到词库中,以便成功分词。

统计出场人数

通过图可以看出,陈长生作为主角,出场最多,而他的好基友是排第二的,而他的女票徐有容却是排到第五,这与一些玄幻小说不一样,注定了这是一部基情的小说。

人物关系及写入文件

绘制人物关系图

最后利用gephi绘制人物关系图。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-07-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python中文社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档