前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >微博可视化网站定制:微博话题人物关系共现可视化

微博可视化网站定制:微博话题人物关系共现可视化

作者头像
月小水长
发布2022-05-18 13:48:53
5170
发布2022-05-18 13:48:53
举报
文章被收录于专栏:月小水长月小水长

这是 月小水长 的第 120 篇原创干货

写了个一站式微博分析可视化网站 作为长期项目,本次开放微博话题人物关系共现可视化功能,用户可以输入 2021 新版微博话题爬虫发布 的 csv 结果文件和自己的邮箱,然后网站后台提取话题的文本内容中相互艾特的人物关系并且生成 gephi 构图所需的 edge.csv 和 node.csv 文件,处理成功并压缩后发送至你输入的邮箱地址。接口地址如下:

http://weibo.buyixiao.xyz/custom-vis/topic-user-co-occurrence-visual/

使用 gephi 导入 edge.csv 和 node.csv 分别作为边数据和点数据,采用 ForceAtlas 2 布局,最终的效果图如下:

gephi 效果图

需要注意的几点

1、话题爬虫的 csv 文件必须有 user_name 和 content 列,其中 user_name 是每一条边的起点,user_name 对应的 content 就是我们要提取出的 @ 人物的微博文本;同时,该 csv 文件必须是 utf-8 格式,最好不要在 excel、记事本等软件中打开修改,不然请确保修改编码格式也是 utf-8;上传的 csv 限制最大 10M

2、后台处理耗时不到 1 min,如果超时还没有收到,请查看邮件垃圾箱,再不然在文末点击阅读原文的 buyiXiao's blog 网站留言,我会及时查看后台日志并反馈。

3、gephi 导入边数据集有个大坑是,需要用记事本将 edge.csv 改成 ANSI 格式,然后导入电子表格时格式选择 GB2312,否则 gephi 会提示以下错误:

边表格需要一个包含节点标号”源“和”目标“列

最后,有关微博可视化网站的更新日志和功能大全,可在以下地址查看。

https://buyixiao.github.io/blog/one-stop-weibo-visualization.html

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 月小水长 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档