前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >中文NLP笔记:4. 文本数据可视化 的几个方法

中文NLP笔记:4. 文本数据可视化 的几个方法

作者头像
杨熹
发布2019-01-28 17:21:52
2.7K0
发布2019-01-28 17:21:52
举报
文章被收录于专栏:杨熹的专栏杨熹的专栏

文本数据可视化 有下面三种

1. 基于文本内容的可视化

  基于词频的可视化和基于词汇分布的可视化

  常用的有词云、分布图和 Document Cards

2. 基于文本关系的可视化

  研究文本内外关系,帮助人们理解文本内容和发现规律

  常用的可视化形式有树状图、节点连接的网络图、力导向图、叠式图和 Word Tree 等

3. 基于多层面信息的可视化

  研究如何结合信息的多个方面,帮助用户更深层次理解文本

  常用的有地理热力图、ThemeRiver、SparkClouds、TextFlow 和基于矩阵视图的情感分析可视化等


代码举例

  1. 词云

  wordcloud=WordCloud(font_path=simhei,background_color="white",max_font_size=80)

  2. 关系图

  用连线图来表示事物相互关系的一种方法。

  安装 Matplotlib、NetworkX

    DG = nx.DiGraph()

DG.add_nodes_from(nodes)

DG.add_edges_from(weights

nx.draw(DG,with_labels=True, node_size=1000, node_color = colors)

  3. 地理热力图

  通过分词得到城市名称后,将地理名词通过转换成经纬度

  使用 Folium 库进行热力图绘制地图

    map_osm = folium.Map(location=[35,110],zoom_start=5) 

HeatMap(data1).add_to(map_osm) 


学习资料:

《中文自然语言处理入门实战》

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.01.22 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档