词云真的是一种好的数据可视化方式吗?

很多文章都指出词云图的‘弊大于利’,如Marti A. Hearst在Stephen Few的Visual Business Intelligence Newsletter发表的署名为‘标签云怎么样’的文章。从我个人看来,词云的优点和不足之处总结如下:

好的方面

他们在信息图表和PPT中是吸引眼球的元素,相比其他如条形图更能吸引注意力;

词云提供了某种程度的‘第一印象’,最常使用的词会一目了然;

可以从不同维度展现数据:词汇本身、频率(词汇大小)、以及词汇的颜色;

在某些仪表板上可以作为highlight和过滤数据的导航元素;

它们很流行,尽管更像是一种现象,不过仍然可作为一种优点吧。

不好的方面

相同大小的词汇很难比较,不像条形图可以创建参考线,人眼不擅长于分辨区域活词汇的大小;

越长的词汇需要越多的空间展示,因此看起来比较短的词汇有更大的权重,尽管实际上他们是一样的;

在报表上很占用排版空间;

词汇的排列要么是随机,要么根据某种算法。属于同一类型的词汇分布可能会相距很远,并且小一点的词汇可能会被忽略。

有没有更好的选择?

答案是有的!

选择1:Tree Map

显然,Tableau更倾向于用户使用Tree Map. 如果你把Marks type设置成自动,然后拖动词汇到文本控制,以及词汇count到大小控制,Tableau就会自动显示一个Tree Map.因此我的建议是使用Tree Map而不是词云图。

选择2: 条形图

这听起来可能会比较无趣和古板,但是和前两者不同的是,条形图可以创建一个参考线,因此使得数据比较更加容易理解。另外,数据的排列顺序也有寓意,Tree Map(勉强可以吧)和词云显然难以做到这点。

我的结论

词云在信息图表和PPT中是吸引眼球的视觉元素,但在严谨的商业数据分析和可视化方面并无立足之处。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181015A1DHQH00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券