数据可视化技术主要有两大功能:
将分析结果更加清晰地展现出来。
将数据有效组织起来,利于提出新的猜想,或引导某一项目下一步的走向。
1.直方图
直方图看似简单,实际上功能却很强大。有时,直方图也被称为频数分布图。
从视觉效果上来说,需要画一个频率图,把相关变量排布在X轴上,而Y轴显示的则是每个值出现的频率。
2.条形图与饼状图
条形图与饼状图则主要适用于类别变量。
如果要分析变量分布,并且这些变量的值又比较固定,比如只存在低、正常、高,是、否,或者常规驱动、电驱动、混合驱动等有限选项,那么这个时候最适合的选择就是条形图或者饼状图。
如果数据类别过多的话,无论是条形图还是饼状图,可视化的效果都不会太好。在这种情况下,可以考虑只对前几项最大值进行可视化处理。
3. 散点图与折线图
或许最简单的图莫过于散点图,因为它将数据展现在一个二维的笛卡尔坐标系中。
散点图尤其适用于研究两个变量之间的关系,它能将这种相互关系更加直观地展现出来,以便我们进行研究。
折线图其实也是散点图的一种,只不过它用一根线将所有的点连接了起来。如果变量Y的值是连续的,则常使用折线图。
4.时间序列图
时间序列图也类似于散点图,只不过X轴上标注的是时间范围。在时间序列图上,所有的点连接成一条线,以提醒我们时间是连续的。
如果想要更加直观地研究某一数据随时间的变化趋势,时间序列图就是绝佳选择。因此,时间序列图在分析财务数据和传感器数据上应用得尤为普遍。
5.关系图
如果你的目的是提出一个全面的猜想,那么关系图就非常合适,因为它能直观地展现出数据之间的关系。