数据分析就是运用适当的统计方法对数据进行分析,从一大批看似杂乱无章的数据中找出其内在的规律。
数据分析可以分为两个层次:
第一个层次是用描述统计的方法对数据进行整理,然后加以简化或绘制成图表,用以描述数据的特征及分布规律,例如用数据说明公司近几个季度的营收情况;
第二个层次则是用推断统计的方法对数据进行处理,分析数据之间的关系或以样本信息推测总体的特征和规律,例如分析产品使用用户数下跌的主要原因。
收集数据后,即使仅对数据进行了整理,我们仍然无法立即看到模式。这时,我们首先可以尝试通过计算数据,生成图表和其他方式进行分析,并找出揭示数据中隐藏规则的可能方向和方法;其次,在此基础上,选择几种分析方法进行数据的反复探索性分析。然后选择最佳的分析方法,从中进行进一步的深入分析以获得分析结果。最后,必须根据需要验证分析结果的可靠性和准确性。
当然,这只是一个粗略的数据分析过程。数据分析任务不同,使用的数据分析思路和方法也有很大差异,没有固定的公式可循。而且,实际情况通常非常复杂,各种因素交织在一起。如果仅分析看到的数据,最终结论通常不够全面和准确。
如下图所示,从表面数据来看,本周10-1的游戏下载量显着高于前三周,平均每天增长27%。但是,游戏下载具有一个特征,即用户在节假日和节假日前一天下载游戏的热情将大大高于普通工作日,因此周五,周六和周日的下载量将达到中秋节和国庆节放假时间比周一至周四高9-30,到10-7。下载量自然会高于普通工作日。
如果我们不考虑这一假期因素,就很可能得出“用户下载活跃度明显提升”的错误结论。因此,数据分析不能只关注数据本身,还要结合方方面面的背景信息。只有这样,数据分析工作才能更高效,得出的结论才能更准确。
通过数据分析,我们最终必须能够得出结论并从数据中提取有价值的信息。没有结论,整个数据分析过程等同于做无用的工作。同时,最好对分析结果进行必要的解释,并给出建设性的建议和措施。
制作图表如果数据分析结论的受众更广泛或更重要,那么最好制作相关的图表以更直观地传达数据分析结论。所谓信息图就是通过可视化图形(我们通过数据分析得出的结论)可视化复杂数据并显示数据中包含的不清楚和不明显的有价值的信息。
信息图应满足以下要求。
主题明确——信息图的主题应该明确。信息图只能解决一个问题,不能在所有方面传达太多结论。
结论准确——信息图应该能够将正确的结论毫无歧义地传达给读者。
内容简洁——信息图的内容应该足够简单。所有视觉元素仅用于帮助读者更好地理解信息。读者应一目了然地了解信息图表的含义。
设计美观——信息图的设计应该更漂亮。可以广泛使用某些方法,例如插入适当的插图,设计配色方案和有序的排版等,以使信息图对读者更具吸引力。
领取专属 10元无门槛券
私享最新 技术干货