“数据可视化”是一种使用技术手段表达数据分析师想法的艺术方式大部分初学者理解的数据可视化≈画图表,这是十分“奶义务”的想法:数据可视化是一个需要理解数据、数据结构、数据交互原理、数据表达逻辑的复杂工作。在数据可视化之前,我们需要对原始数据进行大量的整理及精细化处理工作,这一步的技术平台首选数据库SQL。除了一般图表,数据可视化有两个方向很值得去尝试:商业智能BI与复杂交互式图表。
接下去将以“双十一美妆数据价值挖掘”为案例,分点来介绍大数据分析库—PetaBase、商业智能亿信BI、Echart。为什么很多数据类岗位都要求求职者具备SQL技能?互联网公司每天都需要处理大量数据,这些数据不可能都存储在某个人的PC上。在这种情况下,方便协同工作的数据库SQL成为通用的数据管理平台。
下图演示的是使用最强大的大数据分析库—PetaBase处理数据的流程(演示是在Sublime中书写SQL语句,在psql中执行代码):创建数据库并导入csv数据查看并删除相关缺失值列明修改及计算双十一商品打折折扣力度
对于SQL,处理几万条乃至更大体量的数据,效率都是非常高,并且代码不长,易于理解。回到可视化,SQL作为数据可视化工作的第一步,完成了数据管理及清洗工作。接下来我们来看看另外两条路:用商业智能BI做数据商业价值挖掘or用交互式图表表达数据内容。亿信BI——最好用的商业智能工具平台!
领取专属 10元无门槛券
私享最新 技术干货