【零一】#操作教程#从0开始,教你如何做数据分析#初阶#第一篇

大家好,我是零一,今天给大家带来基础教程。我的公众微信号是start_data,欢迎大家关注。

本文适合以下情况的读者:

1丶淘宝店铺运营或者店长,目前还不会做数据分析,渴望提升自己

2丶打算在淘宝开店的朋友,目前尚在混派代学习中

3丶其他对数据分析感兴趣的朋友,尚在入门阶段

================第一部分 数据分析概述==================

那么,我们直奔主题。

数据分析的概念必须搞清楚。简单点说,数据分析是将数据进行清洗后,把隐藏在数据背后的信息提炼出来。

另外,值得一说的是,数据分析是获取新知识的新途径。

下面看一下菜鸟跟数据分析师的区别,引自《谁说菜鸟不会数据分析》一书

可以看出来,专业一点的数据玩家的思路会非常清晰,而且会以目的为导向,建议大家参考分析师的思路。

数据分析的过程已经有非常多的前人做出了总结,我还是引用书中的结果

分别是,明确分析目的和内容——数据收集——数据处理——数据分析——数据展现——报告撰写

做任何事情都要有目的,做数据分析也不例外,而且明确目的在数据分析里面上升到了一个非常重要的高度,甚至决定了你后面所做的一切有没有价值。

做数据分析必须运用工具,没有工具几乎无从开展,大家看下一般数据分析有哪些工具

可以看到,底层是数据库,在数据量大的情况下,需要动用到数据库。

报告层是Crystal Reports(动态和可操作的报表,没用过)

分析层是分析的工具,从左到右分别是Excel(Office套装里面的一员),UCINET(社会网络关系分析,没用过),SAS(最古老最专业的数据分析工具),SPSS(跟SAS齐名),Clementine/Modeler(IBM的工具,以简单易用闻名)

最后是表现层,也就是做报告的一系列工具,我只接触过PPT和水晶易表,一般会用PPT就可以了。

本文讲的数据分析,选择的是大家比较熟悉的Excel,Excel做深入分析的时候比较麻烦也有局限性,但就上手指数来说,Excel是排第一的。数据量在一百万条以内,无须用到数据库。

我选用的版本是Excel 2010

下载链接:http://pan.baidu.com/share/link?shareid=723393432&uk=2164472865 密码:bon1

=================第二部分 实操================

第一步,我们要明确分析的目的和内容。因为是实例,我假设

目的:了解淘宝美容行业的市场情况

内容:1丶行业分析,2丶属性分析(采用折线图和饼图直观反映行业趋势和容量)

第二步,数据收集,一般手动收集,也可以用工具收集。这里提供工具给大家做练习。提供的是仅支持美容大类的版本,运行环境,excel2010/2013,32位xp/WIN 7,假如没有生e经,那没关系,下面用到的数据源一样会共享给大家,拿着数据源就可以一步一步跟着操作。

工具及源数据下载链接:http://pan.baidu.com/share/link?shareid=3221420473&uk=2164472865 密码:ecv0

数据来源:生e经(必须有开通生e经,并能查看相应行业数据)

数据宽度:21(月)

因为生e经按月展示数据,因此这里的数据宽度,就是月份数。

打开表格,然后,按下列图片次序操作

自己登陆生e经复制生e经的地址进来。登陆好,就把窗口关闭即可。其中c2代表服务器编号是2.

选择正确的服务器编号才能正常抓取。

选择好后,点开始抓取数据

耐心等待(等待时间和抓取的月份丶网速有关系),会在excel中出现结果,那么可以把这些数据复制到我们的另一个工作簿上,也可以导出为csv格式。

导出的文件可以保持在本地,方便下次提取。

第三步:数据处理,简单举例,可以跟着做。

做下简单的处理,这里提取年份使用这个公式:=LEFT(E2,4),提取月份使用这个公式:=RIGHT(E2,2),然后填充。如下图所示,鼠标移到单元格的右下角位置,会出现个黑色小方形,鼠标也会变成黑色的十字架,双击即可填充。

接着,我们插入数据透视表,鼠标点一下我们的数据,任意一个单元格都可以,只要在数据范围内,如图,我点在F10单元格。

点数据透视表,会自动匹配整个数据框。我们点确定即可。

点确定后,效果如下图所示

用鼠标,将字段拉到下面的相应位置即可

第四步:数据分析

我们现在就已经完成了数据透视表,通过这个透视表,就可以比较直观的对比各行业间的差异,但是都是数字,不免有些晕,或许用图表来展示会更加直观

点一下数据透视表,然后点插入——折线图,这里选择第一个样式即可(其他样式可以自己尝试)

结果如图所示

发现面膜/面膜粉的走势好像不错。

接着,我想看一下各行业的容量占比,重点看下面膜/面膜粉这个行业占比多少,就以2013年的数据来统计占比。还是插入数据透视表,先设置好字段,然后再选择2013.

接着,插入饼图

结果如图所示

这里看不到占比,而且也不知道哪个行业,这就需要我们设置一下图表。右击图表——添加数据标签

出现标签后,我们再右击一下标签,设置数据系列格式

按下图红框设置即可

然后改下标题,稍微把图表的尺寸拖大一点

这样,就比较直观了,面膜/面膜粉在2013年1-9月份中,销量占了整个美容护肤行业的16%。那么我想再仔细看看面膜/面膜粉行业的销量走势。依然先插入并设计数据透视表。

然后,插入折线图

结果如下图所示

两年的销量走势对比,可以看出2013年比2012年增长了不少。增长需要涉及到环比增长和同比增长两个概念,今天先不讲。我们通过目测就已经看出来,今年比去年火,但是这个结论还不是最终结论,只是简单建立在数据层面的初步结论,还要通过淘宝去验证,搞清楚销量的增长是来自哪里。假设是某几家品牌促销的结果,那么这个数据对于我们而言,意义就不一样了。或许我们自己是这个行业的一个品牌商,则需要把后面的分析重点转移到研究这几家品牌的营销研究上面来,弄清楚对手究竟如何改变了这个市场。

属性分析里面包含了SKU,操作方法跟上面类似,这里就不演示了。

第四步:数据展现

把我们以上得到的结果,进一步优化,更加直观丶有序地展现出来。

第五步:撰写报告(非商业严谨报告,以实用为主)

把所看到的,所想到的,通过文字的方式记录下来,方便自己或者他人阅读,了解我们的分析思路。

==================结束语==================

帖子不宜太长,大家慢慢消化。下次有时间继续教程。这系列教程可能要分3篇才说得完。系列教程说完后,再给大家介绍店铺日常运营中用到的数据分析。

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2013-12-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏极乐技术社区

一周小程序【资讯教程Demo】更新

轻松一刻 请不要误导我,我懂二进制 ? 微信小程序官方更新 小程序能力升级 微信推出官方教学小程序:基础功能为主 面向中老年人群 资讯与教程 微信小程序开发问...

42770
来自专栏极客生活

最趁手的数据可视化工具Tableau

作为一个数据分析从业者,不但要从杂七杂八的数据中提取有用的数据,而且还要生成漂亮的图表展示出来。

18120
来自专栏跟着阿笨一起玩NET

Grid++Report报表工具C/S实战篇(五)

48520
来自专栏ionic3+

angular2及以上框架PC版后台管理模版手机版

基于Ant Design 的 Angular版本,文档是中文的,ui丰富且漂亮,而且基于管理后台的有相应版本:ng-alain

13220
来自专栏web前端教室

仿制 豆瓣电影 app beta(一)

今天做一个简单的仿制 豆瓣电影的app,因为白天要讲课,所以只能晚上等孩子睡了,再抽空来写写,所以。。。界面上看起来确实比较简陋,但功能都还是ok的。 ? <!...

36760
来自专栏hrscy

初识 Unity3D

早些年,游戏引擎市场的变化是非常大的,其中有一些比较出色的软件。比如 unreal,但是 unreal 走的商业模式针对的是大型的游戏公司,大公司通过购买序列号...

19430

D3可视化:让您的仪表板更上一层楼

无论您的公司在哪个行业运营都可能产生大量数据。从销售到人员再到库存,若企业能够正确解释并转化为可行建议,企业将创造出非常有价值的信息。商业智能与分析以此想法为中...

43110
来自专栏phodal

从 2017年 3 月期的『技术雷达』看 2017 年的前端趋势

回到家里,我就收到订阅的 ThoughtWorks 技术雷达邮件:《2017年最新版技术雷达发布》,过了一下简介: ThoughtWorks技术雷达来源自Th...

20780
来自专栏花叔的专栏

Nodes小程序追加评论功能

话说,最近深圳发生了一次恶性的超市砍人事件,事发点所在的超市竟然位于花叔第一套房子所在的小区!

307110
来自专栏大数据文摘

用Python开源机器人和5美元,我在Instagram上搞到了2500个真粉儿

63250

扫码关注云+社区

领取腾讯云代金券