前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >从零搭建微信公众号数据分析体系:准备篇

从零搭建微信公众号数据分析体系:准备篇

作者头像
做数据的二号姬
发布2023-09-06 13:19:11
2650
发布2023-09-06 13:19:11
举报
文章被收录于专栏:HR大数据

29

2023-08

从零搭建微信公众号数据分析体系:准备篇

如题,从零开始搭建一个微信公众号数据分析体系~

LEARN MORE

图片由海艺AI绘制

照例先说一下背景

其实一直在纠结技术系列到底怎么设计比较合理的问题,虽然我很想分享很多技术和经验,但是奈何我不知道怎么讲。

就技术论技术其实不是什么有意思的话题,毕竟这种文章chatgpt来写更合适,官方文档改写一下直接成文,效率多高。我作为一个作死要和AI死磕写文章无可替代性的人,自然不会选择在这种话题,毕竟这种话题是真的比不过。

从一个项目来入手讲技术是一个比较好的选择,毕竟对于数据分析师来说,把纯技术当作自己的核心竞争力是比较危险的(具体原因就想想为什么算法和数据挖掘容易成为裁员的重灾区)。然而很真实的项目又不太敢拿出来讲,从某种程度上来说,这些信息都算得上是公司机密。

于是我就想到了找一个非常真实的项目来讲,从前期的规划,到最终的成品,一步一步都是怎么做出来的完全展示出来,这样就能把每一步的设计和思考都讲明白了。这样一来,微信公众号的后台数据就变成了唯一一个我自己拥有所有的独立数据且和公司之类的完全没有任何关系的独立项目。

其实之前推送过一篇文章《为何我个数据分析师从不分析公众号阅读数据》,当时有讲到一个很重要观点:不管你怎么鼓吹数据分析的重要性,依然不能回避的事情是业绩是做出来的,并不是靠分析得出的,在文章质量本身都还是一个问题的合适分析其实帮不上任何忙。这对于数据分析师而言,理解这一点其实是非常艰难的,因为一旦认识到了这一点,就会不可避免地陷入自我怀疑中。

现在突然又提起了这个话题,主要是因为现在已经基本越过了分析有效还是无效的这个门槛:数据量积攒到了一个可以拿来分析的程度。其实不难理解什么叫分析是否有效的门槛,当一篇文章的阅读量是8,一篇文章的阅读量是10的时候,其实完全不能说10的那一篇就比8的那一篇写得好。此外,还有一个很关键的因素,现在基本解决了长时间不写作导致的写作困难的问题,一口气写三五千字的文章已经不是什么难题了。既然写出来已经不是问题了,那么接下来就该看看优化的问题了,逻辑无懈可击。

目前公众号的核心数据是这样的,虽然对于分析来说还是偏少了一些,但是起码300以上算得上是一个可以拿来分析一下的量级了——至少现在开始搭建分析体系算是比较合适的时间了。

所以接下来,我会以一个比较严肃的分析项目方式来搭建这个分析体系,按照周更的方式来分享在搭建的过程中的思路和关键的技术做法。别的不敢说,但保证会是一个有趣的系列

值得说明的是,这个系列其实是一个“边做边更新的”,大家有什么更好的想法也欢迎私聊或者来唠嗑群里告诉我。

明确一下目标

对于一个分析项目来说,明确目标永远是第一位的。虽然我对于公众号本身是很佛随缘,成就成不成就不成的心态,但既然要写成一个项目,那就必须要有明确的分析目标。

不过既然提到了明确目标,那就不得不把目标拆解成长中短期的目标啦。设定目标就和立定跳远一样,眼睛一定要盯着一个比自己真实目标更远的地方,眼睛盯着的地方往往就是你的上限。

于是我顺着一个宏大的目标,靠写稿发家致富做了一个思考:

企业中老板一般负责做梦,于是我选择先做一下梦。我习惯于在分析项目之前先了解一下老板做了什么美梦,想想每个梦的实现路径到底靠谱不靠谱,如果有得选的话,就尽量规避一个明显不现实的项目。比如这个项目中,如果是企业的话,坚决不能去卖书那条线,真的没什么钱途。

最终的目标确定了,或者说叫“企业愿景”确定了,接下来就是做能落地实施的计划方案了。

一般来说,这个一二三阶段的目标都是老板确定的,分析师需要根据这样的目标和阶段来进行数据分析目标和阶段的设定,但是现实中其实不乏自己想不明白计划和目标的老板,也不乏不清楚自己该干啥的需求方,所以很多时候做数据分析累就累在了很多时候你不得不去承担一些别人该承担的事情,否则你一定会被猪队友拖下水。

当大的业务目标确认之后,就该考虑如何搭建数据体系了。因为三个阶段嘛,三阶段还早,所以数据体系的搭建主要围绕第一阶段的目标展开,但是在设计的时候不能给后来的目标埋坑——数据该留的给留下,就算现在用不上,未来也有能用到的时候,不能等到了该用的时候发现数据没有留下。

所以到了执行层面,要做得事情是这样的:

开始执行

要做得事情确认了,接下来就是确认一些怎么做了。如果是在企业的话,这一步就叫做软件选型。

选择软件其实没啥好说的,就两个主要决定因素,一个是有多少预算,另一个就是数据量&分析时效性的需求到底有多大。

对于企业来说,预算有多少这个事情就非常耐人寻味了,毕竟老板一般情况下第一反应是我也不确定预算多少合适,反正能少花点就好,所以这个环节一般的流程是先把市面上的产品报价都找一遍,列一个对比表,让老板决策一下。虽然看起来简单,但是中间就牵扯到反复的沟通了,供应商那边,老板那边,都得谈。

分析时效性的选择基本是和业务场景是有关系的,比如以我这个分析公众号文章的需求为例,实时数据就完全没有必要,数据延迟1-2天根本没有任何影响——我不可能因为指标下降了就立刻做干预和调整,就算我再勤奋,做调整再快再快也得一天以后吧,此外,我也不会一直盯着看数据嘛。大数据实时分析固然很帅,但是这一套技术方案对于我这个需求来说就是杀鸡用牛刀,根本没有必要。打开系统随时看到的数据都是最新的数据固然让人兴奋,但很多业务场景对数据实时性的依赖并不到,业务并不会因为统计报告延迟了一天而遭遇什么重创。

对于个人玩来说,这个问题就简单多了,预算就是能不花钱就不花钱,直接选择免费且我很熟悉的东西开展就好了。数据量的评估也很容易,就我这粉丝数哪有什么数据量噢,最简单的方案就行了。

综上,这个任务在软件选择方面最终涉及到了三部分软件的选择:数据库、RPA工具、BI工具。

至于为什么要有RPA工具,主要是因为微信公众平台并没有提供数据导出的接口,页面手动导出再入库又很麻烦,所以这里会考虑一下RPA工具。当然,没有接口导出数据这一点对我而言是已有的知识,对于企业实际的项目项目来说,这里还需要先确认一下有没有接口的问题。

首先是数据库的选择,以我熟悉用为标准来看的话,有PostgreSQL、Access、MySQL、MongoDB、SQL sever可以选择。从逻辑上来说选择PostgreSQL比较好,毕竟自带主键UUID;SQL Server 也不错,和Power BI的兼容比较好;Mysql的话电脑上有现成的。考虑到SQLserver不是免费的,直接忽略,付钱是不可能付钱的。考虑到一些技术私心,我选择SQL Server,毕竟有一些微软的骚操作只支持SQL Server嘛,再说了,全都用很熟悉的软件多没意思。

BI工具的选择,有Power BI、tableau、QlikView和FineBI可选,我选择Power BI作为最终实现的工具。FineBI个人版阉割了太多的功能了,不好用,Power BI我最熟悉,所以选择这个作为最终呈现的工具。

RPA工具的选择,初步选择uibot,主要还是因为电脑上有现成的安装包且相对比较熟悉了。不过有可能随着后面的进展而选择替换RPA工具,毕竟对于这个分析来说,RPA自动化是提效,而不是必要软件。

准备数据库

确定了软件之后,就开始配置啦~

首先是安装SQL Server,直接从微软官网进行下载,https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads。因为不想付钱,所以我选择免费的版本:

软件的安装毫无难度,和普通软件安装一样点下一步下一步就可以了。

等漫长的进度条跑完之后,就可以直接连接了~

不过我比较喜欢navicat,所以我到navicat中进行连接。连接的配置非要说有什么特殊点的话,那就是SQL Server可以选择windows身份认证作为数据库的用户名密码认证,相比mysql之类的还是亲民很多,毕竟曾经有过忘记localmysql的密码是啥的经历,只能说,非常酸爽。

纯小白的同学,可以直接按照下面这个设置进行配置就可以了。

和MySQL略有不同的地方是,SQL Server没有自带默认的数据库,需要自己新建数据库。

这并没有什么难度,和其他的数据库操作都是一样的,直接在数据库这里右键,选择新建数据库即可。

接下来是安装BI工具,推荐大家从微软的应用商店搜索并安装:

这么做得优点是,power BI差不多一个月就会更新一个新的版本。从应用商店下载安装的话会自动更新,但是从网页下载安装的话则需要自己手动更新了,有点烦人。但是这么搞的缺点是,有一说一,微软应用商店加载速度慢得离谱,半天没反应是常事。

注意,安装的时候要选择截图的这个desktop版本,而不是默认弹出的这个版本。

到这里,软件的准备就可以了。下周我们来分析一些已有的数据并搭建指标体系。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 做数据的二号姬 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云 BI
腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档