前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析师必看:数据分析框架和任务拆解

数据分析师必看:数据分析框架和任务拆解

作者头像
1480
发布2020-02-19 13:41:22
7320
发布2020-02-19 13:41:22
举报
文章被收录于专栏:数据分析1480

当领导给到一个目标的时候,你会怎么做。譬如,我们现在从某个产品获取到了很多用户的意向信息,需要怎么把这些数据和业务结合在一起?下面聊一下几个思路,

01. 先对意向信息的有效性、质量、真实性进行识别和明确

怎么确认?

  • 首先,信息的采集渠道有哪些,各自的准确度,取决于公司各平台的特性,用boston矩阵进行拆解分析,最终进行权衡;
  • 采集到信息的完整性,能够描述意向的指标内容项有哪些,是不是都具备了。即对意向的定义和定性过程,是一个人看了就算、还是说他看了很长一段时间就算、或者说他渗透到某一个下沉页面的时候才算,这里面都有不同的理解;
  • 信息的衍生指标,譬如说这个用户的基本信息,年龄、性别、收入流水、籍贯、常住地等等;用户在产品上的使用行为记录,看过哪些页面、每个页面的停留时长;平台信息对这个用户的综合评价性指标,首次登陆时间、活跃频次、日常访问时间段、停留时长、留存情况、复购情况等;
  • 商品的衍生信息,基于浏览/检索的内容信息反向搭推荐内容框架,譬如搜索的商品是A,A的属性有品牌、类型、价格、参数,那么同类型的品牌产品、同价格区间的其他产品、同品牌下的系列产品、同参数的不同价格产品等等;
  • 对于用户的第三方平台数据信息,譬如征信记录、银行存款、信用额度等等。

通过对以上信息的综合整理,构建一个基于用户的线索池,进行自我交叉验证;构建一个外部数据池,进行三方交叉验证,最终沉淀下来的基本上就是能够应用的数据。

02. 再设计信息的分发流程,需要经过哪些部门,谁来用,怎么用这些过程

在经过第一层模型的数据筛选处理之后的信息我们认为是可靠的,这时候单一部门已经没办法让数据的价值得到充分的体现,必须是跨部门的协同合作,这时候就需要考验对产品、对业务、对技术的理解程度了。

这些意象信息,可以应用在哪些业务上,涉及到哪些人以及这些人的职责是什么,信息的流转需要以什么样的载体在产品中体现,包括技术上的一些壁垒打通。譬如说我们用python做了数据的处理清洗,算法模型在其他语言实现时可能会打一定的折扣,那这时候就需要精进我们的技术能力,可以提供相关的接口供其他技术部门调用。

  • 哪些人,涉及到一个团队的组织架构图,以及对应的岗位说明书;
  • 产品,涉及到对公司产品架构的了解,产品及对应的模块文档;
  • 技术,涉及到对专业领域的深度,对不同语言实现功能的效果对比;

总结起来,就是这些信息在经过一个流程的时候,需要过哪些人的审批、执行、落地、跟踪,之后由谁来负责将意向转换为业务语言进行需求对接,最后的结果怎么样。

03. 建立意见反馈机制,当信息识别分类异常、错误时,应收集相关信息及时调整规则

在实际应用的时候往往就能暴露出一些理论知识的短板,算法、模型再精确,它是围绕着数字之间的关系计算出来的概率结果,就意味着准确率永远达不到百分之百。

呈现几种现象:

  • 用户意向的描述不一致,真实需求是A,通过算法表达出来的是B;
  • 基准错误,用户只是随便逛一逛,但是被识别为意向;
  • 推荐错误,用户的需求是A,经过推荐规则之后得出来的结果是彼此互斥、不相关的产品;
  • 业务话术问题,引导式的问答方式、话术内容设计、对意向的理解都会造成一系列的问题;
  • 产品问题,在设计产品的时候,没有充分考虑到不同类型用户的使用习惯,体验感差;
  • 流程问题,信息流转过程中容易出现的一些重复操作、信息冗余,造成整体耗时较长;
  • ……

我们可以把这样的问题归纳为:数据分析算法问题、产品问题、流程问题,就需要进行深入的专项分析,最终进行定位解决。

04. 搭建数据信息匹配模型,筛选出可以进行优先级排序的指标项,分配权重系数

当业务经过一段时间的沉淀,很多人为敲定的规则能够通过机器的方式进行判断,这时候就能够去沉淀业务规则,从经验决策转变为数据决策。

信息的匹配模型,可以划分为三个阶段:输入层、处理层、输出层,在处理层就会关联到原有的产品逻辑和流程规则。这个过程和神经网络算法实际上有点儿类似,得有人告诉我这项业务的判断依据,也就是做决策时需要观测的数据指标项,分别由哪些类目构成,然后在有多重因素的情况下人为判断是怎么做的选择,决策之后的结果交付的下游方是谁。

权重系数,是对多重因素的一个优先级排序,譬如我要给用户推荐一款商品,我会优先考虑他的性别、年龄层以及对应的收入,这就定下了一个基调,他能够接受的品牌和价格范围;然后再考虑他的一些日常习惯,在可选的产品里面哪一款更贴近于他的喜好;再之后便是他的偏好,颜色、质量、运输时效等等。

05. 形成数据闭环,数据应用的结果需要进行跟进,反哺规则、算法、模型上的迭代

在实际的业务过程里面永远不存在一次性分析,毕竟市场在变、环境在变、生活方式在变、人的行为习惯喜好也都在变化的过程里面,用户和产品都在成长,所以这时候可以引入一个叫做生命周期的词语来进行区别。

  • 对于产品而言,它有产品全生命周期,包括线索、商机、需求、需求开发、产品实现、市场推广、市场占有饱和、用户衰减、产品迭代、用户维护等等一系列的过程;
  • 对于用户而言,它的生命周期实际上是成timeline形式,接触平台、成为新手玩家、了解规则成为朋友、恋爱期的粘性用户、蜜月期的忠诚、逐渐冷淡之后的消沉、分手之后的死亡;
  • 对于商品而言,在设计师的各种脑暴和灵魂创造之后,可以概括为设计、生产、上市、热卖、退市、处理几个阶段;

对于数据分析而言,实际上我们需要了解不同视角下每一个阶段的衍变过程,这样才能进行针对性的数据探索,毕竟每一个阶段下的数据类目和关注的侧重点都会不一样。

End.

作者:Qarcher 来源:知乎

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据分析1480 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 01. 先对意向信息的有效性、质量、真实性进行识别和明确
  • 02. 再设计信息的分发流程,需要经过哪些部门,谁来用,怎么用这些过程
  • 03. 建立意见反馈机制,当信息识别分类异常、错误时,应收集相关信息及时调整规则
  • 04. 搭建数据信息匹配模型,筛选出可以进行优先级排序的指标项,分配权重系数
  • 05. 形成数据闭环,数据应用的结果需要进行跟进,反哺规则、算法、模型上的迭代
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档