前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于 Data Engineer 的第一手解读

关于 Data Engineer 的第一手解读

作者头像
包子面试培训
发布2018-04-19 11:55:33
8550
发布2018-04-19 11:55:33
举报
文章被收录于专栏:包子铺里聊IT包子铺里聊IT

最近几年,Data Engineer 作为一个新职位在互联网公司招聘中反复出现,很多朋友申请拿到面试后也一头雾水,不知道如何准备。究竟 Data Engineer 和 Software Engineer / Business Analyst 是不是一回事儿?小编最近恰好有一次和某 Data Engineer 组的 Team Lead 聊到这个话题,第一手资料分享给大家。

背景介绍

互联网的一个产品定律是,成功的产品必须能迅速点燃用户增长。当年的 Facebook, 现在的 UAP, 都曾带着炫酷的光环风靡主流用户群。

在疯狂的增长期,公司的重心永远是”保持增长,不出乱子“。技术部门的核心任务也相对简单,保证产品的技术架构能撑住新用户的增长速度,同时开发新功能保持用户粘性。

当产品的蜜月期过后,用户增长的瓶颈迟早到来。于是,创始人和各种 VP 就得坐下来,重新思考:怎样提高用户的增长速度?怎样提高用户粘度?如何提高产品变现能力?等等等。

数据难题

对于高层面上的产品问题,硅谷不推崇拍脑袋决策。事实上,大部分公司倾向于用数据来解释发生的现象,并通过 A/B Test 的方式不断通过尝试新的实验,帮助产品决策。

说起来简单,但搭建一条完备的 data pipeline 并非易事,上下游的 stakeholder 各种各样,真的很难让所有人满意。

简单说列举几个核心角色。

Business Analyst

BA 非常重要,他们非常熟悉公司的各条产品线和业务线,能够通过组合、比较数据来回答 CXO 们的问题。

由于 BA 专注于业务和产品层面,因此他们需要高度格式化、提纯过的数据集,这样就可以使用 BI 相关的工具去做深入分析、比较,最终拿出代表结论的图表。

Software Engineer

SDE 自然是需要写代码咯。他们把收集业务数据的逻辑嵌入产品中,然后通过各种各样的大数据解决方案,把原始数据做一定程度的加工、整理,供其他 stakeholder 使用。

Data Engineer

BA 和 SDE 知识背景的不对称,如果 BA 提出的需求在 SDE 实现的时候变了样子,那么结果一定糟糕:要么大家发现数据不对,要么大家用错误的数据得出错误的结论。

所以 Data Engineer 就出现了,作为 BA 和 SDE 之间的桥梁:一方面他们负责建立合理、有效的数据模型,帮助 SDE 采集原始数据的准确性和统一格式化;另一方面他们了解每一个表、每一列数据的来龙去脉,因此 BA 关于数据的问题往往可以在 Data Engineer 这得到满意的答复。

招聘要求

Data Model

理解数据模型是 Data Engineer 的重中之重。虽然大部分情况下 SDE 负责维护和数据相关的 pipeline, 但 pipeline 中使用的数据模型,一般是由 data engineer 负责维护的。

数据模型可以包括:数据表名,列名,各个分析纬度,触发条件等等。只有透彻理解数据模型,他们才能掌握生成数据的来龙去脉,从而帮助 BA 正确的分析数据。

Business Acumen

一个好的 Data Engineer 一定有非常敏锐的业务、产品直觉。当 BA 提出关于数据需求的时候,他们可以进一步分析出 BA 真正的意图是什么,如何通过构建合理的数据模型来解决 BA 提出的需求。

举个例子,当 BA 希望得到一个 app 在 wifi 环境下某个功能的数据时,Data Engineer 可以进一步在数据模型中把网络环境抽象成分析维度,这样 BA 不仅可以看到 wifi 的数据,还可以看 4G / LTE 下的数据。

Reporting && Dashboard.

Data Engineer 的终极目标是 make data accessible. 不管是 BA 需要的结构化数据,还是 CXO 喜欢的报表,又或是 SDE 喜欢的 dashboard, Data Engineer 都需要满足他们。

对于 Reporting 或者 Dashboard,他们往往在 SDE 负责的 data pipeline 上跑一些 reporting jobs, 或者搭一个 dashboard portal (比如 looker),因此最好有一定的技术基础,这种小任务可以手到擒来。

尾声

不管是大公司还是小公司,对海量数据的理解和分析使用都是产品发展的重要推力。因此 Data Engineer 的市场缺口依然很大,招聘到一个优秀的 Data Engineer 往往比 Software Engineer 更加困难。所以我们继续看好 Data Engineer 作为一个职业发展的方向。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-12-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 包子铺里聊IT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 背景介绍
  • 数据难题
    • Business Analyst
      • Software Engineer
        • Data Engineer
        • 招聘要求
          • Data Model
            • Business Acumen
              • Reporting && Dashboard.
              • 尾声
              相关产品与服务
              大数据
              全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档