数据团队规划布局感悟(一)

前言

记得今年一月份在杭州和W君漫步钱塘江赏霾,畅谈了两个小时,除了聊了研发的两观,全局观和产品观, 也聊了数据部的组织架构。一个良好架构布局确实会让人受益良多。

架构布局

目前我司数据部分成了大体五条线:

  1. 数据研发团队
    • 研发/执行
    • 解决方案设计
  2. 分析师团队
  3. 搜索/推荐团队
  4. 知识库团队(‘人工’智能)
  5. 平台运维

数据研发团队

数据研发分成了两个小团队,执行和设计。本来这里应该是把设计叫做算法团队的,但其实叫做算法团队并不太合适。我们把设计定位在能够提供一整套解决方案的那一组人里。

比如来问团队需要一套指数的东西, 设计团队会根据要求,设计建模出一套解决方案,并且先进行Demo验证,这其中可能需要用到很多算法,统计类的知识。交付之后也没啥问题了,就会交给研发进行执行,从而完成工程化。为了方便理解,我们把设计称之为问题建模也是可以的。事实上,我发现效果还是不错的。设计团队正在努力朝深度学习发展,在加强Spark Mllib上的投入同时,也花了更多时间关注TensorFlow平台。

研发执行里面,我们也是有细分,虽然人少,角色会有重叠:

  1. 分析师辅助
  2. 工程化团队
  3. 突击团队

数据部其实常常面临较多的商务需求,通常我们会让突击团队以最快速度交付第一版,之后再让工程化团队完整的工程化,比如全部转化为我们Spark程序,提供标准的API等,设置定时等等。

突击团队和工程化团队其实还有一个职责,就是团队效率工具的开发。这个基本是以研发负责人为主导,定期根据现状,找到效率瓶颈点,然后抽象出工具,最后排期进行开发。

分析师辅助团队则承担了两个职责,一个是对接纯粹的技术需求。比如ETL之类的。第二个是为分析师做实施执行工作。

虽然研发团队在努力,但是其实不太容易有很明显直观的成果。而且存在感并不强。在解决方案设计团队获得影响力之前,我们还需要一个重要的团队: 分析师团队 去扩大数据部门在公司的影响力。

分析师团队

我经历过两种分析师团队。一种是为研发和公司做support的,一种就是将现在的将分析师打散到各个业务线的方式,团队自身只保留高级分析师做全公司的support。

目前从研发的角度来看,反而是第二种更好。研发工程师和业务线天然有种隔膜,而且很多数据研发并不太喜欢业务。喜欢专研技术,和人打交道并不是他们擅长的,包括和业务团队的工程师打交道。 但是现在有了下放到业务线的分析师后,就变得很便利了。

比如解决方案设计团队了解了需求后,就不用到处去找数据,找人理解数据的含义,他们只要和我们自己的对应的分析师沟通就好,数据分析师直接提取出来数据,解决方案设计团队拿着这些数据就可以建模计算了,部分沟通也可以透过分析师来完成,而且分析师也可以给出较好的反馈,因为他们对业务也是相当了解的,尤其是从数据层面来说。

现在整件事情变得很有趣,以前是分析师依赖于研发,但是现在是研发高度依赖于分析师。基本上我们研发做的大部分事情都离不开分析师。我现在很愁的是,如何给分析师提供更好的support 以作为回馈。

各个业务线的分析师核心是要能够理解业务线里的数据,了解业务规则,问题,结构化业务数据,了解业务痛点,并且能够快速提取出业务/高级分析师/研发想要的数据。高级分析师则会对各个业务进行Review,给出数据方面的建议,为业务Leader提供决策指导。

这里我大致画了个图:

WX20170428-110852@2x.png

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏资深Tester

测试流程之需求评审

2034
来自专栏企鹅号快讯

2017年互联网中你不知道的小程序战略布局

如今,微信平台的发展逐渐趋于操作系统,其核心竞争力也愈加突出,微信在长期发展过程中,始终致力于通过自身平台的运营,满足用户在多元化场景下的各类需求,在发展社交功...

1808
来自专栏java工会

没有人喜欢,但却不得不选择的敏捷开发

敏捷开发是一种从1990年开始逐渐引起人们广泛关注的新型软件开发方式,它是具有应对快速变化的需求的软件开发能力。相对于非敏捷开发,它是一种以用户需求为核心,持续...

1002
来自专栏灯塔大数据

大数据的未来掌控于数据集成

? 作者:Ronald van Loon 作者简介:Ronald van Loon被Onanlytica,Data Science Central,Klout...

2892
来自专栏WeTest质量开放平台团队的专栏

WeTest&TesterHome移动测试沙龙【第6期 广州站】精彩分享

2017年3月25日,腾讯WeTest在广州腾讯微信总部举办了系列移动测试沙龙第6期。本次联合沙龙,是由腾讯WeTest发起,与优质社区TesterHome联...

1043
来自专栏企鹅号快讯

小型商户、机构企业,做不起APP,也没必要做一个APP

生活中互联网似乎已经无处不在,但似乎还有些地方没有触及。 比如很多微信公众号对于粉丝的服务在微信公众平台上没办法很好的实现,比如粉丝管理、内容管理、支付消息等等...

1887
来自专栏深度学习与数据挖掘实战

干货|(书单推荐) 数据科学家&数据挖掘工程师

以上图书,是我经常翻阅的图书,和大家分享。如果有条件的可以,阅读英文原版,更好!

1581
来自专栏SDNLAB

2017年云计算行业最受追捧的3个职位

我们经常能听到别人讨论云计算领域最好的工作是什么?哪些云计算领域的工作薪酬最高?以下是我们根据工作需求、薪资和工作稳定性筛选出来最好的三个职位。 ? ❆ 云计算...

2864
来自专栏java一日一条

人工智能和物联网发展推动云计算进入3.0时代

互联网+”加速了云计算的普及,目前约有 80% 的企业用户将其IT系统运行在云中。与此同时,人工智能和物联网的发展,带动了海量终端以及海量数据交互分析的需求,进...

1523
来自专栏CDA数据分析师

专栏 | 初级、中级、高级数据分析师在团队中分别扮演什么角色?

我今天分享的主题是一个数据分析师如何被滋养,思考我们如何从外界获得成长的资源,以及如何去培养自身成长的能力。 就我的经验而言,数据分析师还是分为四个阶段:助理数...

2536

扫码关注云+社区

领取腾讯云代金券