专栏首页CDA数据分析师大麦网周宇红:用大数据打破票务行业的天花板

大麦网周宇红:用大数据打破票务行业的天花板

“每天一个数据”分析师新一期内容奉上,请享用~

采访 | Penny

整理 | Sophie

转载请注明来自CDA数据分析师 否则小编将举报到底!

人物档案

周宇红,大麦网大数据技术负责人,专注于娱乐行业大数据应用,负责大数据平台建设,机器学习,自然语言处理,社交媒体挖掘等。

DA:能请您先介绍一下自己的基本情况吗?

周宇红:我其实是从2013年底开始转战互联网的,之前主要在传统的IT行业。到大麦网以后,一开始就接触到大数据。到了2015年初,公司专门设立大数据部门,专门进行大数据的应用分析,我负责整合大数据技术方面的东西。

其实,公司对数据认识的重要程度、对大数据应用有没有想法,对大数据应用的节奏、面还有深度,这些都受到公司本身在行业所处的地位的影响。有了一定的基础数据你才能玩一些大数据的技术处理,如果企业本身达不到这些要求,那么一般传统的一些数据处理技术就OK了。

目前,大麦网大数据属于初步启动建设的一年,2015年初专门设立大数据部门,预计到了2016年,公司的数据应用也会全面展开。我们会从大数据平台、整合以及应用来三方面来全方位地推动大数据的分析研究。它包括我们的网站推介、精准营销、运营分析、行业预测以及风险控制,基本上应该涵盖了大数据应用的这些方面,根据我们的业务或者数据本身来决定应用多深的问题。

DA:现在很多企业都在尝试做大数据,企业构建大数据部门时需要注意哪些问题呢?

周宇红首先,构建大数据部门时必须想清楚有没有应用大数据的着眼点。第二,构建大数据部门时,看看自己的数据体量是否需要设置专门的部门来分析,不要仅仅作为一种尝鲜,别人都玩大数据了,我也玩大数据。

DA:票务行业大数据应用处于什么阶段?行业内大数据应用侧重于哪些方面?

周宇红:起步阶段。大麦网本身也处于起步阶段,我们对内部行业数据的整合积累,以及对于用户行为整合,还有账外数据采集,都处于一个初步整合的阶段。

票务行业领域本身其实就是一个垂直电商而已,更多首先是电商的标配——网站推介,第二是精准营销,这也是基本的应用,接着是运营分析,主要是给内部人员来用的,还有风险控制,防刷票,防黄牛的应用。

对于我们公司来说,还有一个行业预测应用。它有两个作用,一个是在将来提供一个演出行业的数据年报,因为我们会有最大量的用户数据。一般能提供年报的企业本身都掌握大量的用户数据,要不就是行业老大,要不就是在互联网很厉害,像BAT一样,他们可以让其他垂直细分行业的老大为他提供数据,他来做一个聚合。

我们不仅仅想做一个渠道商,那么简单,票务只是一方面,将来可能做一个投资商,或者更可能是内容的生产商提供商,不是单一渠道来去做。因为票务本身做下去可能会遇到天花板,一年的演出可能就那么多,我们更多地要去开源,我们将来要做投资,做主办,是这样的一个情况。基于大数据的整理基础之上,开发自有的内容,或者去投资。

DA:您之前是在一个传统IT业工作的,现在又在互联网行业工作了,您觉得这两个行业最大的不同是什么?

周宇红:传统IT业的模式主要是做产品的模式,不是做项目的模式。最初从设计、开发、测试、上线、运维,基本都是一个team来去做的一件事情,所以我们的team本身来说不会像互联网行业能够把角色划分开,产品搞产品,技术是搞技术的,测试是搞测试的,运维是搞运维的,不能分的很清。

我们做产品是为了给别人用的,互联网行业做产品是给自己用的,这是两者最大的区别,这个最大的区别也导致我们运作方式很大的不同。互联网行业要求能够及时响应用户的变化,新的方法,就是图快,好多产品设计或技术开发为了快速上马会有很多技术欠债,后面的技术运维产品维护升级会给产品本身或技术挖坑,到后面越积越多就做不下来。

第二种,我感触最深的是,从数据本身来说,做产品是要把数据模型想得很清楚再做,但互联网行业不是,它主要是图快,不会想那么精细,后面在数据整合时发现数据质量特别乱,因为它压根不想那么多,先把项目上去再说。

而这样做的好处坏处要一分为二的看。从公司角度来看,很快做出一个东西,迎合市场的需求点,可以解决用户的痛点需求点,从用户来看OK,可以解决问题;但从内部角度来看,从产品角度来说,我把用户的痛点需求点解决了,就OK了,至于后面有什么问题,那是技术的事情,与我无关;但从技术角度来看,产品你给我这个需求,我就做这个需求,至于将来的需求有什么变化,我不关心,将来如果有与前面需求相悖,设计有冲突,再加上人员流动,窟窿会越来越大,补一个出来两个,等到实在看不下去就只有重构了。

DA:您觉得票务大数据应用最困难的地方是什么?有没有解决的经验和思路?

周宇红:这个困难是根据大数据应用的阶段而言的,当前应用最困难的地方就在于数据的整合。

第一是内部数据的整合,由于公司内部各部门之间使用的数据库系统不一,数据质量不高,完整度较低,在数据迁移时极易出现问题,想做增量迁移,但迁移不了,因为数据中缺乏时间维度的东西,这可能是设计过程中有问题。

第二事有好多乱数据,脏数据,需要花很大的人力物力来清理。但做清洗时还有一个问题,就是做清洗时要跟业务相关,但业务这种东西,开发不一定知道,数据某些字段的有些状态为什么不动,运营不一定知道,因为中间有人员的迁移,有可能是历史的原因,新来的也说不清楚,就会很麻烦。这是数据整合的问题。

其次是数据存储的问题,你要投入大量硬件设备,搞一个大数据这样的环境,从公司角度来说投入比较大。我们现在存储更多向上游,在云上去做,主要看云本身的能力,大数据加工能力的问题。我们内部有自己的大数据平台,是基于开源的大数据平台来做的,我们可保证的。当你上了云以后,受限于云提供商在上面建设大数据的能力。

我们现在是与阿里在合作,我们需要阿里平台来支持我们在它上面的数据加工和处理,还有好多外站的一些数据,微博的数据,爬虫的数据,这些大量数据都会沉淀在我们的阿里云上。但这些数据都会存在不同的地方,像这些数据怎样整合在一起,这是我们现在要跟阿里一起讨论,要做的解决方案,怎么在阿里云品台有效的存储,处理以及后期的数据挖掘,要利用他们现有的产品来做这些技术方案。

本身阿里云大数据平台现在处于初步建设阶段,他们需要我们这样有明确使用目标使用场景的人来使用他们的大数据的工具,同时我们也需要他们能提供这个技术平台来加工我们的数据,如果把这些数据放在我们内部,那么我们硬件投入会很大,我们的运维人员投入也会增大,所以我们希望这部分的压力减轻,转嫁到云平台上,让他们帮我们做稳定性,运维还有将来的优化。

这是个需要促进双赢的过程,要与您所选择的云平台建设商合作。其实任何一个云平台,他们如果将来不想只买机器,也想把数据用起来,他们也会提高自己的产品对数据处理应用的能力。

本文分享自微信公众号 - CDA数据分析师(cdacdacda),作者:免费訂阅☛

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-12-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 分析了10个垂直行业后,告诉你大数据应用面临哪些挑战

    本文转自网络,如涉侵权请及时联系我们 大数据已经成为过去几年中大部分行业的游戏规则,行业领袖,学者和其他知名的利益相关者都同意这一点, 随着大数据继续渗透到我们...

    CDA数据分析师
  • 大数据营销的三大流派:刻舟求剑、叶公好龙和甩手掌柜

    【摘要】首先要强调一点,本文讨论的重点是大数据“应用”,尤其是针对企业营销的大数据应用,对于大数据技术本文会有少量涉及,但是对于大数据工程、大数据科学,这不是这...

    CDA数据分析师
  • 译文|大数据如何使企业受益?

    本文由CDA数据分析研究院翻译,转载必须获得本站、原作者、译者的同意,拒绝任何不表明译者及来源的转载! 一、对大数据的阐释 大数据有巨大的潜力可使任何行业的企业...

    CDA数据分析师
  • 深耕数据挖掘,实现互联互通,在银行风控管理中 ,我国大数据技术应用举足轻重 | 大咖周语录

    当前,大数据已成为科技、经济、社会等各领域的关注焦点。在我国,80%的数据掌握在政府手中,如何激活政府数据,通过数据资产运营进行数据价值激活,将成为支撑国家大数...

    数据猿
  • 中国大数据行业发展现状及趋势预测

    随着大数据技术的飞速发展,大数据已经融入到各行各业,不断提高各行各业的生产运作效率。2017年中国的大数据行业发展趋势是什么?大数据行业整体市场规模如何?大数据...

    挖掘大数据
  • 大数据营销的三大流派:刻舟求剑、叶公好龙和甩手掌柜

    【摘要】首先要强调一点,本文讨论的重点是大数据“应用”,尤其是针对企业营销的大数据应用,对于大数据技术本文会有少量涉及,但是对于大数据工程、大数据科学,这不是这...

    CDA数据分析师
  • 分析了10个垂直行业后,告诉你大数据应用面临哪些挑战

    本文转自网络,如涉侵权请及时联系我们 大数据已经成为过去几年中大部分行业的游戏规则,行业领袖,学者和其他知名的利益相关者都同意这一点, 随着大数据继续渗透到我们...

    CDA数据分析师
  • 都是脏数据惹的祸

    “还是数据问题!之前做的一个功能有一部分数据迁移工作没有做好,导致生产环境有脏数据,委托人的联系人已经不为该委托人服务了,应该移除掉的……”

    ThoughtWorks
  • 大数据到底如何在企业中发挥价值

    一、企业大数据如何起步:从小数据到大数据 目前国内外关于大数据的谈论很多,大多是谈运营级别的,或者说从服务端、服务方提得较多一些。笔者要跟大家交流的问题是作为各...

    用户1410343
  • 大数据应用:10大行业应用痛点及解决策略

    大数据已经成为这几年中大部分行业的追捧热点,随着大数据继续渗透到我们的日常生活中,围绕大数据的概念热点正在转向实际使用中的真正价值。

    挖掘大数据

扫码关注云+社区

领取腾讯云代金券