专栏首页PPV课数据科学社区大数据行业研究报告-大数据行业的创新方向和投资重点

大数据行业研究报告-大数据行业的创新方向和投资重点

Tmfox Venture Partner

一、 洞察

大数据以“降低信息不对称和提高决策有效性”为目标,可广泛作用于几乎所有行业,必然将掀起一场新的革命。目前,大数据已经迎来高速发展的黄金成长期,我们看好其发展趋势,推荐投资者提高对其中蕴含机会的关注度。 从源到流看,大数据涵盖数据入口、数据融合处理、数据应用三个过程;按照物理分层,大数据又可以分为硬件、基础软件、应用软件和信息服务四个维度。每一个细分领域都正在不断演进,存在不少问题也孕育着巨大的机会,万千创业者不断地寻找着新的突破口。 目前制约大数据更好更快发展的主要问题有以下几点:一是数据的归属权不清晰,各家数据资产型企业私密占有平台数据,制约着大数据的融合及发展;二是数据有效性将直接影响到大数据的应用水平,从数据源到分析样本的采集过程需要大量人工干预;三是配套软硬件成熟度不够,适宜处理海量数据的数据库软件尚未成熟,私有云的普及程度也不高;四是数据尚未获得真正意义上的定价和产业化。 基于对大数据的研究,我们判断,未来3-5年大数据发展趋势为新数据入口不断更新并增强、数据融合程度提高、数据处理难度降低和应用水平深化。新的入口,推荐关注新型人机交互模式的可穿戴设备、准入门槛低且找到了硬需求的智能家居、基于食药品生产追溯的物联网等相关企业;新的模式,推荐关注针对新入口的底层统计公司、“以免费服务获授权数据”和“有偿返还数据给用户”三种可能的创新;数据融合方面,推荐关注征信创业和数据产业化;数据处理方面,推荐关注新型数据库软件的出现,私有云与行业云的普及化;商业智能部分,推荐关注对细分行业有深刻理解的大数据应用软件及SaaS云服务提供商。 综合标的数量、确定性、所需投入和价值等因素,重点推荐针对细分行业的大数据应用软件和SaaS云服务提供商,追踪关注新入口的出现,并发掘相应的底层统计公司(类似针对移动应用的友盟)。

二、大数据概览

2.1 源与流 大数据从源到流到汇聚应用,包含数据入口、数据融合处理、数据应用三个维度和过程。从前到后看,这三个维度分别对应于数据资产类领域、数据融合与处理相关领域、数据应用相关领域。

1) 数据资产领域 “数据正在成为一种(战略)资产”已经是行业的共识。不同的公司把握着各个数据入口,而把握数据资产的企业也必然成为大数据的首批和直接受益者。从公司业务模式上,数据资产公司可以区分为纯数据资产公司和兼数据资产公司;从数据类型上,数据可以区分为交易数据(含询价等)和交互数据。 典型的纯数据资产公司有友盟和个信互动等,两者都具有占据基础性控制节点、后端整合了整类兼数据资产公司等特征,分别针对移动应用统计分析(已为超过18万应用开发者服务)和移动应用的信息推送(已接入超过6.8亿用户)。而兼数据资产公司数量更多,按交易数据与交互数据分类:交易数据类包含万得(金融)、阿里巴巴(电商)、美团(O2O)、拉卡拉(第三方支付)、顺丰(物流)、中国移动和沃尔玛(其他)等;交互数据类包含新浪微博(SNS)、远望谷(物联网)、百度(搜索引擎)、盛大游戏和优酷视屏(其他)等。 2) 数据融合与处理相关领域

在数据融合与处理相关的领域,主要解决包含两个方面的问题:一是数据标准化与有效性整理;二是面向过程(具体目的)的数据处理与粗提取。类似的较成熟机构包括彭博、万得、同花顺等,但目前局限于金融行业,可以预见在未来可能形成不同细分领域下的数据融合处理公司。另外,在大数据的融合与处理相关领域,两个绕不开的点为基础软件(数据库软件)和云计算,我们将在后文中讨论。

3) 数据应用相关领域 如上文所述,掌握数据资产的企业群是大数据的首批和直接受益者,因为他们会自然、方便的对大数据进行把玩、加工、消化、利用。而随着应用价值的逐步体现及大数据产业的发展,应用将必然扩张到生产生活的方方面面,广泛影响各行各业。大数据的应用将使得金融保险、信息技术、公共管理、贸易物流等领域获得极大的价值提升。 2.2 大数据产业结构 我们按照从硬件-基础软件-应用软件-信息服务和数据生成-存储-处理-应用两条线各4个维度来划分大数据的产业结构,涉及11大类主要的产品和服务:采集设备、存储设备、服务器、数据库软件、采集监测软件、智能搜索与分析软件、系统集成、IT基础设施服务、咨询实施服务、信息安全以及云计算。

其中基础软件(数据库软件和分布式文件系统)、应用软件是大数据产业价值转化变现的最关键部分,云计算对大数据的广泛应用有着举足轻重的意义,其他7种在某种意义上则是在原有基础上持续更新并与大数据发展配套的过程。在软硬件和信息服务领域的垂直划分中,我们认为商业智能带动的应用软件、云计算和信息安全是国内大数据发展的三家马车,也是更可能有所作为的地方。

三、行业存在的问题与发展趋势

3.1 行业存在的主要问题 1) 数据的归属权不清晰,各家数据资产型企业私密占有平台数据,制约着大数据的融合及发展。 一般认为,原始数据沉淀在平台上,平台实际占有并可以使用,但在未获授权的情况下不能提供给第三方,用户对原始数据的占有获取权及公开程度基本取决于用户与平台达成的协议(多为安装平台软件前的“用户须知”部分,用户除用脚投票外并无实际协议制定权)与接口提供,而平台对原始数据经过统计提炼获得的其他信息属于平台企业。参考国外立法,数据是属于个人的,平台企业可以解除、使用数据不代表个人放弃对数据的所有权。从国际国内立法趋势上看,信息主体的权利正在强化。 2) 数据有效性将直接影响到大数据的应用水平。  数据的质量 良好的数据质量是挖掘价值的基本保障。我们认为,数据质量主要涵盖两个大方面:一是基本质量,包含准确性、一致性、容量和更新率4个要点;二是可应用性,包含易识别性、易处理性、获取及时性、远程访问性和智能性5个要点。  洗数据的难度 洗数据就是把大量包含无效数据、分布杂乱无章的原始数据进行归并聚合,通过建立数据标准并执行来取得我们需要的分析样本的过程。如果希望提高数据可应用的程度,那么必然需要花大量人力通过编写程序和手动挑选来淘洗数据。而随着投入的边际效用递减,数据有效性的要求越高,则需要投入的成本就成倍甚至指数级增长。 3) 适宜海量数据处理的软硬件成熟度不够,成本太高,普及率低下。  市场上缺乏兼具业务场景普适性和海量数据处理能力的数据库软件  私有云和云服务普及程度太低 4) 数据尚未获得真正意义上的定价和产业化。 数据的公开性与归属权不清晰直接导致了数据融合工作被割裂到一个个的独立的数据资产型平台内部。目前的大数据应用更多是针对公开数据和自有数据的价值挖掘,数据尚未获得真正意义上的定价和产品化。 3.2 行业发展趋势 需求所向、问题所在,就是行业演进的方向。我们认为,未来大数据演进方向主要包含数据源更新与更多、数据融合处理难度降低、数据应用程度加深(专业化与细分化)。 1) 数据源更新与增加  新入口 新的入口主要包括可穿戴设备、智能家居与物联网三方面。可穿戴设备的发展重点在能否开创新人机交互模式或者找到与智能手机的完美融合(非替代性增强),推荐关注模式识别与人机交互核心技术企业;家居的智能化融合能创造一个全新的交互中心,其发展重点在于一能否跨家电品牌整合、二较低的介入成本、三是硬需求式的切入点;物联网的突破点应该在安全生产、(食药品)质量控制、物流运输及车联网等。  新的模式 新的模式可能包括以下三种:新“友盟”模式,针对新入口具体需求的底层统计服务提供商;“免费服务交换数据”,即可能出现以免费服务交换个人数据(双方以契约互相授权)的公司,使数据获得真正意义上的定价而成为资产;“数据有偿返还用户”,即原有数据资产类平台企业可能将引入第三方公证机构(公信力)和保险公司(兜底责任),有偿地反向出售其掌握的信息给用户自己。 2) 数据融合处理难度降低

 征信业与数据产业化 大征信和数据产业化将深度发展,首先是目前未纳入人行征信体系的其他金融行为数据整合成第二征信数据池,后期还会逐步扩展到零售、物流等行业,形成产业化的行业数据库。  数据库软件 目前,各种新型数据库软件各有千秋,不能普适不同的应用需求,相信普遍适用于海量数据处理的新型数据库将逐渐浮出水面。  云计算 私有云和行业云的普及势在必行,推荐关注降低成本的云硬件制造商;针对具体行业需求面向小微企业以数据分析处理为导向的SaaS云服务商将兴起。 3) 数据应用深化 商业智能将按照各行业信息化程度高低及信息与人贴近程度高低次序依次铺开,首先受益的是零售、物流、金融、电信、政府几个板块。同时,在BI应用先行行业(特别是零售和物流),每个细分领域都将出现专门的领先型行业解决方案提供商,然后通过扩张兼并,每个大行业将再创造几家上市公司。

四、展望

随着环境的日渐成熟,大数据已经迎来了高速发展的黄金期。在可以预见的将来,数据将实现继续快速增长;关于数据的监管将更加明确,推动数据的合理、合法流动;数据应用水平将深度的改变我们的生产生活模式。 计算能力、存储能力及通信速度的提高,将继续降低数据产生成本;以可穿戴设备、智能家居、物联网为代表的新兴技术和产品将进一步增加人们创造数据的源头;全球数据量将继续保持高速增长。 关于数据的立法和监管方面,信息主体的权利将逐步强化,信息控制主体的责任更加明晰,将推动数据打破控制主体自然垄断的边界,在合理合法范围内高速流动。各行业的数据资产类平台将共同制定数据采集基本标准,降低数据整合的难度。 基础数据库软件的发展、云计算的普及使得数据应用需求逐步得到满足,数据应用将从互联网、零售、物流、金融、政府、贸易、媒体与广告等行业开始逐步深化、扩张。信息不对称问题得到极大降低,生产效率得到大幅提升,生活模式发生更多有趣的改变。 这是一个快速变化的大时代!

新朋友,点击标题下方文字 PPV课大数据 关注我哦,更多精彩内容,大数据资讯、行业案例、互联网话题、热门大数据读书......

本文分享自微信公众号 - PPV课数据科学社区(ppvke123)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-11-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据,小数据,哪道才是你的菜?

    源自|CSDN 作者|张玉宏 美国著名科技历史学家梅尔文•克兰兹伯格(Melvin Kranzberg),曾提出过大名鼎鼎的科技六定律,其中第三条定律是这样的[...

    小莹莹
  • 大数据真正的财富蕴含在产业链条而非消费链条

    摘要: 大数据真正的财富蕴含在产业链条而非消费链条之中,因此,大数据与产业融合将成为落地的根本。目前随着基础设施布局的逐渐完善,大数据的发展已经走到一个新的临界...

    小莹莹
  • 关于《决战大数据》读这50条就够了

    老师在其决战大数据一书中,强调的更多的是一种数据思考方式,书中范例介绍的小偷思维、先开枪后瞄准、CEO关注的三个问题等,都属于数据思考方式重构解决问题的过程。 ...

    小莹莹
  • 是时候更新数据治理的架构了

    随着公司越来越多的利用数据为企业提供支撑,推动创新。了解数据的准确性,可靠性就非常重要。数十年来,对于数据治理的工作一直依靠数据目录来完成,但是这就足够了吗?

    实时计算
  • 从执行到专家,不同阶层数据分析师都在做什么呢

    1数据跟踪员:机械拷贝看到的数据,很少处理数据 虽然这个工作的人还不能称作数据分析师,但是往往作这样工作的人还都自称是数据分析师,这样的人,只能通过×××系统...

    机器学习AI算法工程
  • 大数据的关键思考 -- 数据化营运三诀窍

    当谈到阿里巴巴的数据化营运时,我第一个想到的就是「人」,我们花太多时间讨论我们应该要做什么,却很少会反过来想,如果要落实数据化营运首先要从人做起,因此...

    机器学习AI算法工程
  • 大数据社会的十三大具体应用场景

      美国NASA如何能提前预知各种天文奇观?风力发电机和创业者开店如何选址?如何才能准确预测并对气象灾害进行预警?包括在未来的城镇化建设过程中,如何打造智能城...

    腾讯研究院
  • 安全的陷阱:警惕大数据壁垒化危害

      随着人们对大数据价值理解的深入,更多的公司将自身领域拓展至大数据层面。然而与高速发展相对应的是,数据管理行业急需的一系列数据使用标准及数据守则并没有被建立...

    腾讯研究院
  • 漫谈数字经济和个人发展

    报告以"迈入数字时代"为始,开启了演讲。[1]追溯数字时代的发展历程可从上世纪四十年代计算机的发明开始,直至今日的大数据时代的到来。期间数字技术从未停止发展的步...

    ChinaManor
  • 与我们息息相关的大数据会不会是一条黄金赛道?

    大数据,听着很高端但似乎离我们又有些遥远,但其实大数据早就和我们的生活息息相关了。并且从国家所出台的政策来看,大数据俨然已经成为未来发展的主力军,所以不要让大数...

    成都加米谷大数据

扫码关注云+社区

领取腾讯云代金券