大数据行业研究报告-大数据行业的创新方向和投资重点

Tmfox Venture Partner

一、 洞察

大数据以“降低信息不对称和提高决策有效性”为目标,可广泛作用于几乎所有行业,必然将掀起一场新的革命。目前,大数据已经迎来高速发展的黄金成长期,我们看好其发展趋势,推荐投资者提高对其中蕴含机会的关注度。 从源到流看,大数据涵盖数据入口、数据融合处理、数据应用三个过程;按照物理分层,大数据又可以分为硬件、基础软件、应用软件和信息服务四个维度。每一个细分领域都正在不断演进,存在不少问题也孕育着巨大的机会,万千创业者不断地寻找着新的突破口。 目前制约大数据更好更快发展的主要问题有以下几点:一是数据的归属权不清晰,各家数据资产型企业私密占有平台数据,制约着大数据的融合及发展;二是数据有效性将直接影响到大数据的应用水平,从数据源到分析样本的采集过程需要大量人工干预;三是配套软硬件成熟度不够,适宜处理海量数据的数据库软件尚未成熟,私有云的普及程度也不高;四是数据尚未获得真正意义上的定价和产业化。 基于对大数据的研究,我们判断,未来3-5年大数据发展趋势为新数据入口不断更新并增强、数据融合程度提高、数据处理难度降低和应用水平深化。新的入口,推荐关注新型人机交互模式的可穿戴设备、准入门槛低且找到了硬需求的智能家居、基于食药品生产追溯的物联网等相关企业;新的模式,推荐关注针对新入口的底层统计公司、“以免费服务获授权数据”和“有偿返还数据给用户”三种可能的创新;数据融合方面,推荐关注征信创业和数据产业化;数据处理方面,推荐关注新型数据库软件的出现,私有云与行业云的普及化;商业智能部分,推荐关注对细分行业有深刻理解的大数据应用软件及SaaS云服务提供商。 综合标的数量、确定性、所需投入和价值等因素,重点推荐针对细分行业的大数据应用软件和SaaS云服务提供商,追踪关注新入口的出现,并发掘相应的底层统计公司(类似针对移动应用的友盟)。

二、大数据概览

2.1 源与流 大数据从源到流到汇聚应用,包含数据入口、数据融合处理、数据应用三个维度和过程。从前到后看,这三个维度分别对应于数据资产类领域、数据融合与处理相关领域、数据应用相关领域。

1) 数据资产领域 “数据正在成为一种(战略)资产”已经是行业的共识。不同的公司把握着各个数据入口,而把握数据资产的企业也必然成为大数据的首批和直接受益者。从公司业务模式上,数据资产公司可以区分为纯数据资产公司和兼数据资产公司;从数据类型上,数据可以区分为交易数据(含询价等)和交互数据。 典型的纯数据资产公司有友盟和个信互动等,两者都具有占据基础性控制节点、后端整合了整类兼数据资产公司等特征,分别针对移动应用统计分析(已为超过18万应用开发者服务)和移动应用的信息推送(已接入超过6.8亿用户)。而兼数据资产公司数量更多,按交易数据与交互数据分类:交易数据类包含万得(金融)、阿里巴巴(电商)、美团(O2O)、拉卡拉(第三方支付)、顺丰(物流)、中国移动和沃尔玛(其他)等;交互数据类包含新浪微博(SNS)、远望谷(物联网)、百度(搜索引擎)、盛大游戏和优酷视屏(其他)等。 2) 数据融合与处理相关领域

在数据融合与处理相关的领域,主要解决包含两个方面的问题:一是数据标准化与有效性整理;二是面向过程(具体目的)的数据处理与粗提取。类似的较成熟机构包括彭博、万得、同花顺等,但目前局限于金融行业,可以预见在未来可能形成不同细分领域下的数据融合处理公司。另外,在大数据的融合与处理相关领域,两个绕不开的点为基础软件(数据库软件)和云计算,我们将在后文中讨论。

3) 数据应用相关领域 如上文所述,掌握数据资产的企业群是大数据的首批和直接受益者,因为他们会自然、方便的对大数据进行把玩、加工、消化、利用。而随着应用价值的逐步体现及大数据产业的发展,应用将必然扩张到生产生活的方方面面,广泛影响各行各业。大数据的应用将使得金融保险、信息技术、公共管理、贸易物流等领域获得极大的价值提升。 2.2 大数据产业结构 我们按照从硬件-基础软件-应用软件-信息服务和数据生成-存储-处理-应用两条线各4个维度来划分大数据的产业结构,涉及11大类主要的产品和服务:采集设备、存储设备、服务器、数据库软件、采集监测软件、智能搜索与分析软件、系统集成、IT基础设施服务、咨询实施服务、信息安全以及云计算。

其中基础软件(数据库软件和分布式文件系统)、应用软件是大数据产业价值转化变现的最关键部分,云计算对大数据的广泛应用有着举足轻重的意义,其他7种在某种意义上则是在原有基础上持续更新并与大数据发展配套的过程。在软硬件和信息服务领域的垂直划分中,我们认为商业智能带动的应用软件、云计算和信息安全是国内大数据发展的三家马车,也是更可能有所作为的地方。

三、行业存在的问题与发展趋势

3.1 行业存在的主要问题 1) 数据的归属权不清晰,各家数据资产型企业私密占有平台数据,制约着大数据的融合及发展。 一般认为,原始数据沉淀在平台上,平台实际占有并可以使用,但在未获授权的情况下不能提供给第三方,用户对原始数据的占有获取权及公开程度基本取决于用户与平台达成的协议(多为安装平台软件前的“用户须知”部分,用户除用脚投票外并无实际协议制定权)与接口提供,而平台对原始数据经过统计提炼获得的其他信息属于平台企业。参考国外立法,数据是属于个人的,平台企业可以解除、使用数据不代表个人放弃对数据的所有权。从国际国内立法趋势上看,信息主体的权利正在强化。 2) 数据有效性将直接影响到大数据的应用水平。  数据的质量 良好的数据质量是挖掘价值的基本保障。我们认为,数据质量主要涵盖两个大方面:一是基本质量,包含准确性、一致性、容量和更新率4个要点;二是可应用性,包含易识别性、易处理性、获取及时性、远程访问性和智能性5个要点。  洗数据的难度 洗数据就是把大量包含无效数据、分布杂乱无章的原始数据进行归并聚合,通过建立数据标准并执行来取得我们需要的分析样本的过程。如果希望提高数据可应用的程度,那么必然需要花大量人力通过编写程序和手动挑选来淘洗数据。而随着投入的边际效用递减,数据有效性的要求越高,则需要投入的成本就成倍甚至指数级增长。 3) 适宜海量数据处理的软硬件成熟度不够,成本太高,普及率低下。  市场上缺乏兼具业务场景普适性和海量数据处理能力的数据库软件  私有云和云服务普及程度太低 4) 数据尚未获得真正意义上的定价和产业化。 数据的公开性与归属权不清晰直接导致了数据融合工作被割裂到一个个的独立的数据资产型平台内部。目前的大数据应用更多是针对公开数据和自有数据的价值挖掘,数据尚未获得真正意义上的定价和产品化。 3.2 行业发展趋势 需求所向、问题所在,就是行业演进的方向。我们认为,未来大数据演进方向主要包含数据源更新与更多、数据融合处理难度降低、数据应用程度加深(专业化与细分化)。 1) 数据源更新与增加  新入口 新的入口主要包括可穿戴设备、智能家居与物联网三方面。可穿戴设备的发展重点在能否开创新人机交互模式或者找到与智能手机的完美融合(非替代性增强),推荐关注模式识别与人机交互核心技术企业;家居的智能化融合能创造一个全新的交互中心,其发展重点在于一能否跨家电品牌整合、二较低的介入成本、三是硬需求式的切入点;物联网的突破点应该在安全生产、(食药品)质量控制、物流运输及车联网等。  新的模式 新的模式可能包括以下三种:新“友盟”模式,针对新入口具体需求的底层统计服务提供商;“免费服务交换数据”,即可能出现以免费服务交换个人数据(双方以契约互相授权)的公司,使数据获得真正意义上的定价而成为资产;“数据有偿返还用户”,即原有数据资产类平台企业可能将引入第三方公证机构(公信力)和保险公司(兜底责任),有偿地反向出售其掌握的信息给用户自己。 2) 数据融合处理难度降低

 征信业与数据产业化 大征信和数据产业化将深度发展,首先是目前未纳入人行征信体系的其他金融行为数据整合成第二征信数据池,后期还会逐步扩展到零售、物流等行业,形成产业化的行业数据库。  数据库软件 目前,各种新型数据库软件各有千秋,不能普适不同的应用需求,相信普遍适用于海量数据处理的新型数据库将逐渐浮出水面。  云计算 私有云和行业云的普及势在必行,推荐关注降低成本的云硬件制造商;针对具体行业需求面向小微企业以数据分析处理为导向的SaaS云服务商将兴起。 3) 数据应用深化 商业智能将按照各行业信息化程度高低及信息与人贴近程度高低次序依次铺开,首先受益的是零售、物流、金融、电信、政府几个板块。同时,在BI应用先行行业(特别是零售和物流),每个细分领域都将出现专门的领先型行业解决方案提供商,然后通过扩张兼并,每个大行业将再创造几家上市公司。

四、展望

随着环境的日渐成熟,大数据已经迎来了高速发展的黄金期。在可以预见的将来,数据将实现继续快速增长;关于数据的监管将更加明确,推动数据的合理、合法流动;数据应用水平将深度的改变我们的生产生活模式。 计算能力、存储能力及通信速度的提高,将继续降低数据产生成本;以可穿戴设备、智能家居、物联网为代表的新兴技术和产品将进一步增加人们创造数据的源头;全球数据量将继续保持高速增长。 关于数据的立法和监管方面,信息主体的权利将逐步强化,信息控制主体的责任更加明晰,将推动数据打破控制主体自然垄断的边界,在合理合法范围内高速流动。各行业的数据资产类平台将共同制定数据采集基本标准,降低数据整合的难度。 基础数据库软件的发展、云计算的普及使得数据应用需求逐步得到满足,数据应用将从互联网、零售、物流、金融、政府、贸易、媒体与广告等行业开始逐步深化、扩张。信息不对称问题得到极大降低,生产效率得到大幅提升,生活模式发生更多有趣的改变。 这是一个快速变化的大时代!

新朋友,点击标题下方文字 PPV课大数据 关注我哦,更多精彩内容,大数据资讯、行业案例、互联网话题、热门大数据读书......

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2014-11-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

【德勤重磅报告】2016:认知技术成为80%世界百强企业标配(下载)

24011
来自专栏云计算D1net

云计算有能力将未来世界提前带到今天

在行业转型的过程中,信息爆炸是必然产生的结果。大数据的到来就像一把“双刃剑”,一方面,大数据的存储和处理给现有IT能力提出了前所未有的挑战;另一方面,大数据相关...

3084
来自专栏人称T客

数据合作是SaaS的未来还是一个噱头?

1814
来自专栏BestSDK

2017谁拥有可视化数据挖掘,谁就将拥有无限用户

2017年中国互联网已经进入了互联网下半场,很多业内人士都称互联网的分水岭来临,而在互联网下半场,APP已经再无野蛮生长,人口红利到头,网民增速连续下降到个位数...

3726
来自专栏云计算D1net

给云计算泼冷水之时,不得不承认它确实做了这些事..

云计算自“诞生”以来,业内不乏有唱衰的声音。技术的发展使得云计算早已脱胎换骨,从模糊的概念演进为切实的应用产品以及服务,云计算作为一种技术架构包含了虚拟化、自动...

3247
来自专栏灯塔大数据

快快get!企业大数据战略指南,简直不能再详细

【导读】 我们正在迎来一个数据爆炸的时代:各类设备和互动产生的数据量正以年均大于50%的速度增长,预计在2020年可能会达到44ZB(44万亿GB)。全球企业...

3404
来自专栏罗超频道

搜狗智能导航实现与汽车全程对话,车内语音交互要火

在近日于上海举办的2016年亚洲消费电子展(CES Asia 2016)上,无人驾驶、智能汽车等相关技术成为最大热点。在CES Asia上,搜狗地图发布了“搜狗...

5097
来自专栏腾讯游戏云的专栏

技术干货大汇总:腾讯云GAME-TECH沙龙长沙首秀完美收官

7月19日,腾讯云在湖南长沙为中南地区游戏行业技术同仁带来了长沙首场GAME-TECH游戏开发者技术沙龙,深耕于游戏行业云服务领域的专家们跟大家一起交流游戏开发...

1953
来自专栏架构师小秘圈

面向未来:进入一线互联网,你需要掌握的8大技术领域?

1,人工智能与机器学习 现在很多巨头都在布局AI领域。Google就不必说了,它在人工智能领域的尝试非常广泛,除了阿法狗,还有自动驾驶、语音助理、智能家居等。F...

3364
来自专栏云计算D1net

IaaS:国外厂商涌入 中国厂商“反攻”海外

你对中国IaaS市场有何印象? 市场热闹,但竞争并不激烈,每个服务商都能找到自己发挥的空间。 不断有国外服务商涌入这一市场,国内也有数据中心服务提供商、电信运营...

4074

扫码关注云+社区

领取腾讯云代金券