2015全局数据白皮书:我们需要什么样更“好”的数据?

大数据魔镜较大的数据可视化分析平台

中国较大较流行的大数据可视化分析挖掘平台,已服务一万五千家企业客户,其中包括中移动、中石油、政府等大客户。“大数据魔镜”致力于帮助企业处理海量数据价值,让人人都能数据分析。

人类交流、连接方式的改变,直接导致了数据体量的爆炸性增长,人类迎来“大数据时代”,开启了用数据探索世界规律的新纪元。然而在万物互联、数据爆炸的态势下,原有的“大数据”概念及应用并不能完全满足人类利用数据完成产业升级,驱动社会生产力变革的需要。如果我们需要让“数据”发挥出更大的现实价值,就必须对“大数据”进行升级,完成“大数据”自我进化,“全局数据”概念因此而生。

2015年11月9日,全局数据智能洞察服务商-思贤股份联合专业跨媒体研究服务机构TopDigital、上海交通大学OMNI LAB实验室、华东理工大学公共管理学系发布“2015全局数据白皮书”,提出OMNI DATA全局数据的全新概念。从全局数据产生的背景切入,深度剖析了我们为何需要OMNI DATA(全局数据),它呈现出哪些特点,拥有哪些能力,又存在怎样的界限,可以解决怎样的现实问题等要点。该研究旨在帮助数据产业的相关从业者,从更高的层面对数据进行洞见,更全局的把握数据时代的变革。

以下为研究内容综述:

一、我们面对的世界

伴随着移动互联网的发展、物联网的逐渐普及,人类的沟通和交互日渐趋向于零成本、零时差;以移动设备为媒介,人类与人类之间、人类与设备之间、设备与设备之间建立了更密切、更即时的连接方式。

同时,产业的数据化及技术的进步,让人类社会可被收集、记录的数据量产生了爆炸性增长。

同时,信息时代的驱动力也在发生变革:一开始,信息时代的驱动力仅仅是技术驱动,它使 “用户参与”成为可能。数据分析者得以开始收集用户初始化信息,根据信息执行策略并实施。 而技术的不断发展使数据驱动成为可能,人类收集的数据量大大增加,开始可直接通过数据进行趋势预测和决策分析,可绘制用户画像,进行针对性产品/服务推介。在此基础上,场景驱动成为可能,现在,数据已经开始可能具备这一能力: 可针对不同个体、群体所处情境,洞察情境中“人”的决策机制。 从技术驱动、数据驱动到更精细化的场景驱动,人类对数据质量的要求大大提升。

二、大数据需要进化

在这样的态势下下,人类更需要依托经过治理的数据去做智慧的驱动和决策,但目前的大数据应用却存在一些问题。

理论上来说,大量数据的集成可以映射出客观世界的部分,形成一个个数据体系。而体系中包含一个个映像,这是不同体系根据不同需求对客观世界的数据化抽象和沉积。在这种抽取和沉积中本身已包含了一种逻辑。不同的映像构成体系,而不同体系组合交叠成为客观世界。映像永远只是客观世界的一部分投影,而非全部。如果再细分,映像中还包含一个个场景,而场景又能拆分为时间、空间、语义、语境四个要素。

目前的大数据应用存在的问题,首先是连接方式的问题。大数据目前的连接方式,要么是绝大部分的数据处于分散的孤岛状态,体系和体系之间囿于商业竞争无法建立连接,导致数据无法流动印证;典型的场景就是BAT之间各成体系,同一用户在不同体系沉积的相关数据无法进行关联洞察。又或者这种连接过于粗放(仅是体系对应体系,或者是映像对应映像,而不能以用户为中心,调用用户在各个体系的相关场景中的数据)或细微(只是碎片化的数据验证,而无法进行场景与场景之间的逻辑关联验证),容易得出中窥豹的片面结论。

体系之间缺乏连接

连接过于粗放或细微

而大数据收集方式的混杂、无序、模糊等特点,也使得大数据的“数据质量”,令人堪忧。一旦数据的质量不高,很容易导致错误的场景重现、错误的映像,出现错误的连接以至于形成错误的决策。

所以,我们需要更具“场景化、开放性、可度量、及时性、价值化”的全局数据,驱动智慧决策。

三、全局数据新时代

目前大数据应用的问题,关键是连接方式问题和数据质量问题。万物互联、驱动力变革的时代,我们更需要数据治理导向下“场景化、开放性、可度量、及时性、价值化”的全局数据。

全局数据的特点:场景化、开放性、可度量、及时性、价值化。

如前所述,在任何体系内的数据抽取和沉积都只能是客观世界的映像,是客观世界的一部分,而不是全部。全局数据的“全局”并不意味着拉平所有数据,进行数据的挖掘和应用,而是要打破体系与体系间的壁垒,凸显场景化的连接。

而本文定义的场景化包括场景构建、场景连接、场景洞察三部分。真正运用好全局数据,可以利用态势感知进行合适的场景构建、匹配的场景连接和精准的场景洞察。这会真正赋予数据智慧。

为了打破数据孤岛,全局数据必须开放,“开放”包括数据源的开放以及不同系统之间接口的开放两部分。同时,全局数据可进行即时的智能数据收集、分析、应用决策,使全局数据不再是固化的“资产”,而是活动性的“生产力”。当体系与体系之间的开放是由标准化技术接口完成的时候,数据的收集就是完全可度量的。而根据全局数据得出的结论和决策带来的优化也是可量化的,比如:直接可见的效率提升、成本缩减或者是效益提高。全局数据一定是价值化的数据,能直接带来社会价值、商业价值、科学价值的提升。

全局数据同时是被赋能的数据,拥有三大能力:收集数据的能力、治理数据的能力、应用数据的能力。

收集数据就是连接决策相关的各种场景。连接决策相关的场景化数据意味着连接用户与用户,产品与产品,行业、企业与政府,连接与决策相关的每一个场景因素。同时,全局数据的数据收集是通过各个体系间的开放接口进行的,这就保证了数据开放的安全性和可控性,以及可追溯性。

数据治理是数据从基础层到可被智慧洞察运用的全局数据仓库的进化。在这个过程中,数据的入端通过治理保证了质量和管护,在出端保证了隐私和安全,保证了数据的时效性、可共享性、高质量、一致性,解决了数据的“乱杂错丢骗”,保证真实的关联场景化连接,确保数据应用能是真正场景化、可度量、有价值的应用。

全局数据的应用场景涉及到生活的方方面面,小到消费决策,大到政府决策都可依赖于此。全局数据概念下的应用需要能通过智慧化、可视化的技术揭露海量数据中隐藏的知识,让数据中的智慧能够以一种直观的形式流向决策者,无论决策者是人还是机器。

同时,全局数据亦拥有自己的界限。

全局数据的界限:不危及国家安全、不侵犯公民隐私、不违背个体意愿。

其中,个体包含了个体的“人”和作为“个体”的机构和企业。个人、机构和企业都有能力、渠道、权利去管理和自身相关的信息,可以决定什么时候公开,以及用什么方式公开信息。对自身的数据要有控制权。但我们并不提倡个人、机构和企业把数据视为自己的私有资产,我们倡导的是一种遵从个体意愿、同时有选择的公开部分数据,帮助整个体系进行全局数据价值挖掘和视野进化的理念。

以下为研究报告正文:

(来源:TopDigital)

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190219B0YMWI00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券