大数据时代的10个重大变革

大数据时代的到来正在改变人们的生活方式、思维模式和研究范式,我们可以总结出10个重大变革。

NO.1目标驱动型 数据驱动 决策方式

传统科学思维中,决策制定往往是“目标”或“模型”驱动的——根据目标(或模型)进行决策。然而,大数据时代出现了另一种思维模式,即数据驱动型决策,数据成为决策制定的主要“触发条件”和“重要依据”。例如,近年来,很多高新企业中的部门和岗位设置不再是“固化的”,而是根据所做项目与所处的数据环境,随时动态调整其部门和岗位设置。然而,部门和岗位设置的敏捷性往往是基于数据驱动的,根据数据分析的结果灵活调整企业内部结构。

NO.2 基于知识的方法 基于数据的方法 方法论

我们传统的方法论往往是“基于知识”的,即从 “大量实践(数据)”中总结和提炼出一般性知识(定理、模式、模型、函数等)之后,用知识去解决(或解释)问题。因此,传统的问题解决思路是“问题知识问题”,即根据问题找“知识”,并用“知识”解决“问题”。然而,数据科学中兴起了另一种方法论——“问题数据问题”,即根据问题找“数据”,并直接用数据(不需要把“数据”转换成“知识”的前提下)解决问题。

NO.3 复杂算法简单算法 计算智能

“只要拥有足够多的数据,我们可以变得更聪明”是大数据时代的一个新认识。因此,在大数据时代,原本复杂的“智能问题”变成简单的“数据问题”——只要对大数据的进行简单查询就可以达到“基于复杂算法的智能计算的效果”。为此,很多学者曾讨论过一个重要话题——“大数据时代需要的是更多数据还是更好的模型(moredata or better model)?”。机器翻译是传统自然语言技术领域的难点,虽曾提出过很多种“算法”,但应用效果并不理想。近年来,Google翻译等工具改变了“实现策略”,不再仅靠复杂算法进行翻译,而对他们之前收集的跨语言语料库进行简单查询的方式,提升了机器翻译的效果和效率。

NO.4 业务数据化数据业务化 数据管理

在大数据时代,企业需要重视一个新的课题——数据业务化,即如何“基于数据”动态地定义、优化和重组业务及其流程,进而提升业务的敏捷性,降低风险和成本。但是,在传统数据管理中我们更加关注的是业务的数据化问题,即如何将业务活动以数据方式记录下来,以便进行业务审计、分析与挖掘。可见,业务数据化是前提,而数据业务化是目标。

NO.5 第三范式 第四范式 研究范式

2007年,图灵奖获得者Jim Gray提出了科学研究的第四范式——数据密集型科学发现(Data-intensive ScientificDiscovery)。在他看来,人类科学研究活动已经历过三中不同范式的演变过程(原始社会的“实验科学范式”、以模型和归纳为特征的“理论科学范式”和以模拟仿真为特征的“计算科学范式”),目前正在从“计算科学范式”转向“数据密集型科学发现范式”。第四范式,即“数据密集型科学发现范式”的主要特点是科学研究人员只需要从大数据中查找和挖掘所需要的信息和知识,无须直接面对所研究的物理对象。例如,在大数据时代,天文学家的研究方式发生了新的变化——其主要研究任务变为从海量数据库中发现所需的物体或现象的照片,而不再需要亲自进行太空拍照。

NO.6 数据是资源数据是资产 数据的属性

在大数据时代,数据不仅是一种“资源”,而更是一种重要的“资产”。因此,数据科学应把数据当做“一种资产来管理”,而不能仅仅当做“资源”来对待。也就是说,与其他类型的资产一样,数据也具有财务价值,且需要作为独立实体进行组织与管理。

NO.7 统计学 数据科学 数据分析

在传统科学中,数据分析主要以数学和统计学为直接理论工具。但是,云计算等计算模式的出现以及大数据时代的到来,提升了我们对数据的获取、存储、计算与管理能力,进而对统计学理论与方法产生了深远影响,主要有:

(1)随着数据获取、存储与计算能力的提升,我们可以很容易获得统计学中所指的“总体”中的全部数据,且可以在总体上直接进行计算——不再需要进行“抽样操作”;

(2)在海量、动态、异构数据环境中,人们更加关注的是数据计算的“效率”而不再盲目追求其“精准度”。例如,在数据科学中,广泛应用“基于数据的”思维模式,重视对“相关性”的分析,而不是等到发现“真正的因果关系”之后才解决问题。在大数据时代,人们开始重视相关分析,而不仅仅是因果分析。

NO.8 以战略为中心 以数据为中心 产业竞合关系

在大数据时代,企业之间的竞合关系发生了变化,原本相互激烈竞争,甚至不愿合作的企业,不得不开始合作,形成新的业态和产业链。例如,近年来IBM公司和Apple公司“化敌为友”,并有报道称他们正在从竞争对手转向合作伙伴——IBM的100多名员工前往Apple的加州库比蒂诺总部,与Apple一起为IBM的客户(例如花旗、Sprint和日本邮政)联合开发iPhone和iPad应用。

NO.9 不接受 接受 数据复杂性

在传统科学看来,数据需要彻底“清洗”和“集成”,计算目的是需要找出“精确答案”,而其背后的哲学是“不接受数据的复杂性”。然而,大数据中更加强调的是数据的动态性、异构性和跨域等复杂性——弹性计算、鲁棒性、虚拟化和快速响应,开始把“复杂性”当作数据的一个固有特征来对待,组织数据生态系统的管理目标转向将组织处于混沌边缘状态。

NO.10 小众参与 大规模协同 数据处理模式

传统科学中,数据的分析和挖掘都是具有很高专业素养的“企业核心员工”的事情,企业管理的重要目的是如何激励和绩效考核这些“核心员工”。但是,在大数据时代,基于“核心员工”的创新工作成本和风险越来越大,而基于“专家余(Pro-Am)”的大规模协作日益受到重视,正成为解决数据规模与形式化之间矛盾的重要手段。

来源:数据科学Data Science

本文来自企鹅号 - 大数据媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏吉浦迅科技

人们都在说人工智能,其实现在我们真正做的是智能增强

自20世纪50年代以来,人工智能(The Artificial Intelligence / AI)与智能增强(Intelligence Augmentatio...

4078
来自专栏孟永辉

上半场在表层,下半场在内生:互联网家装的“双生记”

3137
来自专栏孟永辉

新零售赋能甚嚣尘上,互联网家装的“创世纪”在哪?

1608
来自专栏磐创AI技术团队的专栏

2018-2019最具成长性AI技术Top10:GAN、胶囊网络、云端AI排前三

【磐创AI导读】:本文主介绍多项世界机器人大会认定的潜力AI最新技术top10,值得一读。想要了解更多AI咨询、学习更多的机器学习知识,欢迎大家点击上方蓝字关注...

341
来自专栏灯塔大数据

塔观 | AI会全面超越人类吗?来看看352位AI专家的答案

导读:如果听到有人预测人工智能(AI)何时会取代人类,你肯定会以为预测者不懂AI或是末世论者。但是现在,研究人员联合机器学习专家对这个问题开展了有史以来规模最...

3337
来自专栏AI科技评论

学界 | 中国电子学会公布十大最具成长性 AI 技术

AI 科技评论消息,当前,全球正在经历科技和产业高度耦合、深度迭加的新一轮变革,大数据的形成、理论算法的革新、计算能力的提升及网络设施的演进驱动人工智能进入新一...

491
来自专栏孟永辉

赋能流于表面,重塑才是关键,新零售如何深度改变互联网家装?

浩浩荡荡的移动互联网的洪流在将传统行业席卷进入到“互联网+”洪流之际,同样给人们的消费习惯和消费行为带来了改变。值得注意的是,移动互联网时代的来临或许仅仅只是为...

413
来自专栏专知

【重磅】《人工智能标准化白皮书(2018)》发布(完整版)(附下载链接)

【导读】1月18日,召开国家人工智能标准化总体组、专家咨询组成立大会,在会上,国家标准化管理委员会宣布成立国家人工智能标准化总体组、专家咨询组,负责全面统筹规划...

3807
来自专栏专知

中国信通院发布《人工智能发展白皮书-技术架构篇》(2018年)附pdf下载

2018人工智能发展白皮书是中国信息通信研究院、中国人工智能产业发展联盟首次联合发布。本篇为技术架构篇,从产业发展的角度,选择以深度学习算法驱动的人工智能技术为...

472
来自专栏新智元

机器学习初创公司出路,投资人看好医疗诊断、计算生物和供应链等 9 大方向

【新智元导读】作者 Medha Agarwal 是 Redpoint Ventures 的投资人,本文带来了作者认为成功的 AI 初创公司的特质,以及对搞机器...

3134

扫码关注云+社区