钱学森与大数据:钱学森的大数据思想:开放的复杂巨系统

简介

钱学森还是一位系统学家。关于系统科学,钱学森曾明确指出,系统科学是从事物的整体与部分、局部与全局以及层次关系的角度来研究客观世界的。客观世界包括自然、社会和人自身,能反映事物这个特征最基本和最重要的概念就是系统。所谓系统是指由一些相互关联、相互作用、相互影响的组织部分构成并具有某些功能的整体。

一、新系统分类

钱学森提出了系统新的分类,将系统分为简单系统、简单巨系统、复杂巨系统和特殊复杂巨系统,生物体系统、人体系统、人脑系统、地理系统、社会系统、星系系统等都是复杂巨系统的代表,其中社会系统作为最复杂的系统又被称作特殊复杂巨系统。这些系统都是开放的,与外部环境有物质、能量和信息的交换,所以又称作开放的复杂巨系统。

二、“大数据”系统

今天的“大数据”系统就是在新时代下出现的开放复杂巨系统。大数据是指由数量巨大、结构复杂、类型众多的数据构成的数据集合,所涉及的信息资料库规模巨大,无法在合理的时间内通过目前的主流软件工具达到撷取、管理、处理并整理为可帮助组织进行决策的信息。大数据系统有4个V特性:数据量大(Volume)、数据种类多样(Variety)、实时性强(Velocity),蕴藏的商业价值大(Value)。特别是随着物联网的发展,越来越多的传感器被部署在城市、服务业、金融业、工业、农业、能源等领域,借助条形码、二维码、RFID等可唯一标识产品,传感器、可穿戴设备、智能硬件、视频采集等源源不断地产生着海量数据,相关领域的数据规模已经达到TB甚至是PB级。有统计表明,2013 年中国产生的数据总量是2012 年的两倍,相当于2009 年全球的数据总量。

按着复杂巨系统的概念,大数据系统不仅数据规模巨大且结构复杂,而且元素或子系统种类繁多、本质各异、相互关系复杂多变,在宏观与微观层次存在着复杂的关联度,相互作用机制不清楚,不能通过简单的数据分析的方法描述其宏观行为,而且大数据系统本身又是一个开放的系统。开放的复杂巨系统的主要特性包括:开放性,系统对象及其子系统与环境之间存在着物质、能量、信息的交换;复杂性,系统中子系统的种类繁多,子系统之间存在多种形式、多种层次的交互作用;进化与涌现性,系统中子系统或基本单元之间的交互作用,从整体上演化、进化出独特的、新的性质,如通过自组织方式形成某种模式;层次性,系统部件与功能上具有层次关系;巨量性,数目极其巨大等。

三、复杂巨系统学

钱学森把关于复杂巨系统的理论研究称作复杂巨系统学,并于1992年提出建设人机结合、从定性到定量的综合集成研讨厅体系的设想。综合集成研讨厅体系的概念就是将专家群体(各领域的专家)、数据和各种信息、计算机、网络等信息技术有机结合起来,把各种学科的科学理论和人的认识结合起来,基于网络构成的系统。该综合集成研讨厅由研讨终端、中心研讨厅、研讨厅骨干网(Internet或WAN)、研讨厅管理服务系统、研讨厅信息资源库、以及分布各地的感兴趣的和相关的研讨群体与技术支持群体组成。

四、指导意义

钱学森的“开放的复杂巨系统”思想对于研究今天的大数据有重大指导意义。人机结合的综合集成研讨厅体系,将专家体系、机器体系和数据体系有机结合起来组成智能系统,是研究和解决“开放的复杂巨系统”相关复杂问题的有效途径。在钱学森之后,又有学者中科院院士戴汝为从智能系统角度提出了人工社会,在综合集成研讨厅体系基础之上,以人与网络计算机为单元,通过以复杂问题为牵引的交互和组织,形成了开放的人工社会,以求解复杂问题为目的,以人为计算中心。戴汝为曾师从钱学森,并于80年代后期率先在国内开展了人工神经网络研究。结合钱学森与戴汝为的学术思想,将有助于当今社会对于大数据现象的思考、研究及指导实践。

观星际以求知 聚智慧以强国

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181211B0P8BC00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励