指标驱动,数据优先:工业数字化转型的经验分享

  • 1
    关注“腾讯产业互联网学堂”公众号加群互动有好礼相送
  • 2
    向学习君回复口令“智能制造”
  • 3
    加入交流群
腾讯产业互联网学堂微信公众号
“腾讯产业互联网学堂”微信公众号

讲师简介

时培昕

寄云科技CEO

简介

智能制造与工业互联网 系列公益联播 第五期 工业互联网平台。介绍工业数字化转型需要分清目标和工具,ISA95、IIoT和数字孪生,数据是工业企业的新石油,工业互联网是工业数字化转型的基石以及给出实践分享和建议

课程大纲

1. 工业数字化转型需要分清目标和工具

2. ISA95、IIoT和数字孪生

3. 数据是工业企业的新石油

4. 工业互联网是工业数字化转型的基石

5. 实践分享和建议

讲义

1. 工业数字化转型需要分清目标和工具

今天的主题就是给大家分享一下我们在这些年做的工业互联网转型的一些经验 ,那我主要关注的一点还是偏这个我们叫数据这一块,我的主题是指标驱动数据优先。首先讲一下就是确定跟互联网的转型需要区分下目标和工具的一个区别。其实四次工业革命呢,其实是我们看倩是一个工业品的制造复杂度的一个提升,从早期的人工的一个制造到现在现在的高端的这种电子产品,包括一些这个复杂的一些原材料的一些设计都是在复杂度上面做了一个很大的一个提升。那早期的这个工业呢,这个过程呢,相对来说比较简单,所以通过早期的手工的制造加上我们说精英的管理,包括大家都知道的就各种5S,包括看板,包括这种精英的管理其实是能够大幅提升整个的一个人员管理的一些素质和一些效率,同时呢,在这个基础上我们又开始走向自动化,通过机器换人那个方式来去解决很多重复性的这种时效性的精准度的一个提高 所以这些其实都是在我们对这种简单商品的一些制造的过程是可以通过这种方式来进行实现的。但是这种传统的以管理为核心的这种新来制造已经比较难满足,说一些高精度高质量产品的一些生产需求,并不是说这些没有用,而是说在这个基础上,我们需要借助一些新的一些手段了,新的手段其实我们就在一直在提就是复杂商品的一些制造只能通过一借助关于互联网的转型升级手段技术工具来去实现,复杂商品举个简单例子,肯定金源和这个大家都知道光刻机这种商品 从这个资料是从应用材料的那个框架上面得到的,其实大家可以看到里面是没有非常多的一些物联网的一些数据采集,包括SPC统计过程控制,包括FDC包括OEE指标的分析,包括运营维护,包括APC控,包括从底层的数据采集一直到其他的预测,所以整个过程包括了非常多的一些数字化转型需要的各种各样的业务系统,从MES到FDC到R2R到SPC、EDA到YMS整个一个体系其实都是非常需要我们的利用物联网的一些数据,利用数据分析,利用分析的一个结果来去做一些智能的一些 改进 所以只有通过这种数据分析和控制系统的有效结合,形成一个完整的一个生产过程的管控,才有可能解决生产过程中很多的品质产生效力的各方面的一些问题。

那这个里面大家就在提成是工业互联网,工业数字化转型这个概念其实在国内可能稍微少提,工业数字化转型“数字化转型”的一个子集,他是用先进的这个技术,特别是工业物联网的一个技术,对现有的资产过程,产品进行转变实现我们的运营指标的提升,走向卓越运营。

那它的应用场景,其实涵盖了我们所有的可以涵盖非常多的过程中制造的装配加工预存维护,包括绩效管理,包括质量管理,包括可持续发展,这一系列的制造环节以及延展到 产业链的上下游,包括端到端的这个价值链从供应链一直到客户到智能产品,这都是属于这个规划来往转型的一个应用场景。我们在现在看得见很多的这个企业都在谈一些技术,很多的厂商也在谈一些技术 ,这些技术无外乎IT的一些热门的一些词,云计算,大数据,物联网,RPA,微服务,这些其实都是偏IT的一些概念,在OT里面也会有很多的一些时髦的一些名词,包括增材制造,工业互联网 包括数字孪生,数字主线包括IT/OT融合,其实这些都是一些技术手段 .但是呢,工业互联网的转型只是说我们的认为是一个阶段性的工具,它是通向我们说未来工厂的交通工具。

2、未来工厂的运营架构

什么是未来工厂的,大家可以看这是一个框架,所有的工厂基本上也是按照这个框架,从你的最终的一些目标到你的战略,再到你的价值链的一个执行,再到下面的人技术流程的一个有效的融合。这个其实就是未来工厂需要达到一个目标 。然后未来工厂其实给了一些按这个有一个投资的研究机构做了一些这个成熟的界定,从现在这个阶段,大部分的这个工厂都还在L1,这个阶段从初始化的阶段,不可预测的一个过程,就是过程的很多的结果你不可控,你的结果不确定,很多时候你必须被动的去采取一些响应也以及在过程中有大量人为干预的一些因素。到第二阶段可管理的一个阶段,通过一个项目的方式来去划分不同的子过程,被动式响应响应一直走到一个相对比较明确的依靠一些组织的划分过程,主动式想一直到定量化的一个管理,实现过程可控,包括结果可控,一直到最后的优化,持续的过程的优化和持续的这个变革,这都是我们说未来工厂的一些不断演进的一个过程。

未来工厂可能大家就觉得这个是不是有一点太虚无缥缈,其实他并不是完全的这个虚无飘渺的一个概念,它更多是说对现有的一些工厂进行一些数字化变革能够主要在运营层面得到一个巨大提升,运营层面,其实主要是包括两方面,第一就是定义一系列主业运营的指标的体系,第二在这个基础上,增加改变现有的运营的架构,实现这种数据赋能的这种运营的架构,走向一个最终的一个卓越运营的这个目标。

那卓越运营关键的一个支撑就是我们在说的指标体系,这个指标呢,其实大家可能听见的kpi指标无外乎各种财务人效包括销售业绩,这些从企业经营层面的一些指标,再往下细呢,肯定就是划分到不同的部门,我们要生产指标,维护指标,库存的指标,质量的指标,安全合规性的指标以及相关的一些业务部门的一些指标,在这个基础上等等这些指标都来自于大量的这个基于平台能对接的很多的自动化系统数据和业务系统的数据,这个才能支撑起来一个完整的指标体系。在指标体系里面大家可以有兴趣可以去参考一下这个ISO22400,在我查资料就看我感觉到国内其实大家对这个提的不多,反而是在日本大家对这个概念提的比较多,就从这个多维度的一个指标,这个维度大概指标主要包括我们叫生产的这个维度和维护的维度包括库存包括质量这些维度总共在运营层面要提供提供大概三四个指标,当然这个指标可能每个企业包括按照他的行业的划分都还有更多的一些多的也指标,但这三四个指标其实我觉得是已经足以来去支撑每个企业的一个正常的一个运营。所以这些都是我们指标我们要走到一个目标就叫首先要清楚的目标是啥?然后呢,在我们再说未来工厂,所以我现在工业其实大家都可以把现有的这个业务体系分成三个层面,从最下面的资产资产包括交易流程技术,这些都是资产到运营从整个一个我们家价值链从研发设计到工程再到正在制造再到物流供应链再到服务,这个是我们叫运营这个阶段 ,然后业务这个阶段其实就是我们说人才市场决策这些那个阶段,所以大部分都可以分成这三个层面基于这三个层面,其实在国际上有非常多的一些理论体系包括大家熟知的OPC,包括ISO ,包括OASSISO等等,这些都是在从研发的直接转到工程阶段 再到制造阶段再到生产阶段,涵盖了非常多的一个过程,我这边重点要讲一下ISA95,因为它涵盖了整个运营支撑这个层面的很多方面,ISA95呢,其实把我们现有的企业的一个架构定义成了五个层面,五个层面,最下面三层的其实是说自动化层面,就是大家熟悉的ot的一些相关的各方面的一些系统,中间这个叫制造运营管理,它包括了非常多的一些,比如说生产计划呀,过程管理,包括一些维护质量这方面的一些功能。这上面一层就是大家熟知的it的一些系统,财务人事市场这些的一些系统 ,这个最下面这些呢,其实还有一个规范叫ISA88。ISA95在传统的这种层次化的一个架构呢,其实他虽然很清晰的定义的每一层的一个工作的内容,但实际上大家可以看得见这种从最底层到最上面的我们叫垂直整合,在这种垂直整合下,其实最底层的数据很难被用到这个高层的这种决策和判断能力,包括生产能力,所以最上面这种情况下,上一层的数据都是下一层的数据的汇聚和抽象,其实这种层次越高能利用到的原始数据就越少 。针对这种缺少原始数据的情况,你会造成,我如果我要解决一个特定的一个问题,让我要非常清楚的知道一个生产的产灯包括一个质量,包括一些效率,也包括能耗这些的关键指标,我们现有的数据其实都是一些抽象的数据,往往拿不到一些真实的数据这种情况就会造成企业的一些产品的品质,包括交付时间,这些都存在很大的一些不精确不实时的一个情况,就降低这个整个企业的运行的一些效率。但是第二个的局限性就是说我们现在对ISA95里面的各个系统的一个数据利用程度较低,无法应对复杂的变化和预测。我们去说这个数据分析包括了描述性诊断性包括预测性和预知性包括策略型这些 。这些但真实的就是在IAS的一些调查里面,其实我们绝大部分都只是停留在描述性,描述性其实就是一些统计报表,包括真正你要走到坐到预测性,其实现在不管是对这个设备可靠性的预测,还是对产生的预测还是被供应链库存的预测,其实都远远达不到这个要求。第三呢,就是这套架构的体系其实很大程度限制与这个我们叫MES或者MOM的,因为在这种情况下,其实大家都把MES或者MOM做成一个大而全的一个实体来去承载越来越多越复杂的功能,但是现有单块式的一个应用架构,无法实现数据的共享,也无法实现灵活的功能和性能的扩展,无法满足灵活的定制化需求,所以在这里面大家在其归互联网转型,工业互联网转型其实主要是改变工业企业的运营架构,从传统这种层次化的架构,变成一个相对比较扁平或者说以数据驱动的未来工厂的一个运营架构 就是来分厂运营架构的基础呢,就说我们基于我们要把it和ot的一个数据打通,能够形成一个还是层次化的一个解决方案,这个解决方案能够在基础上能够形成一致化的一个数据构建起来,新一代的一个全新的数据智能的一些应用。这个就是我把之前的横向的一个纵向的一个集成编成一个横向的一个数据的一个集成,从it系统里面抽取相应的指标的一些数据,从ot系统抽取一些实时的数据做相应的关联,在同一个平台上实现融合的数据的架构和数据的服务,再利用一系列的应用开发的工具数据分析的工具来实现相应的订阅和分析。那在智能应用上我认为在未来我们一定会有更多的甚至95%以上的应用还没有开发出来,这类的应用包括我们说经营层面的各种各样指标预测,包括这个运营的一些管理的预测 ,包括运营层面的很多的计划库存,维护质量,安全能源包括最下面的这个新一代的控制系统就是我们大家都在提的监控,所有这些系统其实都带有四种不同的属性,就是他一定是数据驱动的数据系统。

那首先说一下简单说一下IIOT的平台,这是在 LNS Research里给的这个框架,大家可以看得见最下面是一个设备的连接 提供通过开放的OBC等的开放协议,能够实现数据的采集和实时传输,获取这个生产和经营的实时数据。同时呢,它提供的这个计算资源不光是在云计算还在包括在边缘端的一些部署,同时在数据处理,通过数据的一些处理,对数据这个构建一个统一的数据模型,去提供开放一些服务,同时提供了很多的应用开发和数据分析的工具,针对不同的目的,对使用这些工具在最应用数据之后深入的分析,上面再去构建相应的应用和这个协作包括分析,这个提前相应的应用来实现各种各样的应用和分析可视化。最后呢,通过一些我们的应用服务市场构建这个数据应用和服务的开放的一个数据数字化的一个生态,这是一个IIOT平台的一个参考架构。刚才提到的mom在这个新的形态下也会做一些大图的一个调整,就是他会逐步逐步给予归互联网平台,构建一个这种一数据驱动等方式来去实现应用和数据的一个解耦,形成一系列的模块化的这样的一些应用,对上的连接第四层的这个业务系统,对下连接这个第二层的这个自动化系统 。所以他就是基础上能够开发出来一系列的持续构建一系列的生产的运营的一些应用。

3、工业物联网平台是未来工厂的核心架构

第三部分给大家讲一下那个介绍一下这个工业物联网平台 ,刚才已经提到了它具备了各方面的一些功能,那在工业互联网产业联盟,大家也都看到了有非常多的一些各方面的一些文献也对这方面的架构进行了一些非常详细的阐述,从下面的边缘端的接入边缘计算,一直到工业数据的管理和分析以及到工业数据的建模到相对的工业paas的一些开发,包括一些就我们叫这个灵活的一些无代码的一些开发工具其实都在这个架构以内。那我们可以看一下相应的国际上的很多的厂商,其实也都遵循的这个架构让大家比较熟悉的一个Predix早期的IIOT的先驱,然后他做的架构基本上也是围绕,从而it和OT端来去获取相应的数据,在这个平台上来构建数据分析和应用开发能力。支撑相应的这个工业的各种各样的应用,核心其实是我们的未来我们待会去讲的这样一个数字孪生的形态。那他边缘端的他会提供很多的数据源的接入,包括数据的采集,在边缘端会执行相应的数据的分析和模型的一些应用以及这个做相应的协议的转发。在平台这个层面就包括从边缘端提供的数据怎么去进行相应的数据的处理,包括应用的开发,包括这种的代码的开发和敏捷的开发都提供,以及在上面构建相应的数据分析的能力,在应用这个层面的,其实从记忆的本身的一些历史的一些这个客户来讲他构建的更多是我们说三个层面的应用,一个就是设备的资产管理质量管理,包括可靠性管理,包括设备的实时的监控的监测,包括设备,可靠性管理和微信管理和维护策略优化,以及在运营层面的一些比方说运营的智能就是指标,然后过程和指标的一些优化的,利用这种新的分析技术来去实现优化,这都是在这个机器里面来去在Predix这个平台上提供的。

那国外其实就是还有一家比较有名的叫C3. AI,他在做的事情其实也是从边缘端能够会接各种不同类型的这个数据源,提供相应的数据集成的能力,然后共建数据存储包括平台的微服务,包括数据处理,再到数据的分析和建模,以及这个C3,他有非常多的一些历史的应用。还有一家是Uptake,它其实早期呢主要还是做这种设备的资产的运维,但从他公布的现在资料来说他已经慢慢变成一个平台化,再加一些这个应用的解决方案的供应商,所以从这边的我们的边缘的安全的这种边缘计算,包括云端协同的这样一个边缘往边缘的系统一直到针对不同的设备的数据源业务系统数据源的对接,以及在平台层面怎么提供相应的代码的编译部署以及针对不同的数据分析提供相应的数据科学的目录和模型的管理,以及针对这个模式理论和AI的这种模型开发,来直播一系列的平台的能力,在应用这个层面,它主要提供的就是预测性维护供应链管理这些相关的这个解决方案了 。那寄云也在做的事情也是按照这个架构来设计的,我们从别人端的数据采集到边计算再到我们对接一系列的各种各样专业的it的业务系统的一个数据库提供一个标准的一个大数据平台,在上面来构建起来 一个是因为开发的能力,一个是数据分析能力这个的应用,我们也是主要针对设备的资产的管理运营效率的管理和生产经营的决策这几类的应用场景。

那大部分的大家看见这么多工业互联网,相应的能力都拆出来都变成一些模块化的能力,那包括几方面,第一呢,就是针对不同的海量的不同类型的一个设备,我们在边缘端实时的数据采集,并且把它转成工业物联网的消息协议转发给平台 。那第二块,则是大家提得很多的边缘计算,边缘计算其实是介于云计算和边缘端去采集的一个中间形态,他其实需要和云端有一个比较紧密的一个协同把云端开发的一些应用和一些分析模型来去部署在边缘端能够形成一个实时的检测和反馈,有时候还需要一些反向的一个控制的一个动作。所以这个概念可能就有些厂商在宣传他的一个我们家工业数据采集就是边缘计算,其实这是不太准确的,你必须得有具备一个灵活的应用部署和一些实时计算的能力,我们才能称为边缘计算,那在数据的汇总之后一般都会有一个我们家估计大数据平台,针对不同的 三类的数据,现在一类实时的,一类是结构化的一类分解挂了这种数据提供相应的数据存储海量数据存储能力,以及在上面来去做数据模型,数据标准的这个能力来通过开放的这个数据服务的接口 为上层的应用场景提供这种数据服务 然后针对数据的这个分析呢,因为数据分析场景会非常多,所以一定需要有一个这样的数据分析的能力来对接不同数据源控件统一的数据模型,然后支持这种的代码的一些模型建模的工具 ,它支持各种各样统计分析,机器学习,还有包括人工智能这种分析建模和评价。同时,现在我们也看得见越来越多的一些工业企业在提一些把原有的工业模型包括一些我们叫基于Labview Matlab里面的开发的这种工业的机理模型都要搬到这种分析平台上,这也是一个趋势了。同时在这个基础上呢,针对一些工业的应用,工业的应用无外乎是实时的和流程类的一些应用,针对这种应用提供两类的开发的环境的,第一类可能就是简单的这种低代码或无代码拖拉拽这种方式就能开发出来一些实时监控,包括组态监控这些的相应的一些界面,第二呢,针对一些复杂的一些应用,也需要提供一个相对比较完整的paas的能力去构建相应的这个代码的编译部署的能力。那针对很多大型的企业,其实现在越来越多会考虑到我们要做一个数字化生态来去帮我们的上下游供应链,包括客户能连接到他的服务能力 。这里面其实未来一定会走到一点,就是刚才也提到了一点生态的能力,生态能力其实是要借助的iot平台的一些基础能力把这个平台上面产生的一些数据给他上产生了一些模型,平台上产生的一些开发的应用,通过服务市场,这种语音的一些服务的方式开放给供应商,开放给客户和开放给合作伙伴同事,提供相应的订阅,持续的订阅包括计费,也包括这一系列的这种服务市场,来构建起来持续的这种连接的这种数字化的生态,这是一些的核心的能力。

4、数据、数字孪生和智能应用

(1)数据

大家都会提到比较多的就是数据 ,在数据这块其实它是贯穿到整个工业互联网的一个核心,他其实包括了非常多方面,充分意识到这个数据的一个价值。未来工厂它的整个运营架构也是按照这个数据的利用的方式展开的,包括了几个不同的一个阶段,融合阶段就是我们要针对不同类型的数据来去提供一个融合的机制,包括管理的阶段包括分析才到最后的一个应用,所以这个里面的过程,其实 真的,这个会涉及到这个非常多的一些步骤。那第一个阶段融合呢,融合,其实我们要考虑的这种和不只是说我们要把简单的把设备联网或者简单去做一个备案,它更多是在于全全方位的一些数据的融合,这个数据可能来自于我们L0-L2的这个自动化的系统,L3的生产运营的系统,L4的业务系统各种不同的业务系统都需要连接进来。那工业设备的协议,需要通过协议的网关,业务系统需要进行实时的抽取,当然这里面越来越多还会涉及到一些外部的一些数据包括一些什么价格指数等这些可能都是来自于外部的一些数据。很多还有一些检测报告,离线的检测报告还需要通过一个加载的方式来实现。那沉淀下来基本在平台上都可以分成三类的,一类是实时的数据,我们通过实时数据库或者实时数据库来去做保存,第二类是结构化数据库,我们一般建议是采用这种实时的这种数据库为基础来做保存,当然还有一类比较多,海量的就是我们叫非结构化的数据,包括文件,包括视频音频日志等其实建议都采用非机结构化数据库。

第二呢,就对这些的数据来去做统一的管理,这个管理其实我们更多是在建立一些标准,这个标准其实是我们跨不同的业务系统的这种都可以访问都可以使用的一些标准,这个标准的包括但不限于,比方说,你可以资产怎么去定义,你对组织怎么去定义,你对人员怎么去定义,对工艺怎么去定义,对流程怎么去定义,我们就建立这样标准的我们才能够关联到相应的数据源,才能够实现跨系统的一方面的这种数据访问,这种数据访问他一定会使用到一个是数据的存放的位置数据的关联关系数据的开放的权限,以及数据在更新时候是不是可以给到所有的数据的使用者一个更新的一个通知,这些其实都是在原有的这种工业业务系统里面确实没办法实现的。

第三步呢,是一个重点的可能大家都会觉得这个工业的数据的价值非常高 ,但是这里面得跟大家你解释一下,就是说可能有些工业的企业的客户他认为大数据就是大数据分析,这其实是两个不同范畴的概念 ,大数据的其实做的是一些基础层面的事情,就是我们对数据的提取处理,包括一些存储和标准化这是大数据去处理的一些事情,他具备特点就是海量,实时和多样性。他适用的场景是分布式,高可用,而且是一些实时的一些业务场景才会用到大数据。但是,另外一类就是我们数据科学,数据分析,这个数据科学其实在大数据之前就已经存在了,它需要根据不同的工业的一些生产目标来找数据的一些规律和关联的关系,来去形成一个解决问题的一个方法,所以他利用了分析无外乎我们说的的早期的物理的公式物理的模型,以及基于统计的一个分析,那这两年的乐加了很多人家机器学习和人工智能的一些方分析方法 ,大数据分析数据分析呢,可以不建立在大数据基础上,早期的架构大家接触到的包括这个spss其实 很早的时候其实不具备大数据的一些框架的能力的 ,所以这些都叫数据分析,他和大数据其实是两个范畴的概念 。

那大家都知道工业数据分析,加上工业数据,这种有意义的或者说我们要去上基于上下文的这些数据,加上数据分析一定就意味着一些巨大的产出,产出呢可以放在很多的场景下,我们说对于企业来讲,可能会分着从企业经营层面,包括决策层面,包括对生产这个层面 ,包括设备的运维层面,包括价值链上面,其实都存在非常多的一些分析的场景,这是自古以来一直都存在的 。从LNS拿到的进行调查报告呢,其实看得见大家在工业企业里面的用的比较多的场景主要是五个类型的场景,主要包括第一提高产品的质量,那这次基本上是大家可能都会公认的,第二就是预测生产的产量,第三是提高一些关键环节的运营的指标,第四呢,就是实现一些过程的持续优化,第五的就是提高产品的服务质量,这些其实都要来自于对这个数据的一个深度的一个分析,所以整个一个分析过程的一般都会分几步,第一步就是通过一定要很清晰的建立,我们说目标你的解决的目标是一个比方说我们说良率的一个指标,那么就需要根据这个良率指标来去拆解,我们需要用到什么样的数据,根据数据做相应的准备,包括提取将于的特征 。第二呢,在上面去做相应根据这个目标和数据之间关系来去寻找一个分析的方法建立起来,这样的分析的模型,选择相应算法,创建工作流,对数据进行训练,然后对结果进行评分和测试 。然后同时对这个模型的输出呢,我们还有可能还要应用,应用无外乎两种,第一种呢把它放在一个实时的生产 应该不断地接收这个数据 ,然后实时地产出结果,第二呢,就把分析的结果批量的方式存下来放在一个数据库里面,来去给应用程序来去开发和使用,所以这些都是一个相对比较完整的一个过程 。

那你分析的结果呢,一般的情况下都会用到在一些海量的数据基础上来去做云端的分析,但是分析在工业的特点其实有很多的实时场景要求比较高的,所以很多的时候会需要把很多无论是设备,生产,还有这种产线这些汇总在一起,在云端做一个比较深入的一些分析,并且把这个分析 能够结果能够不断的普及下去,能够在边缘端来去做相应的部署,所以最终实现边缘端数据 模型核实数据的一个有效结合,形成一个更智能,更实时的这样的一个判决的结果。

那从数据分析来讲呢,大家公认的现在分析方法呢,其实前面说了四种分期的阶段,其实也主要是三种不同的分析方法 ,第一种方法是物理的,第二种是统计的,第三是机器学习。在 LNS其实也把它分成三类,第一类叫这个第一原则,就第二类是记忆统计的,第三类是机器学习,AI的。第一类其实大家接触的最多,就是这种我们说上面是类似一个PRD的模型,他就是一个简单的我们就要线性的,或者积分的,或者是微分的这样一个过程,只要你按照这个公式进去你的输出就是类似的这个结果,就是比较明确的,那这种模型的它的优势呢,就比较简单就是不需要太大的一个计算的工作量,也不需要很多的数据样本就可以完成,但是他的劣势也非常明显,这类的物理分析呢,它取决于我们要明确的一个可以测量的输入,如果你没有测这类的传感器的输入,或者你没有这样的直接可测量的一些数据,你就没办法来做这种计算 ,在工业里面其实有非常多的场景其实你是没有办法直接测量的,所以就是一类的限制,第二呢,它是没有状态的,输入和输出就是一个无状态的没有数据,没有历史的数据 ,第三类是不适合复杂的一个场景,比如说一个化工厂很难用一系列的物理模型来来描述出来,这种它的应用场景就把它可以用在一些我们说具有一些可以拆解的一个比较明确的一个子过程,这个过程相应的输入比较明确,输出的指标乡的也比较明确,这里面就可以用这种物理的分析。

第二类的统计分析呢,统计分析其实用的大家用的比较多的一类那肯定就是说像大家的看的各种的统计报表等这都属于统计分析,它的特点就是简单明确计算工作量比较少 ,基本上不需要太多的数据样本就得到一些这个分析的一些结果,但他的劣势也比较明显,他只能基于历史数据范围以内的一个结果,然后第二呢他也只能作为事后判断,第三就是没办法实现假设。所以它的应用场景一方面大家用的比较多,就统计的汇总 ,第二个就是指标的横向的对比,第三就需要我们稳定性控制场景,第四是用于指标控制和告警。

第三类就是机器学习,分为很多类,简单的机器学习就是一些聚类分类的一些数据挖掘,包括决策树,包括svm等这些的一些基本的方法。那现在呢,大家又在考虑用客观的甚至学习各种各样的网络人际网络,还有IBM,各种安全及,包括这些神经网络来去 走到一个这种输入和输出直接不确定关系的一个拟合的一个状态 。然后再往后面的大家又来提强化学习就是根据我们说反馈来去给他一些word来去让他再去改进,这个训练的一些参数训练的一些这个行为来去找到一个更精准的一个判决 ,所以这里面就是进学习是在工业里面是目前来说还是处于一个早期一个阶段。它的优势呢,其实是比较适合在一些大型复杂场景下,你没有办法用统计分析也没办法用物理模型情况下,那你只能借助于机器学习来去寻找一些不可解释的这样的一些场景。那他的劣势呢,首先过刚才到你需要大量的数据样本 ,同时那里需要非常精确的一个标注这种标注,如果你没有数据标注不全或者说你标注的质量很差,这种情况下你一定会影响你最终的学习的一个质量,它适合就是说类似我们说一个复杂过程难以用单个物体模型来描述,第二是数据的质量比较好,并且这个同类型的样本比较充足,比较充分,而且有清晰的一个标注 ,他也适合这种指标单一指标或者多指标的这个我们叫按时间长了一个时序的预测,同时呢,他还可以做另外一个事情,他可以做很多的组合的判断,他可以在把很多没有发生的一些组合扔到这个神经网络里面来去得到一个输出的一个模拟,在这种情况下来去筛哪些是更合适的,所以这都是机器学习可以实现的一些场景。

这里面其实可以用一些组合的方法提高实现的更好,比较直接的很轻松早期的物理加统计的一方法,其实在APC里面已经很多地方都用到了为什么会存在的,就是说在很多的工业过程里面呢,其实大家都会预期的输入和输出都应该是一个完美的情况,但实际上,但输入和输出之外还有很多的我们叫变差,变差其实就是一些干扰因素会影响输出的一个稳定性,所以在这里面的其实就可以利用到统计加这个物理的一个方式,把物理的模型和实时的一个数据结合起来,得到一个预期的一个输出,把这个输出和真实的输出做一个残差的一个分析,根据残差的一个分析结果,建立和这个物理的输入之间建了一个抑制关系 ,通过这种抑制关系,最终实现过程稳定。

那现在大家一也有一些尝试的方法把物理加统计再加机器学习混在一起,就是基于物理模型,分析模型和机器模型其实可以取到一个更好的一个精确的一个预测结果,怎么讲?其实这里面其实我们看得见的就是早期的这种模型的 包括统计,包括这个机器学习,都需要大量的样本但是如果像刚才我说的就是你把物理的模型结合进来,其实你想做一个预测,你不需要太多的历史的数据样本,你可能只需要在这个基础上,在这个物理模型基础上,再结合一定的数量就可以实现一个非常精确的一个预测,所以这里面其实也是有一定的这个发展的这个趋势。

那我们刚才说了那个数据分析,那再看一看就是说最终大家怎么去应用这些数据分析,其实应用数据分析,只是说我们怎么去是在应用里面来使用了这个结果,使用到这个结果就是我们把刚才我们采到的实时的数据,包括我们的经济模型分析的这种结果数据,以及来用这种开发工具来去开发一系列这种我们家数字孪生的这种智能的应用,实现这种我们就要几个特性的这个功能,数字孪生它包括呢,就是我们刚才说的具备四个特点 ,就是具备比方描述性,包括这个我们叫诊断性,包括这个预测性,包括措施几个这方面的一些特点。描述性就是我们大家现在主要提出的一个阶段就是我们实施的状态监测,包括可视化报表。诊断性就是说我们要做海量数据的关联的分析,包括做事件的数源 就这样从历史数据来去找出关联关系来去找出这种问题产生的原因预测呢,其实就对于我,无论是我们这单指标的预测,还是说这个我们家窝TF的这种组合的判断其实都叫预测,通过这种预测来去找出潜在的改进的空间来去实现这个,这个我们叫全过程的控制。然后措施性的,其实就是他会基于预测的一个结果给你一系列的分析的结果,让你去选择最优的一个决策,这个相对就更智能一点了,可能会主动帮你去推荐一些各方面的评价指标更好的一些改进的措施。

所以数字孪生其实是一个抽象的概念,它都具备这方面的这四个类型的一个属性了 。

(2)数字孪生

再讲一下数字孪生,因为之前我写过一篇文章,大家可以去网上搜一下那个我是关于数字孪生的一些观点。其实数字孪生,因为大家提的概念比较多,又是又跟CPS混合在一起,我个人觉得它跟CPS区别不是特别大,更多是在于怎么用数字化的方式,结合数据分析来去建起来一个人可以理解的一个方式来去解释这个物理资产过程里面的潜在的不可感知的一些问题 ,所以对数孪生的定义呢,其实有很多种,Gartner的定义呢,它是一种动态描述的软件可以接收这个传感器的数据,其实响应提高这个操作的一些效率。那LNS的解释呢,它是对一种对资产过程价值人的这种这种虚拟表现形式 ,构建的数据,数据模型和行业知识的基础上,结合物理化学热力学的各种原理利用先进的分析来去创建和 这个安全的操作这种底层的这种资产,支持有效的决策和优化和业务产出。那机翼在早期的提了一个三维一体的这种软件,我也比较认可,它包括了三个方面,一个是资产的模型 一个是数据分析,第三是行业知识 。他把这个三个里面有效的结合在了一起 然后来定义出来一个数字孪生,所以数字孪生,其实放开来呢,他是一个概念,它并不是一个实实在在的一个东西 。他可以存在我说无论是企业的我们叫纵向的这个生产过程的这个价值链,还是整个一个产品的生命周期,他都可以存在这里,它可以存在很多的系统里面,包括一些指标监控包括一个这个带有这方面的一些供应链上面的一些指标预测,这个其实都可以看承受表现的一部分。所以呢,我们就数字孪生的不只是简单的3D可视化,在这基础上呢,他一定会包括描述型,它就包括很多的指标,这个指标地可能包括一些直接可以测量的指标或者包括一些直接指标,计算出来的间接指标,或者说在这个基础上,再通过模型开发出来我们叫虚拟的指标,这都是描述性,通过一系列指标来描述这个资产的相关相应的一些状态。而在这个基础上呢,你还可以加入很多的分析,做指标趋势预测,What-if预测和组合的模拟。然后最后呢,我认为未来的目标一定是像自动驾驶一样,它会形成一个自制性的一个DT,随着数据的积累它会自动的学习,知识的沉淀形成自我优化交接过程中,这个越往右边其实智能化的DT会越充分。

再说一下数字孪生他的三个关键的部分,其实我比较认可最后的那个概念,它包括了资产的模型,数据分析和行业知识。资产的模型其实就是包括我刚才说的各类的资产的数据模型,这场层次关系关系模型,包括全生命周期,来去做统一的描述,他是可以数字化的这样描述出来的 。第二是在这个基础之上的,我们叫运用相应的行业知识,行业知识包括控制保险,维护策略包括涉及保险,包括历史经验,这种我们都要行业的知识知识的基础 ,然后之上的才去结合分析,各种统计进去学习和这个物理的一个分析方法,从数据中发现价值。

(3)数字智能应用

所以到最后一个阶段我们怎么来继续用这个数据或者说给予这个数字孪生我们怎么来去开发相应的应用。回到那个那张图,其实这个图要从我们前面的数字 不同的L1L0到S的S295的这个模型里面抽取下一个数据 ,在平台上开发出来相应数字孪生的这样的一个对象 然后把它应用在不同类型的数字智能应用里面,我给大家去简单举个例子就说数据智能应用包括哪些类型,第一个类型呢其实我们叫企业制造智能,我们说了这种企业的这种制造的这个指标呢,其实原来的很多的程度 特别是一些离散制造的情况下,其实很多时候去来自于很多不同子过程的一些数据的填报,所以在这种情况下,你很难能满足一个真实性和实时性的一个要求,就有很多的连续生产,比方说流程类的一些言行产他可能要求我们生产指标会从实时的设备里面去提取, 通过这种实时的计算我实时的这个报警来去形成相应的角色的一些能力,这个叫实时的计算 。

那第二块我们举个例子就是库存的预测 早期的库存其实会受非常多的限制你的 市场的需求,包括你客户的一些订单,包括你的供应链的一些这个上下游的一些这个实时到货的情况,包括一些残次品,质量,包括一些停机这些东西可能都会受到影响,所以你没有办法精确的预初了预算出来抢单以及对应的,我们需要的这种情况下其实可以已经有人在利用这种神经网络,把很多历史数据输入的因素和限制条件来去做相应的训练,来去构建起来一个从输入到输出之间的一个模型,基于这种历史数据实时的去推测出来 在这种输入和约束条件不断变化的情况下,我们应该采取一个什么样的最优的这个库存的策略。这那第三就是在线的SPC稳定性控制,很少有人把它用在了实时在线的检测,在线检测其实我们现在用的更多是比如说良率检测,今天开始机械的过程能力指标没有办法直接把这些检测指标的一些无论是控制还是说他的结果直接反馈到产线的实时运转的这个过程里面,所以这都是一些限制。但我们看得见的很多的SPC的厂商在逐步推进这个事情就是把实时的数据的检测,包括实时的能力,比较ocp这个过程能力的指标的一个计算,都变成一个实时的它并不复杂,但是它可以基于历史数据作修正,比如说前一个批次的这个控制的文献会做调整,那自然他这个会学习到这样的调整就形成更全新的这种控制文献和这个 相应的过程能力的比较了 。

第四个例子是我们基于机器学习的虚拟量测,这个其实是在半导体行业里面新出来的概念 因为在这种连续的生产过程中呢,其实会有一个时间差的区别就是在你的质量 对一个特定的批次里面的质量检验的指标和你的真实由于真是产生这种瑕疵的这些工艺的指标或者控制参数指标之间网络会有一些偏差 。现在大家呢,慢慢就形成一个方法就是这个方法也是基于机器学习,我们建立一个跨时间维度,跨空间维度的这样的一些这个模型这个模型是在于我有大量的这种输入的工艺参数的数据和大量的检测的这个批次的数据,一旦能找到他们之间的关联关系,我们就可以建立一个跨时间维度的这样的模型,那就可以在几天甚至几周之前我们当工艺参数发生一些变化的时候就可以预测到这个批次这个产品在今天之后甚至几周之后他产生的一个量率的问题 ,这个叫虚拟量率,其实在半导体和还有一些光电行业里面其实已经在逐步推广使用了。

那我再给大家去讲一个例子就是Google从2011年开始,一直在利用神经网络来去解决这个数据中心的耗能问题,大家也都知道这个数据中心耗能是一个非常大的难题,就是因为它涉及到环节非常多,但改进的参数有非常多,动态的负载变化又非常快 所以他有几千甚至上万个不同的一些参数,但他的最终的目标就是要改变我们pue,现有的手段,包括很多的比如说加一些这个空调的一些专业空调的一些通风的一些改进,包括一些冷凝,还有这些手段其实已经用到极致,最多也就在1.1水平 ,但是在Google借助这几年一直跟的DeepMind有合作,在不断这个物理的这个改进的措施基础上用利用这种神经网络把大量的负载包括一些这个就是供热包括功能的一些参数的一些数据,包括 一些环境的一些参考的数据都送到一个神经网络里面,利用这种我们叫增强学习的一个方式,形成一个判决的一个机制,机制会去判断非常多的一个组合,这个组合在这种以10亿级别的这种情况下,通过大量的gpu的计算,来计算出来很多的这个组合看看哪些组合是满足我们的限制要求的 挑出来一部分来去做实施家政情况下实现了据说有40%的一个提升,这个确实比较比较吓人,但是有宣传成分,但我相信一定有提升,所以下面大家可以看得见从他打开这个这个机制到关掉这个机制之间,确实Pue取得比较大的一个降低了。

然后还有一些应用呢,就是一个在美国那边会有一个新的一个创业公司叫Verdigri,其实他在做的是能源管理,能源管理很多时候其实是要对一个住户,或者说一个工厂的一个车间的不同设备来去做比较精细化的一个提取,但是早期的提取你要在每个设备上去加相应的能填表,然后你才能比较精准地得到这样的一个判断。这个呢对这些企业的了解哪些设备真实的运行情况又不用增加额外的太多的一些分布式的一些测量的仪器,这个效果非常明显。

那再往下一点,是基于机器学习的一些预测性维护,这里面其实早期的一些维护,大家相对来说就是基于这种报警规则,就是一些固定的文献来去做了这种维护策略。现在呢,很多的厂商一个方式其实就是在基于传感器的历史的变化的趋势,从不断变化的一个基础上来学习一个我说变化的python 。一个是正常的状态和这个一些异常状态 当这个当前的状态是正常的,在这个normal就是正常状态之外,他就认为是一个异常,并且在早期能够提醒做出相应的这个人员干预,根据人员的干预来去对这个设备做早期的一些维护 。

5、建议

那最后呢,给大家一些建议吧,分享总结一些建议,仅供大家参考。

第一建议从现在真的是要重视指标的建设,这个指标建设是来自于你要把这个钱上面的经营的指标,从人才的一些而且财务的一些经营指标逐步逐步细化到每一个生产单元,每一个维护设备,每一个库存指标,每一个质量指标的这些包括安全合规的指标的一些数字化的这个基础上,才叫有有效的一些落地,然后这个你这些的数据都来自于很多我们说早期,你没办法来从独立的子系统抽出来的数据都要通过LoT,就能融合的这个数据平台来实现这种指标的统一的管理和统一的服务来去支撑起来上面的,无论是生产还是库存还是质量维护安全这一类的指标的统一的监管和计算。

然后第二就是重视数据平台的一个建设,因为大家可能早期在工业里面可能遇到的更多是一些独立化的一些系统,这种系统可能就是来自于不同的什么质量,还有安全,这些的系统里面,所以这些数据都会散在很多的独立的系统里面,所以从现在开始其实就应该要开始重视这种数据平台的建设。

然后第三个建议就是建议大家对数字化转型这个概念就是不要太犹豫,这个因为真的是能够产生很大的效果,即使要尽快动手呢也需要遵循一些手段一些不同阶段的规划,第一阶段呢,还是要做好一个平台的一个规划,做好相应的数据的基础数据的采集,我建议呢,第一阶段在工业企业立这个项目的时候一定要开发一个相对比较容易让决策层通过的,这样的一个应用;那第二阶段呢,在这个基础上再不断的拓展新的业务系统,新的自动化系统的接入接入的越多,规范的越多,其实收效会越大,同时在这上面来展开一定的针对具体,不是大而全的,而且具体的基础的一些分析别人就是良率的分析,就是这个产能分析来展开;第三阶段在这个基础上再去生化相应的数据分析开发新的这个一系列的数据,智能的应用,第四阶段是有条件的超大型的企业可能会考虑数字化生态的一个构建基于这种服务的能力,服务市场来去开放相应的模型,相应的这个数据,构建一个数字化的一个生态。

然后第四点呢,其实国别内的事情已经非常多了,我的建议是对这种大型企业的好先把数字化专心做在企业内部再考虑对外提供服务,现在也有很多的企业其实 先数字化转型这个能力或者说是与有很多这方面的能力,他先考虑对外提供,我的建议还是先做好基本功,企业内部的需要改进的一点无论是质量还是效率,还是产能,这些指标先要数的话的方式的改进起来,从两个维度,第一是整个一个我们叫价值链的维度,你从你的供应链再到你的工厂再到你的客户交代到你的渠道,你的客户先改进起来,第二就是从整个产品的生命周期,从你的研发设计到生产制造,再到产品的服务,整个阶段利用数字化的手段来管理起来,这样效果会更明显,考虑完之后做好之后再考虑对外提供相应的数字化服务。

第五就是选择相应的长期的合作伙伴,这个长期的合作伙伴的建议一定要考虑他是否具备丰富的行业知识和背景,是否具备完整iiot的服务的能力,是否具备强大的数据分析的能力,这些其实是要你就像刚才说的,它需要建立一个长期的这样的合作伙伴关系的,所以你需要具备非常强的这样的合作伙伴能力。

6、问答环节Q&A

Q1:OT数据与IT数据融合,分析后得到的调度决策如何反馈控制OT区域的设备?如何保证OT信息的安全?

A1:我觉得应该可能讲的东西会比较多,其实大家可以去看一下信控其实解决的就是这个这类的问题,所以呢,这里面其实我觉得不是在于这个技术不成熟,而是说在里面真正的比方说解决问题的目标,你要用到什么样的一个数据 然后这个数据的结果有多少的精确度,然后基于精确度的结果,我觉得反馈OT的那边的系统其实有很多的方式,通过命令下发,通过一些其他的控制系统的回血,这些东西都是现成的一些手段,关键就是说这个事情会不会影响一些那这个生产安全各方面问题 ,这是第一个问题。那如何保证OT的信息安全 其实我是觉得也这个里面我回答不专业,因为有大量的安全的厂商在里边,但是我的其实我们也在做一定的跟这个相关的事情就是,其实我们认为信息安全的信息安全一定要结合物理安全来去解决,物理安全就是我们说的基于iiot,对设备状态的检测变化,各方面的一些脑里的地摊性的这个方式 据这个方式你们的在线的结合,对这种塞贝尔pass的一些的解析,我把两个的信息结合起来,才有可能去形成比较精确的一个判断,或者就会会产生非常多的一些误报的情况。

Q2:请问中国企业数字化转型的预测趋势是什么?

A2:这个呢,就是有点太大了 我是觉得中国企业目前来说,还是在走在这个数字化转型这个早期阶段,早期阶段其实是我是觉得有非常多的机会,也有非常多的疑问分不同的行业,有些行业可能比较走的比较早,有些很少的比较快,其实有些行业已经在我们看得见有些行业已经在做了很大的一个这个转型或者说已经是数字化了,但是有些行业其实还是有点早,比方说很多的行业已经是非常少的,像半导体这个行业其实天生就是数字化的一个这个生产制造过程他,他没有考虑过它是需要什么数字化转型,但有些离散行业可能现在还处于这个机器换人 然后像自动化设备的这个阶段,所以还离这个事情还有一些早。

全部评论
讲师/助教

评论

直播日历