IOT语义互操作性之本体论

这个系列文章描述了一个单一的语义数据模型来支持物联网和建筑、企业和消费者的数据转换。 这种模型必须简单可扩展, 以便能够在各行业领域之间实现插件化和互操作性。 对于一个目前从事智能硬件的老码农,觉得这些文字具有积极的参考意义。在这第二部分, 尝试确定上层本体在解决元数据挑战中的作用, 以及如何能够提高可伸缩性。

“There are two words for everything.” – E.V. Lucas

什么是本体论?

本体论作为科学的一部分, 有很多面孔。 起初, 本体论是关于"存在"哲学的一部分, 也是描述世界的物体、现象和规律的通用知识体系。

近年来, 本体论的发展已经从人工智能领域转向语义网。 网络上的本体论, 包括从对一般网页内容(如 schema.org)进行分类, 到销售产品及其功能(如亚马逊网站)。

作为语义互操作性的促进者, 本体提供了与特定领域(例如医疗保健)元数据标识符相关的概念,提供了一个标准化的分类。 本体虽然包含了分类学和词库的特性, 但在术语和属性之间使用严格的语义关系, 目标是以机器可读形式来表示知识(图15)。 [7]

[图15 | 语义层次]

用于开发本体的方法对于促进可伸缩性至关重要, 必须考虑所有相关的应用程序。 本系列文章考虑的应用包括五个相互关联行业的商业和物联网使用案例——房屋、能源、零售、医疗和运输及物流。

虽然句法语言(例如 OWL、 RDF 和 RDFS)可以用来构建本体论, 而本节将关注与任何特定建模语言无关的方法论。

一致性的受控词表

受控词表是经过精心挑选的词汇和短语(即术语)的集合, 这些词汇和短语在不同的语境中都被赋予了明确的含义。 一个词汇表可以用来保持本体发展的一致性, 它定义了术语背后的上下文关系。

登记中心控制的词汇表中的所有术语都有一个毫不含糊的、非冗余的定义。 如果多个术语可以用来表示同一事物, 则应将其中一个术语定义为受控词表中的首选术语, 其他术语被列为同义词或别名(见图16和IOT语义交互性之词汇定义)。

[图16 | 別名和翻译的受管制术语]

受控词表应该为全球应用提供各国家语言支持。 代表知识领域内术语的标准词汇可以从各种组织(例如 lov.okfn.org)免费获得。

对每件事物都有一个对象类

本体可以通过一组类来提供域概念的标准化分类。 每个类(概念)都可以表示可以唯一标识的类似事物或对象的类别。 类被定义为反映其对象(实例)所独有的属性、限制和关系。 类可以表示物理对象, 例如传感器和人员以及信息对象, 例如商业交易[ ISO 11179]。 一个本体, 连同一组个别的类实例, 构成一个知识库。 [8]

一个类的层次结构

像分类法一样, 本体可以在分层结构中定义其类, 这种结构可以根据需要进行深度定义(图17)。 类(如传感器或执行器)可以是另一类(设备)的子类(类型)。

[图17 | 本体的层次结构]

所有子类都继承类的属性。 例如, 如果 Power 状态是设备类的一个属性, 那么所有传感器和执行器对象都会有这个属性。

属性在适用于其所有对象(包括子类)的最普通类附加一个属性。 由于所有类都是对象的类型, 所以类层次结构有一个根类, 即对象, 它包含所有对象继承的标识符(一个 O-DEF 分类属性)(见图19)。

虽然这种方法与面向对象程序设计相似, 但它代表了从编程中抽象出来的元数据。 代表本体的元数据可以在一个存储库(ISO 11179)中从任何编程环境中抽象出来。

跨行业领域互动的最高层

顶级对象类(例如 ODEF 核心索引)可以促进不同领域(如建筑物、零售、医疗保健)的数据交换和互操作性, 因为它们确保以统一和语义兼容的方式使用基本术语。

本系列文章中确定的各组织机构语义数据模型包括了支持其目标行业和使用情况的最高级别类别(图18)。

[图18 | 各联盟的顶级对象类]

虽然术语可能不同, 但各联盟集团有许多基本概念(类)。 这些概念的"混合"可以形成一个能够支持行业的特定用例和跨行业互操作性的上层本体(图19)。

[图19 | 混合、跨行业顶级等级]

根对象类的名称和描述属性可以描述这些顶级类, 并包含在术语表中:

  • Information Model 资讯模型
  • Asset 资产
  • Product 产品
  • Location 位置
  • Party 派对
  • Transaction 交易
  • System 系统
  • Process 过程
  • Rule 规则
  • Event 活动
  • Relationship 关系

虽然个人和组织被一些财团模型(O-DEF, schema.org)认为是顶级的类, 但它们都是商业模式中一个Party概念的子类(GS1 EDI, ARTS ODM)。 缔约方类包括人员和组织共有的属性, 并允许一个类与业务事务和其他关系关联。 [9]缔约方能够拥有法律所有权, 并且可以与根对象类的所有人属性有关。 缔约方实例可以拥有有形(车辆)和无形(销售订单)对象。

尽管在这些联合体中没有明确定义, 但在这种混合方法中包含了一个顶级关系类, 可以从定义多对多关系的任何特定本体语言中抽象本体。

信息模型的类

信息模型作为一个知识领域, 可以有自己的本体, 可以建立一个多层次的本体论。 信息模型顶级对象类(ODEF Information-set)可用于包含定义信息模型的子类(图20)。 其中包括:

  • Data Type 数据类型
  • Measurement Unit 测量组
  • Attribute 属性
  • Vocabulary Term 词汇词汇
  • Role 角色

[图20 | 一个信息模型类层次结构]

数据类型的本体

数据类型和测量单位(如 QUDT.org)的本体论可以为商业和技术提供基础语义互操作性。

数据类型类可以作为信息模型的子类来建模。 基于数字电子学的所有数据都表示为最低级别的比特(0和1) , 数据类型类的比特属性可以由所有子类继承。 数字和字符串是原子数据类型(数据类型类的直接子类) , 因为它们的值不能用较小的部分来描述。 Integer 和 Float原语可以定义为数类的子类(如 schema.org)。 标准组织已经定义了原子和原始数据类型(例如, ISO.org 11404, W3.org XML Schema) , 但是它们之间的不一致是难以管理的。

具有唯一属性的附加数据类型(如数量)可以从原始数据类型中派生出来, 并定义为它们的子类。 然而, 在编程语言和组织数据服务中, 具体的原始数据类型和派生数据类型的使用情况各不相同, 限制了语义互操作性(图21)。

[图21 | 联盟组织的数据类型]

一个术语的数据类型

一个术语数据类型(类似于 Haystack 的"marker")可以被属性(类似于 Haystack 的“tag”)来分别与对象类层次结合使用。

与受控词表一起使用时, 术语属性的值可以表示一个 Term 对象。 例如, 在图19中, 根对象类的 Name 属性分配给术语数据类型。根对象类Name 属性的值与受控词表中的"对象"项有关(图16)。

术语的概念也可以作为信息模型的一个子类(图20)。

关系的数据类型

关系数据类型(类似于 Haystack 的"Ref")可以分配给一个属性, 以表示与同一个或不同类对象的关系。 例如, 根对象类的类属性分配给关系数据类型(图19)。 属性类的"内部类"属性也分配给关系数据类型(图20)。 在这种情况下, 关系表示在类对象中对属性对象的限制。

分配给关系数据类型的属性应该仅限于单个类中的对象, 这应该是适当反映关系的最严格子类。

用于测量的数量数据类型

商业和技术依赖于经过测量的数字, 其中大多数都有单位。 数据类型本体可以定义一个测量的数据类型(scheman.org中的数值)来作为数据类型的子类。 数据类型也可以定义为量数据类型的每个类型或"维度"的测量。 例如, 图21中的一个温度数据类型(UN/CEFACT Temp-Measure类型)可以定义为数量子类的实例。

通过将货币量建模是另一种测量类型, 包括值转换在内的过程可以在所有测量类型中归一化。 一种机制(类似于 xe.com)可以用来检索与货币单位相关的转换因素(货币兑换率)的动态价值变化。

一个测量单位的类

最广泛使用的单位系统是国际单位制, 即 SI。 ISO 80000-1进一步定义了 SI 和国际数量体系(ISQ)的数量和单位。

单元类可以作为信息模型的子类来建模。 图22显示了数据集 中每个对象继承的对象类的属性(标识符、名称、类)。 该图还包括由对象的类属性标识的类(单元)属性。

[图22 具有对象和单位属性的单元类示例实例]

一个单位标识符(如 华氏度)与数据集中的数量值(例如 Haystack 标记数据)配对, 可以在所确定的单位对象内解析一个数量数据类型(如温度)。单元对象的属性也可以支持单元转换过程(图23)。

[图23 | 使用带转换属性的单元实例进行温度值转换]

对象的角色

角色的概念(如 O-DEF 中的概念)描述了一个可以由特定上下文中对象执行的函数。 角色类可以作为信息模型的子类来建模, 并且可以包含适用于不同对象类的实例(图24)。

[图24 | 具有对象和角色属性的角色类示例实例]

关系类中的一个实例可以将角色的实例分配给对象。 一个对象可以有多个角色。 例如, 一个人的实例可以有员工、父母和乘客的角色。 一种设备的实例可以是传感器和通信器。 许多设备的目的是承担与人相同的角色。 因此, 角色可以分配给对象类。

一些角色(客户)有一个相应的反向角色(供应商)。 当一个客户角色被分配给一个缔约方(以 ARTS ODM 为模型)时, 将相应的供应商角色分配给另一缔约方以形成贸易关系。

References

7 Harpring, Patricia, “Introduction to Controlled Vocabularies”, 2010 J. Paul Getty Trust.

8 Noy, Natalya F. and McGuinness, Deborah L. “Ontology Development 101: A Guide to Creating Your First Ontology”, protégé.Stanford.edu, 2001.

9 Hay, David C., Data Model Patterns: Conventions of Thought, Dorset House Publishers, Inc. (New York: 1996)

原文发布于微信公众号 - 喔家ArchiSelf(wireless_com)

原文发表时间:2018-02-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏张俊红

Python面向对象编程

24150
来自专栏牛客网

吉比特面试经验 游戏研发岗实习生

38100
来自专栏落影的专栏

程序员进阶之算法练习(十一)有感而发

前言 经过这几年的观察,我发现,国内本科高校的ACM集训队,往往汇聚着该校相对靠谱的那一批人。 拿本校举例,队内的众学长学姐毕业之后,有去国内top2的高校...

382100
来自专栏程序员互动联盟

【答疑解惑第三十八讲】初学者做项目需要掌握哪些东西?

疑惑一 【答疑解惑】初学必须掌握的数据结构有哪些? 数据结构有很多,难以程度也不相同,初学者应该掌握哪些基本的数据结构呢?作为一个过来人,我觉得作为一个初学者应...

36080
来自专栏贾志刚-OpenCV学堂

图形图像算法中必须要了解的设计模式(2)

AI越来越火热,人工智能已然成风!而人工智能最重要是各种算法,因此机器学习越来越受到追捧,算法越来越被重视。

11720
来自专栏take time, save time

你所能用到的数据结构(二)

      周末开始更新了,首先感谢各位对我写的东西还能保持兴趣,先回答几个留言中的一个问题和我对无损编码那一节的一个留言的一个看法,第一个是推荐算法书,首先,...

32260
来自专栏tkokof 的技术,小趣及杂念

Sweet Snippet 之 Bounce Setting

  又是一篇Sweet Snippet,自己看来都觉得过小,不足以成篇,不过自觉有些趣味,也就随便记一记了,权当自娱自乐 :)

7310
来自专栏机器学习算法与Python学习

长文 | 手把手教你如何使用python进行数据分析(最好将文章代码自己码一遍)

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 原文 http://www.cnbl...

40150
来自专栏数据结构与算法

Day2上午解题报告

预计分数:100+0+60=160 实际分数:100+0+60=160 mmpT1数据错了。。。 T1遭遇 题目描述 你是能看到第一题的 friends呢。 —...

46940
来自专栏swag code

荷兰国旗-快排应用

”荷兰国旗难题“是计算机科学中的一个程序难题,它是由Edsger Dijkstra提出的。荷兰国旗是由红、白、蓝三色组成的。

10220

扫码关注云+社区

领取腾讯云代金券