数据描述历经三个阶段:概念设计、逻辑设计和物理设计。
概念设计和逻辑设计的术语对应关系:
概念设计 | 逻辑设计 |
---|---|
实体(客观存在、可以互相区别的事物称为实体) | 记录(字段的有序集合称为记录) |
属性(实体有很多特性,一个特性称为一个属性) | 字段(标记实体属性的命名单位) |
实体集(性质相同的同类实体的集合) | 文件(同一类记录的集合称为文件) |
实体标识符(能唯一标识实体的属性或属性集) | 关键码(能唯一标识每条记录的字段或字段集) |
物理设计中的数据描述即为:位、字节、字、块、桶、卷。
数据联系的描述:
联系:是实体键的相互关系。与一个联系相关的实体集个数,成为联系的元数。例如有一元联系、二元联系、三元联系等。
根据数据抽象级别定义了4种模型:概念数据模型、逻辑数据模型、外部数据模型和内部数据模型。
表达用户需求观点的数据全局逻辑结构称为概念模型。概念模型的抽象级别最高。
现在采用的概念模型主要是实体联系模型(ER图)。ER图有三个基本成分:
概念模型的四个特点:
表达计算机实现观点的DB全局逻辑结构的模型称为逻辑模型。
逻辑模型具有下列特点:
逻辑模型主要有层次、网状、关系和对象模型四种。
项目 | 层次模型 | 网状模型 | 关系模型 | 对象模型 |
---|---|---|---|---|
创始 | 1968年 | 1969年 | 1970年 | 20世纪80年代 |
数据结构 | 复杂(树结构) | 复杂(有向图结构) | 简单(二维表) | 复杂(嵌套、递归) |
数据联系 | 通过指针 | 通过指针 | 通过表间的公共属性 | 通过对象标识 |
查询语言 | 过程性语言 | 过程性语言 | 非过程性语言 | 面向对象语言 |
优点 | 与文件系统相比查询效率较高 | M:N联系容易实现查询效率较高 | 操作简单,数据结构简单 | 具有丰富的表达能力 |
缺点 | 只能表示1:N的关系;层间关系复杂程序编写复杂 | 数据结构复杂,编程复杂 | 复杂问题领域不如对象模型 | m模型相对复杂,涉及的知识比较多 |
表达用户使用观点的DB局部逻辑结构的模型称为外部模型。
外部模型有以下几个特点:
外部模型的优点:
表达DB物理结构的模型称为内部模型。
内部模型又称为物理模型,是数据库最底层的抽象,它描述数据在磁盘或磁带上的存储方式、存取设备和存取方法。内部模型是和硬件和软件紧密相连的。
从用户(或应用程序)到数据库之间,DB的数据结构描述有三个层次:
三层模式体系结构有三个特点:
数据独立性是指应用程序与数据库的数据结构之间相互独立。在修改数据结构时,尽可能不修改应用程序。