集成的方法
集成产生的冲突及解决办法
转成笛卡尔积
非规范化的关系模式,可能存在的问题包括:数据冗余、更新异常、 插入异常、删除异常
第一范式(1NF):在关系模式R中,当且仅当所有域只包含原子值,即 每个属性都是不可再分的数据项,则称关系模式R是第一范式。
第二范式(2NF):当且仅当实体E是第一范式(1NF),且每一个非主 属性完全依赖主键(不存在部分依赖)时,则称实体E是第二范式。
第三范式(3NF):当且仅当实体E是第二范式(2NF),且E中没有非主属 性传递依赖于码时,则称实体E是第三范式。
BC范式(BCNF):设R是一个关系模式,F是它的依赖集,R属于BCNF当且 仅当其中F中每个依赖的决定因素必定包含R的某个候选码。
保持函数依赖分解
设数据库模式ρ={R1,R2,…,RK}是关系模式R的一个分解,F是R上的函数依赖集,ρ 中每个模式Ri上的FD集是Fi。如果{F1,F2,…,Fk}与F是等价的(即相互逻辑蕴涵), 那么称分解ρ保持FD。
无损分解
有损:不能还原。 无损:还可以还原。
日志文件:事务日志是针对数据库改变所做的记录,它可以记录针对数据库的任何操作, 并将记录结果保存在独立的文件中
联邦数据库系统(FDBS)是一个彼此协作却又相互独立的成员数据库(CDBS)的集合,它将成员 数据库系统按不同程度进行集成,对该系统整体提供控制和协同操作的软件叫做联邦数据库管理系统 (FDBMS)
联邦数据库特征
联邦数据库分类
NoSQL(Not-only SQL):随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站, 特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心了,暴露了很多难以克服的 问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展
由于规范化会使表不断的拆分,从而导致数据表过多。这样虽然减少了数据冗余,提高 了增、删、改的速度 但会增加查询的工作量。系统需要进行多次连接,才能进行查询操 作,使得系统的效率大大的下降
技术手段
内存数据库抛弃了磁盘数据管理的传统方式,基于全部数据都在内存中重新设计了体系结构,并且在数 据缓存、快速算法、并行操作方面也进行了相应的改进,所以数据处理速度比传统数据库的数据处理速 度要快很多,一般都在10倍以上。内存数据库的最大特点是其“主拷贝”或“工作版本”常驻内存,即 活动事务只与实时内存数据库的内存拷贝打交道 常见的内存数据库包括:Redis、eXtremeDB、TT、FastDB、SQLite、Microsoft SQL Server Compact 、 MySQL的MEMORY存储引擎等。
大数据处理系统应该具有的重要特征