首先,今天的文章可能比较难懂,备份和归档这两个概念很容易搞混,拜托大家一件事情,如果您有认识的制药分析设备业内的数据架构专家,可以将这篇文章转发给他,我希望可以和他们有一个深入的沟通和探讨。
昨天,参加了一个业内领先的备份软件的培训,与工程师进行了深入的交流,但是自己心中的这个问题还是没有明确的答案,所以借这个平台,向大家请教,据工程师所说,法规并没有明确定义备份需要保存的期限,更多的是不同企业自己内部的规定,法规定义的记录保存时限往往针对的是需要归档的数据,而非备份数据。
之前的文章中分享过Backup & Archive也就是备份和归档的区别,备份与归档的最大的区别在于其目的的不同,备份是为了系统发生灾难或者数据异常时的恢复,通常情况下理解,备份并不需要保留太长时间,而归档则是按照文件保留的要求,制订的长时间的文件保存期限的要求和策略。
参见以下MHRA数据完整性指南最新版中的两段定义:
备份和归档都属于数据的保存阶段,归档在于长时间保存数据,备份在于对动态数据进行保存,以用于灾难恢复。
备份的定义强调了备份的对像是Current和Editable的数据,当前的和可编辑的数据,元数据以及系统配置,同样备份的目的在于灾难恢复。
很多时候备份和归档之所以容易搞混,在于系统中的动态数据和静态数据本身就没有一个很明确的区分,从数据库的设计来说,不敢说100%,至少我好像没有见过数据在动态状态下保存在一个数据库中,在静态状态下又保存在另外一个数据库中的情况。
举个很简单的例子,当你的HPLC图谱经过系统中的第二人批准后,理论上这个图谱就不允许再被修改了,这个图谱应该就已经是静态的数据了,但是这个数据往往从前端看还是写在你当前正在运行的项目中。
不知道数据后台的逻辑是不是已经写入到了另外一个数据库中,正是由于系统架构上的这种设计缺陷,或者说有些供应商的软件本身具备数据归档的功能,但是这个功能可能在日常的业务活动中又没有很好的定义,所以造成了系统中实际的情况是动态和静态的数据混在一起。
在这种情况下,如果要执行备份的话,只能指定相应的路径去做备份,做出来的备份也是一定是动态和静态的数据在一起的。
对于动态数据和静态数据采用同样的备份策略肯定也是不合适的,举个最简单的例子,如果数据的归档动作是定期的,那么在没有发生下一次归档动作之前,你所归档的数据可以理解成是完全相同的数据。在这种情况下,对于归档数据的备份策略更多的应该基于数据的增加,而不是每天或者每周去做一个全备份,这样其实会造成很多的资源浪费。
好了,说说你对备份和归档的看法吧,期待能为行业做出一些改变...
本文来自企鹅号 - PharmaGMP媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文来自企鹅号 - PharmaGMP媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。