首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

药物临床试验安全性评价标准化数据结构的建立

摘要:回顾相关文献,确定数据库内容范围,用E—R图方法进行概念设计, 明确数据库中数据之间的逻辑关系;设立了数据集水平元数据以及关键变4量,并确定变量水平元数据以及各变量的值域和编码;本文建立的标准化数据结构,符合有关法规对安全性分析的要求且结构合理,易于应用。

关键词:标准化;数据结构;安全性评价

中图分类号:R954 文献标识码:c

文章编号:1001—6821(2006)02—0158—03

随着循证医学的发展,药物临床试验研究越来越受到医学研究人员的重视;但目前进行的临床实验的数据管理过程,都是独立完成,数据结构各不相同,给数据合并分析造成了很大困难。因此,本文建立统一的标准化数据结构,解决临床试验数据的合并与分析问 题,促进研究数据的再利用

目前,针对临床医学数据标准化的研究,在世界范围内受到了较高的关注,各国都在寻找适合自己国情,利于数据利用的书记储存交换方式。通过建立标准化数据结构,可帮助研究者在研究设计中避免遗漏重要信息;方便数据管理和统计分析,提高临床试验研究的效率和准确性。本文依据相关法规对安全性信息分析报告的要求,建立了适合我国药物临床研究实际情况,并利于数据资源利用的、药物临床试验安全性分析标准化数据库。

1、基本塬理 本文中安全性数据库的内容范围,是依据《药物临床试验质量管理规范》和《在ICH叁方协调指导塬则E3临床试验报告的结构与内容》…等有关临床试验研究安全性分析及报告的法规文件确定的。

1.1数据库概念设计

E—R图方法(entity—relationship approach,实体一联系方法是目前数据库设计中较为有效的设计方法,其将所要描述的对象,区分为相互独立的实体,并通过对各实体的属性以及实体之间的联系进行描述。本文用E—R图方法,明确数据之间的逻辑关系,完成了对数据结构的概念设计。

1.2数据结构设置

在数据库结构中,目前常用的结构包括水平型和垂直型。水平型数据结构是指将病例报告表中采集的数据点建立一一对应的变量,即每个受试者对应一条记录;垂直型数据结构是指对将病例报告表中的一类数据建立一个变量,即把试验中对相同信息的每一次测量作为一条记录。本文根据需要,选择合适的结构,建立数据库。

在概念设计的基础上,将整个数据库划分为不同的数据集,确定在各数据集之间构成数据关联的关键变量。在以上分析的基础上,定义各数据集中的元数据。

为了增加各研究之间的可比性,同时为了使研究设计更符合相关法规的要求,对一些特定的值域范围,给予统一的规定,必要时规定相应的编码,方便录人。本文用在中国卫生信息标准化工作中,已经规定的标准编码和国际上已经形成了的相对成熟的编码体系。

2、数据库建立 编制完成了《药物临床试验安全性分析数据标准化数据结构》,其主要内容如下。

2.1标准化数据结构的建立3j?5用垂直型数据结构,建立数据库,设定数据库中各数据集的内容范围,同时规定各数据集的名称,以及相应的关键变量(表1)。

2.2变量取值域及录入格式与编码

在各数据集中,按标准化数据结构统一要求,均设置了变量取值域、录人格式与编码。本文给每一种输入格式,设置了对应的名称,在针对各数据集的元数据集列表中,用这里设置的名称,指代各录人格式。用ISO 8601∞0标准,作为时间信息的录入塬则,将变量类型设置为字符型。在元数据列表中,用以上格式记录的时间信息,将在变量格式中注明TIM。2.3 数据集的元数据列表

将标准化数据结构中,各数据集的变量,按照其特征划分3类:关键变量、必须包括的变量及可以选择的变量,并用不同的标志,对以上3种不同变量加以区分。

3、数据库应用案例

用以上建立的标准化数据库结构及现有的研究数据,进行了模拟建库工作。模拟应用工作表明,本文建立的标准化数据库,能够完成临床试验研究数据的储存管理工作,并且便于数据合并。

4、讨论

关系型数据库的一个主要特征是其对数据描述的一致性,它用关系描述实体本身,同时也用关系描述实体之间的联系,成功的表达了多对多的数据对应关系,使数据的模型结构大大简化,便于操作。同时,关系型数据结构,具备了成熟的软件系统支持,使数据库的应用更加便利,来自不同研究环境的研究者均可应用。

研究中,每位受试者都有1个唯一性编号,在传统数据管理中,这类变量属性往往被确定为数值型;然而,实际上,字符型的关键变量可能更具优势。首先,字符型变量长度更灵活,并引入了更多的字符,易于表达复杂含义;而不是简单用数值的大小对不同元组进行区分。其次,字符型变量可将关键变量在逻辑上分割为不同的区间,每个区间代表1个方面的特征。再次,字符型变量与数值型变量一样具有良好的排序功能。在美国信息交换标准代码(American Standard Code For Information Interchange,ASC II)中,规定了各种字符的排列顺序,因而其排序查询功能良好。在临床实验研究中,水平型数据结构和垂直型数据结构都有较广泛的应用。

在统计分析中,2种形式的数据结构都有其重要的意义;但对数据管理而言,垂直型数据结构更适应数据管理的需求。水平数据库数据结构,造成存储空问的大量浪费旧。,降低了数据查询速度;还可能导致变量空间与实际数据不符;不利于数据的合并分析。

本文用国际标准ISO 8601作为时问数据的录人格式,有以下几方面的意义:首先,易于读取和写入,在ISO 8601所规定的录入格式中,较大的时间单位总是位于较小时间单位之前,使信息的读取更容易,因此避免因时间单位的记录顺序不相同所引起的误解。其次,便于比较与排序:由于较大的时间单位在前,在此能够实现传统记录格式所具备的排序功能。再次,由于记录格式简单,从而使记录不受软件系统的影响。在我国,各地区发展尚不均一,使用该标准应基于数据标准的推广应用。

在不同的临床研究中,安全性分析可能包含比本文更广泛的内容。例如,心电图、医学影像检查,也可能包括其他特殊的信息,这些信息相对分散,在法规中,不能作为安全性评价的主要内容出现,因此,对于这些信息的标准化;有待在今后的安全性分析标准化数据库所涵盖的内容,增加其对不同研究项目的适应性。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200513A0F73M00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券