在国内,疾控中心、公卫以及临床科研人员使用频次很高,流行病学资料和临床病例收集资料在录入时既高效、便捷又能够降低出错概率低。
2015年12月份开始接触该软件,两年时间做了20个库左后,3个硕士毕业论文数据库(分别为病例资料、流行病学资料、普通调查表),以及医院和疾控相关数据库10多个,感触最深的4点:
(1)一个优秀的数据库需要后期的精雕细琢;
(2)不拘于原始资料的限制,重新编写QES文件;
(3)注意变量之间的逻辑关系;
(4)细心设置CHK文件,减少出错概率。
近期,有一个2000多条数据的Excel文件,变量大概40个,计划做一个EpiData数据库,来录入后期数据,现在的问题:前期的2000多条数据怎么完整的回到数据库中呢?而EpiData默认导入文件格式为TXT/DBF/SAS,在导入过程中很难控制变量。将Excel转成DBF格式导入EpiData中可能会出现下图的情况,只有变量,不在是完整的数据库,情况很糟。
【具体操作步骤】
Step1:先在原始数据库中录入1条数据或者不录入,我们在原始库中录入2条数据,方便整理Excel中的数据,录入完毕导出并保存为Excel格式,整理数据时要按照导出数据的结构整理,特别注意CHK文件质控要求。原始库导出后有2条数据(李一、张四),我们在Excel中再录入2条数据(李二、李三)。
(数据中信息为自己虚设)
Step3:打开EpiData软件,查看EpiMate软件保存后的REC文件,此时发现Excel中的数据已经导入库中,最后检查数据,检查数据,检查数据!说三遍。
文中专设置了一个错误,细心的可能会发现,只有自己正真使用了,才会发现。
领取专属 10元无门槛券
私享最新 技术干货