前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MIMIC-IV,重症医学数据库介绍和使用说明

MIMIC-IV,重症医学数据库介绍和使用说明

原创
作者头像
科研收录
发布2023-07-21 13:37:21
1.7K0
发布2023-07-21 13:37:21
举报
文章被收录于专栏:mimic数据库mimic数据库

一、MIMIC IV数据库简介

MIMIC数据库就是一个可为临床研究者提供临床数据的利器。 该数据库于2003年在美国国立卫生研究院的资助下,由美国麻省理工学院计算生理学实验室、美国哈佛医学院贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center,BIDMC)和飞利浦医疗公司共同建立。

研究者可根据一定的纳排标准筛选感兴趣患者的临床信息,利用这些信息可进行后续的数据分析然后撰写文章,通过数据收集与分析可作为发表sci论文的重要依据。另外,MIMIC是一个公开数据库,所有患者的信息都经过脱敏处理,发文不需要临床伦理审查。

以下各类疾病都有涉及:

二、数据库样本量

MIMIC 数据库目前已经产生了MIMIC Ⅱ、Ⅲ、Ⅳ三个版本 MIMIC数据库包含了BIDMC所有内外科ICU患者的数据,数据团队为保护患者隐私,对患者信息进行去标识化处理,向全世界的研究人员免费开放。

MIMIC Ⅲ数据库收集了BIDMC 2001年6月至2012年10月ICU收治的53423例成年患者数据和2001年至2008年收治的7870例新生儿重症患者数据。

MIMIC Ⅳ数据库在MIMIC Ⅲ的基础上做了一些改进,包括数据更新和部分表格重构,收集了 2008至2019年BIDMC收治的超过19万名患者、45万次住院记录的临床数据。数据库记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、随访生存状态等详细信息。

MIMIC Ⅳ数据库主要有三类数据:

  • 第一类是从EHR中提取的临床数据,包括患者的人口统计学、疾病诊断、实验室检测、药物治疗、生命体征等。
  • 第二类是ICU床旁监护设备采集的波形数据、生命体征、液体管理和事件记录,主要来自于IMDSoft MetaVision系统。
  • 第三类是死亡随访数据,通过社会保险系统得到患者院外死亡的日期,作为MIMIC 数据库的组成部分,这部分数据对研究患者的预后很重要。

三、 基本字段表述

患者入院信息, 以每次入院为单位记录, 每条记录有一个单独的hadm_id, hospital_expire_flag只当次住院是否院内死亡, 部分院内死亡患者没有deathtime, 可能是数据库本身问题

Name

datatype

Description

subject_id

INTEGER

患者id

hadm_id

INTEGER

住院id

admittime

TIMESTAMP(0)

入院时间

dischtime

TIMESTAMP(0)

出院时间

deathtime

TIMESTAMP(0)

死亡时间

admission_type

VARCHAR(40)

按入院紧迫性分为9种

admission_location

VARCHAR(60)

入院来源

discharge_location

VARCHAR(60)

出院去向

insurance

VARCHAR(255)

保险

language

VARCHAR(10)

语言

marital_status

VARCHAR(80)

婚姻

ethnicity

VARCHAR(80

种族

edregtime

TIMESTAMP(0)

进急诊时间

edouttime

TIMESTAMP(0)

出急诊时间

hospital_expire_flag

SMALLINT

是否在住院期间内死亡, 1 是 0 不是

病人定义:

  • subject_id 每个患者有唯一的subject_id
  • hadm_id 患者的每一次入院会有一个唯一的hadm_id
  • transfer_id 患者每一次更换病房会有一个唯一的transfer_id
  • stay_id 在相同类型病房内进行转移,则会更新一个transfer_id,但会有相同的stay_id,例如用ICU中的一个病房转移到另一个病房,则stay_id不变,transfer_id更新。 所有id的分配都是随机的,与时间先后无关。

date and time

后缀为date的,分辨率最低为天;后缀为timed的字段,分辨率最低为分钟。

  • charttime and storetime:分别是测量的记录时间与储存时间。通常以charttime为准 d and icd 命名为d_开头,为编码表。d_icd开头,为icd编码表。icd结尾的表,为使用icd编码的记录表。

四、MIMIC-IV数据表说明

Tables

分为六个模块,Core、Hosp、ICU、ED、CXR、Note

Core

Core模块包含患者跟踪数据。这里描述了人口统计、入院信息和住院病房转院情况

admission 患者入院信息,以每次入院为单位记录,每条记录有一个单独的hadm_id

patient 患者信息

transfers 病房转移信息

Hosp

Hosp模块涵盖的信息包括实验室测量,微生物学,药物管理,和收费诊断等

  • d_icd_diagnoses 包含国际疾病分类(ICD)第9版和第10版的诊断代码。icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复,如01622和1622代表不同疾病。

d_icd_diagnoses表

icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复

  • diagnoses_icd 患者诊断信息表。seq_num代表诊断的优先级,序号越靠前越重要,而低优先级的排序有时并不准确
  • drgcodes 也是与诊断相关的表,使用DiagnosisRelatedGroup(DRG)code编码 与diagnose表中的主要诊断相对应。
  • d_icd_procedures
  • procedures_icd 患者住院期间的手术信息,包括在ICU期间的信息。
  • d_labitems 实验室检查定义表
  • labevents 病人实验室检查的记录
  • prescriptions 处方数据,药物数据
  • pharmacy 药房数据表,以pharmacy_id字段与prescriptions表相关联,相当于对prescriptions表中各处方信息的补充。 此外,还有微生物培养、收费、订单等表格

ICU

包含从ICU内使用的临床信息系统收集的信息。记录在案的数据包括静脉给药、呼吸机设置和其他图表项目等。 每个患者每次入院可能有多次icu,每次icu对应一个stay_id

  • d_items 包含ICU内发生的所有项目的编码,通过itemid字段与ICU模块内的其他表格关联。
  • ICU stays 入住ICU的时间信息
  • chartevents Chartevents包含了一个病人可用的所有图表数据,有些lab数据与labevents表中的数据重复。

ED

急诊信息,包含急诊诊断,病人体征等信息。通过subject_id和hadm_id与其他模块相连接。急诊的患者如有hadm_id,则说明该患者住院治疗。ed患者不一定住院,住院的患者也不一定从急诊入院。

  • diagnosis table 诊断表为患者提供诊断列表。从急诊科出院后确定诊断。
  • edstays table 急诊科来访的主要跟踪表。它提供了病人进入急诊科和离开急诊科的时间
  • medrecon table 在进入急诊室时,工作人员会询问病人目前正在服用什么药物。这个过程被称为药物协调,医疗检查表存储了护理人员的调查结果
  • pyxis table 提供了通过pyxis系统配制药物的信息。
  • triage table 包含病人在急诊室第一次分诊时生命体征信息
  • vitalsign table 急诊室收治的病人常规的生命体征需要1-4小时。这些生命体征保存在生命体征表中
  • vitalsign_hl7 table 急诊收治的病人可通过遥测技术进行监测。每分钟的生命体征都被传送到医院的中央服务器,这些生命体征都被记录在这里。

CXR

X光胸片文件,源数据是dicom格式,但也提供了jpg格式的下载。包含了胸片及影像学报告。值得注意的是,存在有影像的患者没有住院记录的情况。

  • cxr-record-list 影像列表
  • cxr-study-list 影响报告列表
  • mimic-cxr-2.0.0-chexpert 使用CheXpert labeler(基于影像学报告的非人工标注,斯坦福与麻省理工合作)标注了14个标签,标签如下表
  • mimic-cxr-2.0.0-split 提供了参考的训练集、验证集、测试集划分

Note

官方还未发布 (NOT PUBLICLY AVAILABLE): 所有文本报告,出院、超声、心电、影像等报告

五、官网及数据库下载网址

  • 官方介绍见 MIMIC官方网站 : https://mimic.mit.edu/
  • MIMIC-IV 数据库下载见 MIMIC-IV发布页: https://physionet.org/content/mimiciv/1.0/
  • X光胸片dicom格式数据下载见 MMIC-CXR Database: https://physionet.org/content/mimic-cxr/2.0.0/
  • X光胸片JPG格式数据见 MIMIC-CXR-JPG: https://physionet.org/content/mimic-cxr-jpg/2.0.0/
  • 急诊数据见 MIMIC-IV-ED : https://physionet.org/content/mimic-iv-ed/1.0/

Reference

  • MIMIC-IV, a freely accessible electronic health record dataset:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/
  • Python 系列 – MIMIC-IV Demo 描述性統計: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、MIMIC IV数据库简介
  • 二、数据库样本量
  • 三、 基本字段表述
  • 四、MIMIC-IV数据表说明
  • Tables
  • Core
  • Hosp
  • ICU
  • ED
  • CXR
  • Note
  • 五、官网及数据库下载网址
  • Reference
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档