医疗健康大数据采集技术(一)概述

期待遇见你~

#题记#

挖掘机技术哪家强,中国山东找蓝翔。万丈高楼平地起,何止需要挖掘机。

过往几年的工作经历中,唯一一点可以确定的认识,那就是为了解决问题,我们要不择(技术)手段。甚至是一个看似很小的问题,到最后为了达到一个更好的效果,都需要一套技术组合拳来应对。单单掌握挖掘机技术是不够的,铁锹、推土机、塔吊、搅拌机等等相互配合万丈高楼才起得来。

2

医疗健康大数据采集技术

背景

目前国内绝大部分的诊疗服务都是由村卫生室、乡镇卫生院、二甲二乙、三甲三乙这样的专科或综合型医疗机构来提供的,因此医疗健康数据都是在这些机构内产生的,不论是躺在房间里吃土的停留在纸张上的天书,还是保存在各个科室所使用的BS/CS的系统中。

在门诊、急诊和住院三大场景下,围绕着挂号缴费收费、药品、检查、手术和病程护理记录,没有上系统的村卫生室、小诊所大多还是手写的条子,稍微系统上的早的医院约莫都积累了上亿条以上的数据记录,存数据的盘好歹也是三四十T了吧,过百T的也大有人在。

既有卫计委等级评审、电子病历评级、医院竞争力等外部的驱动力,亦有内部临床、管理、科研等业务的需要,医疗健康数据平台的建设就应运而生了,小名也多了去了,无外乎集成平台、信息平台、大数据平台诸如此类。

早前衡主任发的一篇文章中提到,在自己调查的120余家医院里,虽然一半以上都没有开始建设类似的平台,但要建设的话,首当其冲的,摆在你面前的一座大山就是如何解决数据采集的问题,如何应对业务系统众多、供应商不配合,单单就是把所有的源数据存储起来并可供所有人访问分析的就不是件易事,除了资金投入以外,人员配置、技术方案都是很重要的考量因素。

当然也有一些医疗行业的门外汉,初进行业,但凡是想在健康管理、慢病管理、保险、互联网医院、医联医共体上一展拳脚的,都会遭遇类似的泥淖,如何把躺在系统里的数据搂到自己这边来呢。

待解决的问题域

这里我们把问题的难度下降一个层级,我们只需要存原始数据,不要求统一的格式,不要求统一的格式,不要求统一的标准。

数据都在哪里,都在这些系统里:

HIS、预约系统、护士站、PACS、手麻、LIS、RIS、血库

电子医嘱、临床路径、电子申请、住院病历、门诊病历、随访、移动医生人事、财务、后勤

数据保存的格式有哪些

医疗数据大抵目前存在的形式有两大类:

实体:纸张、胶片、磁带、CD

虚拟:文件(图片、影像、视频、txt、excel、word、csv、pdf)、数据库(oracle、SqlServer、MySQL)、web界面(html)或者客户端界面(dephi pb c# java javascript c++编写而成)

不同类型的数据,不同的采集思路

针对实体数据,我们有扫描、翻拍、驱动器读取等数字化的手段。

针对虚拟数据,我们使用的工具或系统大抵分为BS CS两种架构,采集获取数据的思路以及技术手段受限于以下因素:

1.有没有源码 有没有文档

2.系统供应商还在不在 愿意不愿意配合 接口费高不高 派来的工程师技术过硬不过硬

3.有没有数据库用户密码 数据库表结构熟悉不熟悉

4.需要不需要进一步提取文件中的数据 比如图片中的表格,pdf中的数据等等

没有厂商配合,针对BS架构的系统

从数据库、服务端到UI三个层面,都可以使用不同的技术获取数据,不同的技术各有其适用性以及优缺点。如有需要,后续文章会对每一种技术以及供应商进行详细阐述。

没有厂商配合,针对CS架构的系统

从数据库、服务端到客户端三个层面,都可以使用不同的技术获取数据,不同的技术各有其适用性以及优缺点。如有需要,后续文章会对每一种技术以及供应商进行详细阐述。

针对无法直接入库的数据

主要是针对图片、文档、视频、音频等无法直接使用关系型数据库进行分析的数据,需要额外的结构化处理。如有需要,后续文章会对每一种技术以及供应商进行详细阐述。

配图来源于:https://foter.com/

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190123G0VAUB00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券