首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一入数据深似海

「 这是香草续约的第

38篇原创文章 」

进入21世纪,随着计算机、互联网技术、云计算、移动终端、数据储存方式的高速发展和变化,大数据时代扑面而来,它正在强烈冲击着我们社会、生产和生活的方方面面,带来了生活、工作与思维的大变革。

医学和其他领域一样,在经历了仅依赖经验、理论、假设和价值观去发现未知世界的规律的“无数据时代”和通过有意识地收集数据,依赖抽样数据、局部数据和片面数据,支持相关的判断和决策的”样本数据时代“后,开启了一次重大的时代转型——医疗大数据,or真实世界大数据。

今年在北京召开的第三届中华医学事务年会在会议第一天有一个”大数据有效证据指导临床实践“专题研讨会专场,会议场外休息之处被国内医疗大数据公司展台挤爆了;今年6月底在上海即将召开第二届真实世界临床研究峰会,届时又是一场关于真实世界大数据应用的巅峰讨论。

现在负责临床研究的人,也都或多或少跟大数据沾上了关系。医疗大数据公司如春笋般拔地而起,也有很快就消失在破产清算边缘。”大数据“也正在成为医疗行业里越吹越大的一个泡沫,不过行业的发展确实需要资本来助推,斑斓的泡沫在不断吹大和破裂中才能清洗一条属于医疗大数据的出路

说了这么多,大数据到底是什么?

维基百科说,大数据是指难以用现有的数据库管理工具处理的兼具海量特征和复杂性特征的数据集成

也有人说,大数据技术描述了新一代的技术和架构,通过启用高速捕捉、发现和分析技术,从大量的各种各样的数据中提取有价值的信息

还有人说,大数据指的是数据的数量、采集速度或者那些无法用传统的方法来进行有效分析的数据,或者是可以用重要的横向放大技术进行有效处理的数据

无论哪种定义,都说明大数据不是新产品或新技术,它只是数字化时代出现的一种现象或特征

我们应该关注的不是其定义,而是它所带来的价值,因为相比现有的其他技术,大数据兼有廉价、迅速、优化的优点,它不仅可以提供海量数据,还可以通过数据的交换、整合和分析,帮助人类发现新知识,创造新价值

在大中国,医疗大数据有着其他国家无可比拟的优势,我们人口多啊。我们一个医院的年就诊患者数据就能超越世界上很多国家的所有医疗机构的年就诊数。

但是医疗大数据并不是说数据多了就好发展了,医疗大数据应用的问题不在数量,而在其复杂性

怎么把这些复杂无章序的医疗数据的应用价值挖掘出来,才是未来大数据公司要解决数据变现的最大的问题

有接触过医院HIS全数据的人说,一个词形容他对医疗大数据的感受,就是”鸡肋“。面对海量的医疗数据,不存吧觉得可能错过了一千万,存着吧又不知道怎么挖掘。看着负荷颇重的服务器只能徒增烦恼。

为什么会有这个感触,因为目前医院里日常记录的还是一些医疗流程数据,比如His、Lis、Pacs等院内信息系统。不带有目的性收集的数据质量远低于主动收集的数据。

没有明确的收集目的,那医疗记录的完整性、准确性、颗粒度都无法形成系统的体系,容易造成数据的缺失、不规范与非结构化。绝大多数医院信息系统是服务于医院诊疗流程的,对于数据的收集是能存则存,并不会有细致的质控与标准。

因此,我们所说的大部分的真实世界数据是”垃圾“数据,我们的医疗大数据陷入“大而丑”的尴尬境地。

因此,除了需要资本泡沫的助推,国内医疗大数据的发展还有很长的路要走。

比如,大数据公司或者医疗信息系统服务提供商是否可以帮助医疗机构尽量存储完整的数据;

比如,在所有医疗数据存储的过程中,能否尽量让医务人员带着目的存数据。

最近跟大数据公司的人的沟通中了解到,有一位肿瘤外科医生发现了某一手术对肿瘤病人的愈合有非常积极的作用,他一直在临床治疗中采用这个经验进行诊疗,并小范围地做过推广,但从来没有把这件事情提升到医疗证据层面。这次他请大数据公司将他往年的记录翻出来进行整合梳理,据说结果可以发篇影响因子高达16分的SCI论文。

如果,我们在医疗系统中存储数据时就对该医生的诊疗做过目的记号,他的这个经验是否至少可以提前很多年让更多医生和患者获益。

再比如,国内医院众多,我们能否从顶层就去设计一些数据语义级别标准。

做过临床研究的都知道,我们每次临床总结的时候,还需要为单个项目进行医疗数据编码,如果我们有个统一的标准,就可以提高很多数据处理和分析上的效率。医疗数据记录看起来也会更专业,而不是医生的随心所欲的医疗记录。

还有一项最最重要的是,能否加大力度促进大数据挖掘人员的培养和建设,特别是同时具有计算机、统计和医学多个背景学科的建设。有朋友说,同时有计算机和医学背景的人在国内都屈指可数,更何况是三者兼具的。

在现实中开展真实世界大样本研究,我们可能经常遇到的情况是这样,拥有大数据技术的公司对临床研究的具体执行能力太薄弱,而对临床研究执行管控较好的公司又对大数据无法把控。怎么在提高数据收集效率的同时又能保证数据的质量和整体研究的成本,这是大数据公司做医疗大数据都要面临的问题。

我的建议是,既然泡沫都吹起来了,就从源头开始吧,建立数据收集标准、规范数据收集过程、建设大数据应用的学科,从国家政策、医疗机构、大数据公司、药品生产企业等多个层面发力,共同去推动医疗大数据的发展和应用。

大数据,有应用才能变现,有变现才能发展。在应用前,先把”大而丑“的数据塑造出”小而美“的形象,数据不在多,而在这些数据能创造出什么价值。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180428G1K1K100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券