首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据挖掘常用算法及其在医学大数据研究中的应用啊

点击上方“

我国数字医学

”能够订阅哦!

医院信息化的开展及云核算、大数据、物联网、人工智能等在医疗范畴的使用,为医学数据的获取、存储及处理供给了极大便当。数据发掘也跟着核算机技术得到了广泛使用,然后提高了数据使用功率,拓宽了常识发现的广度与深度。现在,医院已积累了很多医疗相关数据。医学大数据与数据发掘的结合,可以协助人们从存储的大体量、高杂乱的医学数据中提取有价值信息,加快医学效果转化,为医疗职业开辟一个新的年代。介绍了医学数据发掘中常用算法及其在医学大数据中的研究效果,以期为往后医学大数据的发掘使用供给参阅。

数据发掘是指从数据库中,提取隐含在其间的人们事前不知道、潜在的有用的信息和常识的进程。数据发掘已有较多老练办法,并在医学大数据发掘中取得了必定效果。本研讨对数据发掘的常用算法及在医学大数据中的使用进行总述。

数据发掘分类及常用算法

猜测型数据发掘

猜测型数据发掘是从历史数据中发现的已知成果,揣度或猜测不知道数据的可能值,有猜测和回归两种类型。常用算法有线性回归、Logistic回归、K-NN算法、决策树(DT)、人工神经网络(ANN)、支撑向量机(SVM)及各种集成算法等。

回归

回归是指断定呼应变量和一个或多个自变量之间依靠联系以构建猜测模型。Kirkland等使用Logistic回归树立模型,对收集的患者临床目标等数据树立了疾病恶化预警模型,可对患者未来2-12小时可能呈现的疾病恶化危险进行猜测。Escobar等根据14家医院的电子病历数据,相同选用Logistic回归树立模型,用于患者非方案转入ICU的猜测。

分类

分类是指依据已知所属类别的历史数据的特征描述预先界说好的类别,构建猜测类别的模型,再依据待查数据的相关特征与这些类别相应特征之间的类似程度,断定待查数据应划归入的类别,可用于猜测性研讨。Meng等[5]应用了Logistic回归、ANN及决策树三种分类算法建立了糖尿病猜测模型。

描绘型数据发掘

描绘型数据发掘是辨认数据中的形式或联系,旨在探究被剖析数据的内涵性质,常用办法有相关规矩、序列规矩和聚类。

关联规则

相关规矩通过从很多数据中,发现数据之间某些不知道的、潜在的且有实际意义的相关或联络,并以相关规矩的方法表现出来。相关规矩应用于医学研讨,能够从医疗信息中提醒疾病发作、发展规律以及医学确诊、医学图画、症状与用药等某些内在联络,为疾病确诊和健康办理供给参阅。李准等根据Apriori算法,对某综合性医院电子病历中不同的冠心病确诊结果与用药状况进行相关规矩发掘,发现不同药品对不同确诊的医治作用及冠心病风险要素。Qin Li等将Apriori算法用于高血压、房颤、血脂反常等8项高风险要素与中风之间相关性发掘,供给了可行的中风防止、前期确诊和前期医治方法。

序列规则

序列规则可发掘相对时刻或其他形式呈现频率较高的形式,经过对时刻序列数据发掘,可获得与时刻密切相关的信息,完成常识获取。王晨等将非线性时刻序列剖析中的算法引进胎儿心电信号处理,成功完成胎儿心电信号与母体生物电信号的别离,对进步胎儿心电监护有很好的辅佐作用。冯冰等以为时刻序列在猜测流行症发病中较好的作用,并建立了两种时节时刻序列模型对某市细菌性痢疾月发病率猜测作用进行比照研讨,猜测作用与实际情况根本共同。

聚类分析

聚类可将整个数据集分红几个数据组,归于同一组的实例尽可能地类似,而归于不同组的实例则尽可能不同,常用算法如K-means和TwoStep等。张勃等将K-means应用于冠脉光学相干断层成像的图画斑块切割,完成多区域斑块准确切割,为医师快速准确地读取图画和评价患者病况供给根据。TwoStep比较其他聚类的一个杰出长处是,可以主动挑选最佳分组数而无需预先设置,如杨美洁将TwoStep聚类算法用于电子病历中高血压患者数据聚类分析,得到了高血压重要的猜测变量。

数据发掘的进程

数据发掘进程大致包含6个过程:数据挑选、数据清洗、数据赋值、数据转化、数据发掘和成果解说与评价。数据挑选包含数据源、数据类型、特征变量等的挑选,其间,特征变量挑选至关重要,许多剖析建模探究往往始于数以百计乃至更多的变量,但一般来说,只要少量变量真正与方针变量有关,有助于下降模型练习时刻和存储空间,进步模型的精度。研讨者在树立预警模型时,以Logistic回归从众多变量中挑选了特异性较高的变量用于模型树立;Khiabani等[20]则以filter 和wrapper两种变量挑选法分别从55个变量中挑选特征变量,用于前驱糖尿病猜测研讨,并将猜测成果与全变量模型的猜测成果进行了比照,发现通过特征变量挑选的猜测模型的精确性优于全变量模型。

数据发掘在医学大数据研讨中的使用

数据发掘在医学大数据研讨中已取得了较多效果,经过文献检索,总结了三方面的使用现状。

疾病前期预警

医疗范畴往往需求更准确的实时预警东西,而根据数据发掘的疾病前期预警模型的树立,有助于进步疾病的前期确诊、预警和监护,一起,也有利于医疗机构采纳防止和控制措施,削减疾病恶化及并发症的发作。

疾病前期预警,首先要搜集与疾病相关的目标数据或风险要素,然后树立模型,然后发现隐含在数据之中的发病机制和病况之间的联络。Forkan等收集日常监测的心率、舒张压、收缩压、均匀血压、呼吸率、血氧饱和度等生命体征数据,以J48决策树、随机森林树及序列最小优化算法等树立疾病预警模型,用于长途家庭监测,辨认未曾诊断过的疾病发作,并将监测成果发送到医疗急救组织,完成生命体征大数据、患者及医疗组织的完好联接,以下降突发疾病及逝世的发作率。Easton等使用贝叶斯分类算法树立了中风后遗症逝世猜测模型,以为中风后遗症逝世概率与中风发作后的时刻长短成函数联系,有助于中风后遗症患者的后续监护。Tayefi等根据决策树算法树立了冠心病猜测模型,该模型发现hs-CRP作为新的冠心病猜测标志物,比传统的标志物(如FBG、LDL)更具特异性。

慢性病研讨

糖尿病、高血压、心血管疾病等缓慢病正在影响着人们的健康,辨认缓慢病危险要素并树立预警模型有助于下降缓慢疾病并发症的发作。Alagugowr等树立的心脏病预警系统,从心脏病大数据库中提取特征目标,经过K-means聚类算法辨认出心脏病危险要素,又以Apriori算法发掘高频危险要素与心脏病危险等级之间的相关规矩。Ilayaraja等则以高频项集寻觅心脏病危险要素并辨认患者危险程度,该办法可以逃避无意义项集的发生,然后处理了以往研讨中项集数量多、所需存储空间大等问题。CH Jen等对缓慢疾病并发症危险辨认的研讨分三个过程,首要,挑选健康人群体检数据和缓慢病患者相关疾病数据,以带有序列前项挑选的线性判别剖析来寻觅相关疾病的特征变量;然后,以K-NN对特征变量进行分类处理;最终,将K-NN算法的分类成果应用于缓慢疾病预警模型的树立。Aljumah等先后以回归剖析和SVM用于猜测和判别糖尿病不同医治方法与不同年龄组之间的最佳匹配,为患者挑选最佳医治方法供给根据。Perveen等对糖尿病的猜测研讨,选用患者人口学数据和临床目标数据,并分别用Adaboost集成算法、Bagging算法及决策树三种算法来树立猜测模型,以为Adaboost集成算法的精确性更高。

辅佐医学确诊

医学数据不只体量大,并且扑朔迷离、彼此相关。对很多医学数据的剖析,发掘出有价值的确诊规矩,将对疾病确诊供给参阅。Yang等根据决策树算法和Apriori算法,对肺癌病理陈述与临床信息之间的相关性进行了研讨,为肺癌病理分期确诊供给根据,然后可逃避确诊中需求手术办法获取病理安排。Becerra-Garcia等使用SVM、K-NN和CART三种算法对眼球电图进行信号预处理、脉冲检测和脉冲分类,为研讨临床眼球电图查看中非自发环视眼球运动的辨认供给根据。彭玉兰等对某医院5年的乳腺超声数据进行了相关规矩发掘,树立乳腺病理确诊与超声确诊之间的相关规矩,并开发了乳腺超声数据库数据检索系统,便于医师快速取得超声确诊和病理确诊的各种确诊信息和病例信息。

医学大数据发掘已出现宽广的发展前景和巨大的使用价值,将为疾病研讨、临床及管理决策、医疗效劳个性化及图像识别等很多范畴带来更多支撑。麦肯锡在其陈述中指出,大数据分析能够协助美国医疗效劳业一年发明3000亿美元的附加价值,而美国医疗协会也称,改进医疗卫生事业的关键在于大数据。现在,医院大数据中心、区域性卫生信息渠道、国家医疗大数据中心的树立以及卫生信息互联互通标准和同享标准的拟定,为数据存储和同享、推进医学大数据的使用供给了更多支撑。未来,医学大数据发掘将不断更新,探究新的研讨范畴,推进研讨成果转化。

文章来历:《我国数字医学》杂志2018年第03期,作者及单位:孙雪松 王晓丽,上海市浦东卫生开展研究院。

传达数字医学范畴开展最新动态,重视医疗卫生信息化相关资讯。

长按扫码重视咱们

----------------------------------------------

下面是系统推荐的另外一篇文章

夏天如何拯救睡眠? 6种食物让你一夜安睡

睡觉是健康之源。失眠会引起疲劳感、心情不稳、反响缓慢、头痛、记忆力不会集,整个身体处于亚健康状况。

在夏日,虽不发起让人贪睡,但也要“养好”睡觉,避免为秋冬季的睡觉妨碍埋下危险。可是夏日气压低、湿气重、气温高,很多人都热得睡不着,这可如何是好呢今日小编就为我们介绍六种有助睡觉的食物,让你一夜安睡!

1.食醋催眠:

有些人长途旅行后,劳累过度,夜难安睡,可用一汤匙食醋兑入温开水中慢服。饮后静心闭目,不久便会入眠。

2.生果催眠:

过度疲惫而失眠的人,临睡前吃苹果、香蕉等生果,可抗肌肉疲惫;若把桔橙一类的生果放在枕边,其香味也能促进睡觉。

3.鲜藕催眠:

藕中含有很多的碳水化合物及丰厚的钙、磷、铁等和多种维生素,具有清热、养血、除烦等成效。可治血虚失眠。食法:取鲜藕以小火煨烂,切片后加适量蜂蜜,可随意食用,有安神入眠之成效。

4.葵花籽催眠:

葵花籽富含蛋白质、糖类、多种维生素和多种氨基酸及不饱和脂肪酸等,具有平肝、养血、下降血压和胆固醇等成效。每晚嗑一把葵花籽,有很好的安息成效。

5.莲子催眠:

莲子幽香可口,具有补心益脾、养血安神等成效。近年来,生物学家通过实验证明,莲子中含有的莲子碱、芳香甙等成分有冷静效果;食用后可促进胰腺排泄胰岛素,进而可增加5 羟色胺的供给量,故能使人入眠。每晚睡前服用糖水煮莲子会有杰出的助眠效果。

6.大枣催眠:

大枣味甘,含糖类、蛋白质、维生素C、有机酸、粘液质、钙、磷、铁等,有补脾、安神的成效。每晚用大枣30~60g,加水适量煮食,有助于入睡。

转发重视,把健康传递给爱的人!!!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180531A0KRTC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券