使用Keras构建血细胞分类模型

人工智能的应用非常广泛,尤其是在医疗领域。先进的人工智能工具可以帮助医生和实验室技术人员更准确地诊断疾病。

01

血细胞数据集

数据集:https://www.kaggle.com/paultimothymooney/blood-cells

数据集结构:数据集包含12,500个血细胞增强图像。数据集由4个类组成,如下所示:

每一个分类包含3000张图片。该图显示了每个类的示例图像:

血细胞是存在于血液中的细胞,能随血液的流动遍及全身。以哺乳动物来说,血球细胞主要含下列三个种类:红细胞:主要的功能是运送氧。白细胞:主要扮演了免疫的角色。当病菌侵入人体时,白细胞能穿过毛细血管壁,集中到病菌入侵部位,将病菌包围后吞噬。血小板:止血过程中起着重要作用。 血细胞约占血液容积的45%,包括红细胞、白细胞和血小板。在正常生理情况下,血细胞和血小板有一定的形态结构,并有相对稳定的数量。白细胞不是一个均一的细胞群,根据其形态、功能和来源部位可以分为三大类:粒细胞、单核细胞和淋巴细胞,其中粒细胞又可根据胞质中颗粒的染色性质不同,分为中性粒细胞、嗜酸粒细胞和嗜碱粒细胞三种。

Monocyte:单核细胞是血液中最大的血细胞,也是体积最大的白细胞,是机体防御系统的一个重要组成部分。单核细胞来源于骨髓中的造血干细胞,并在骨髓中发育,当它们从骨髓进入血液时仍然是尚未成熟的细胞。目前认为它是巨噬细胞的前身,具有明显的变形运动,能吞噬、清除受伤、衰老的细胞及其碎片。单核细胞还参与免疫反应,在吞噬抗原后将所携带的抗原决定簇转交给淋巴细胞,诱导淋巴细胞的特异性免疫性反应。单核细胞也是对付细胞内致病细菌和寄生虫的主要细胞防卫系统,还具有识别和杀伤肿瘤细胞的能力。与其他血细胞比较,单核细胞内含有更多的非特异性脂酶,并且具有更强的吞噬作用。当机体发生炎症或其他疾病都可引起单核细胞总数百分比发生变化,因此检查单核细胞计数成为辅助诊断的一种重要方法。

Lymphocyte:淋巴细胞是白细胞的一种,是体积最小的白细胞,由淋巴器官产生,是机体免疫应答功能的重要细胞成分。

Eosinophi:嗜酸性粒细胞是白细胞的组成部分,与其他粒细胞一样来源于骨髓的造血干细胞。嗜酸性粒细胞具有杀伤细菌、寄生虫的功能,也是免疫反应和过敏反应过程中极为重要的细胞。

Neutrophil:中性粒细胞具趋化作用、吞噬作用和杀菌作用。中性粒细胞来源于骨髓,具有分叶形或杆状的核,胞浆内含有大量既不嗜碱也不嗜酸的中性细颗粒。这些颗粒多是溶酶体,内含髓过氧化酶、溶菌酶、碱性磷酸酶和酸性水解酶等丰富的酶类,与细胞的吞噬和消化功能有关。

我们本次的目标就是使用Keras构建一个能正确识别上面四种细胞的分类器。

02

数据预处理

(1)数据预处理

我们需要将图像加载为numpy数组并将其提供给我们正在训练的神经网络。我们将使用Keras构建神经网络,Keras提供了一个内置的ImageDataGenerator,它可以处理大多数预处理任务。keras.preprocessing提供了处理各种类型数据集所需的方法和对象。从image模块我们创建一个具有所有需配置的ImageDataGenerator。

(2)构建网络

关于图像分类一般都使用CNN。

网络结构:

(3)训练模型

在1050Ti上30个Epoch共用12min16s。

(4)保存模型

(5)加载模型

(6)测试

在测试集上,13个对了10个,错了3个,准确率76.92%。

03

AI+医疗总结的展望

总的来说,AI在医疗领域的应用可以分为六个细分领域——虚拟助理、病历与文献分析、医疗影像辅助诊断、诊疗结果预测、药物研发、以及基因测序。

(1)虚拟助理

医疗虚拟助理的官方定义是,利用语音识别、自然语言处理技术,将患者对自己病症的描述与标准医学知识库进行对比,从而完成患者自诊、导诊、咨询等服务的信息系统。

(2)病历与文献分析

智能语音录入可以解放医生的双手,帮助医生通过语音输入完成查阅资料、检查史、病史、检查指标、检查结果等形成结构化的电子病历,大幅提升了医生的工作效率。

在解放医生双手的同时,电子病历也起到了医疗人工智能发展的数据基石作用。在语音识别层面之下,利用自然语言处理技术将非结构化的自然语言转化为结构化的数据,以便后续进行数据挖掘。

(3)医疗影像辅助诊断

现代医学是建立在实验基础上的循证医学,医生的诊疗结论必须建立在相应的诊断数据上,影像是重要的诊断依据。

AI+医疗影像结合的具体做法如下:首先提取医学图像;然后利用图像分割技术提取图像有意义的区域;再利用一些图像识别方法对图像进行预处理,突出图像中有效的信息;然后利用算法提取病变区域;最后将这些数据交给模型进行训练。经过训练之后,再给模型一个新的图片,模型就能够自动标记出病灶的位置。

(4)诊疗结果预测

对于一场手术,系统能够建立包括手术、麻醉、体外循环等在内的一套最佳的治疗方案,还能够预测病人术后的出血风险、出血量、在 ICU 的停留时间、以及术后综合症的风险等。当医生需要更改手术方案的参数时,系统还能自动计算参数修改后这几个风险因素的变化。

国内外巨头在医疗人工智能领域也都已经展开布局,但同样,大多产品尚未成熟,算法模型处于训练优化阶段,虽有商用试水,但没有大规模成熟应用。医疗人工智能才刚刚起步,面向未来,还有很多问题需要解决。相信随着AI在医疗领域的应用不断深入,医疗资源不平衡的问题很可能将慢慢缓解,人类将享受到共同的高水平的医疗服务。

暗中观察

默默关注

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20190106G10B3F00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券