前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >干货 | 肿瘤患者数据管理及化疗药物不良反应分析

干货 | 肿瘤患者数据管理及化疗药物不良反应分析

作者头像
数据派THU
发布2023-08-08 12:53:19
1190
发布2023-08-08 12:53:19
举报
文章被收录于专栏:数据派THU数据派THU
以下内容整理自大数据能力提升项目必修课《大数据系统基础》同学们的期末答辩汇报。

我们的报告分为以下五个部分。

首先,第一部分是项目背景及需求分析。我们的项目背景是数字医疗场景。数字医疗是一个信息技术与医疗知识相结合,作为现代医药发展趋势的领域,对于实现精准医疗和高效医疗具有重大的意义。我们所合作的苏州医朵云健康股份有限公司,它是一家向患者、医生和医疗机构提供智慧医疗和互联网服务以及数字医疗产品的企业。他与恒瑞医药合作开展了肿瘤产品线的患者随访项目,沉淀了百万级的真实患者数据,涵盖了他们所研发的四种药物。那么对于这样一个数字医疗的问题,它的常规需求主要包括患者数据的日常管理及实现对于患肿瘤患者相关数据的一些跟踪和记录,以及对于这些记录下来的随访数据相关的分析需求。针对这样两个需求,我们小组基于医朵云所提供的随访数据,力求建立一个针对患者数据的管理和分析体系,关注患者用药之后出现不良反应的程度以及与他们的停药和用药状态之间的关系服务,希望得到的结果能够服务于药物副作用的研究,并进一步提供对于临床用药的指导。

我们的具体内容可以分为以下三个部分,第一部分是数据管理部分及我们要实现企业方给我们的数据到特定数据类型的转换,并将这些文件上传解析以及存储,然后进行一些管理用户的数据操作。第二部分是数字展示和数据展示,我们需要实现上传数据中相关字段的可视化展示。第三部分是数据分析,针对不良反应和字段和药物应用状态数据,使用不同机器学习模型来分析它们的相关性并进行排序。

第二部分是系统设计架构。首先介绍一下我们的网页部分,网页部分的技术站主要由HTML,CSS和JavaScript三个部分组成。第一部分的HTML定义了我们的网页结构,CSS定义了网页样式,JavaScript给网页提供了一些动态可交互性。我们的可视化流程主要包括以下四步。第一步是清洗和分析,随后我们进行一些处理和补充,根据企业要求,将数据进行合并,然后通过网络爬虫进行一些地理数据的获取,随后我们选取合适的可视化形式,并将我们所需要采用的数据转换成对应的格式。然后使用Echarts进行数据可视化,并嵌入到我们的网络主页中,便于交互观察。

第二部分我们采用了DWF的数据管理系统,我们的设计目标主要是为了方便随访人员进行模块化、结构化和规范化随访,简化随访流程和便于回答。我们的设计逻辑是考虑到我们得到的是三个药物数据,他们所需要询问的问题都不尽相同,我们将其分为对应的三个系统,每个系统中分为两个页面,主要包括患者信息查询页面和患者信息编辑页面。在查询页面中,我们需要实现对各字段文本信息的检索,然后在患者信息编辑页面,我们需要分模块登记患者的基本信息、用药情况以及他的不良反应。

最后是我们的分析部分架构。因为我们得到一些Excel表格中数据混杂情况比较严重,我们采用了一些手动清除重复行和数据转换的一些工作。由于涉及到的不良反应症状很多、维度很高,我们按照美国公共卫生及公共服务部的一些标准,按照不良症状所属的身体系统进行归类,随后进行了一些数据筛选,去掉了一部分因为紧急等原因停药的数据,最后进行了一些机器学习模型的数据分析。

以下展示我们的完成情况。首先是网页部分,我们的代码架构如下,在根目录中存放了HTML文件,其他文件分别存放在对应的文件夹中。我们的网页分为以下四个部分,第一部分是我们的主页企业介绍,然后是随访信息的可视化以及联系方式页面。最下面三张图片是我们网页的截图,这里列出了一个可视化案例。因为表格中包含了一些患者所处的省份信息,我们将其进行一些格式化处理,然后将它动态可视化。使用Echarts表格记性可视化,不同省份的颜色深浅代表该省份的患者人数。

接下来是DWF数据管理系统部分,我们重点实现了已有数据导入和新增表单管理两个部分,对企业提供的数据进行了重点的清洗,去掉了其中的一些无关信息,并对其中的一些空缺进行了填补。在其中的新增和编辑数据表单部分,也就是右侧这一部分,我们也对问卷逻辑进行了一些调节,可以方便我们得到一些更有用的信息。

接下来是分析结果部分。我们对于独立的不良反应和按身体系统分类后的不良反应与停药的关系采用多种统计学习模型进行分析,得到如上图中结论。对于艾坦和艾瑞卡数据,我们也进行了了类似分析。

最后是我们的数据系统展示。首先展示一下我们的网页。我们可以通过本地端口接入,这是我们的主页面,里面有一些药物介绍以及我们的分工。在企业信息界面,我们展示了苏州医朵云公司的一些信息,接着是我们的联系方式页面。然后是我们的重点,也就是我们的随访数据可视化。我们通过多种表格对各种数据进行可视化。

第二部分是DWF展示,这里以艾坦可视化数据管理为例。首先,查询页面中我们可以进行一些比较精准的查询,在这里以死亡时间范围为例筛选出了一些目标,对于癌症等信息也可以进行类似查询。在编辑页面,我们也按照原计划实现我们所需的一些逻辑管理。删除功能没有演示,但是可以完成。编辑和新增是差不多的,都可以实现类似的逻辑。

编辑:文婧

校对:龚力

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-07-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档