TiDB 在零氪科技(LinkDoc)大数据医疗系统的实践

公司介绍

零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托先进的人工智能技术,致力于为社会及行业、政府部门、各级医疗机构、国内外医疗器械厂商、药企等提供高质量医疗大数据整体解决方案,以及人工智能辅助决策系统(辅助管理决策、助力临床科研、AI 智能诊疗)、患者全流程管理、医院舆情监控及品牌建设、药械研发、保险控费等一体化服务。

LinkDoc 的主要应用场景

LinkDoc 通过将患者真实的病例数据和算法模型应用于肿瘤治疗,构建精准的诊疗模型并提供数据支持,从而辅助医院管理决策、辅助科研、辅助临床诊疗。目前 Hubble 系统“肺癌淋巴结跳跃转移风险预测”模块可避免肺癌病人由于误判而导致提前 8-10 个月的复发,每年能让近两万病人的生命再延长 8-10 个月。Hubble 系统“ AI - 肺结节智能诊断”模块全自动地识别 CT 影像中所有的结节,识别率达 91.5%。LinkDoc 希望凭借医疗大数据整合、处理和分析上的核心技术优势,以互联网人工智能上的创新研发,提升中国医师的全球医学水准,并通过支持药物研发与医疗保险行业的发展,让每一位患者享有普惠、精准的医疗服务。

支撑 LinkDoc 业务的底层数据库平台也面临着医疗行业新领域的技术 & 业务挑战,如数据量的快速增长(亿级别)、大数据量下的清洗逻辑的数据擦写、分析型事物对数据库的读压力都要求我们在数据库平台进行重新探索,选择一款适合医疗大数据业务的数据库解决方案。

选择 TiDB

  1. 业务痛点
  • 数据量大,单实例 MySQL 扩容操作复杂;
  • 写入量大,主从延时高,由于业务对数据有低延时的要求,所以传统的 MySQL 主从架构在该项目下不能满足需求,大量数据写入下主库成为性能瓶颈;
  • 随着数据量越来越大,部分统计查询速度慢;
  • 分库分表业务开发和维护成本高。
  1. 需求
  • 高可靠性 & 稳定性;
  • 可扩展性,可随数据量 & 请求量增长快速提升存储 & 请求处理能力;
  • 更低的延时。
  1. 方案调研

未选择 TiDB 之前我们调研了 MyCAT、Cobar、Atlas 等中间件解决方案,这些中间件整体来说就是让使用者觉得很 “拧巴”,从社区支持、MySQL 功能兼容、系统稳定性上都不尽人意,需要业务做大量改造,对于快速发展的公司来说切换成本太高。

在 LinkDoc 首席架构师王晓哲的推荐下我们调研了 TiDB, TiDB 的如下特性让我们眼前一亮:

  • 兼容绝大部分 SQL 功能(意味着业务可以简单改造后平滑迁移至 TiDB);
  • 水平扩展能力;
  • 分布式事务;
  • 故障快速恢复能力;
  • 监控指标覆盖度。

上线 TiDB

  1. 兼容性测试

经过兼容性测试后我们对业务做了如下简单改造:

  • Blob 类型数据迁移至 HBase 做 key-value 存储;
  • Batch delete 改成小批量多次操作,一批删除 1000 条。
  1. 灰度上线

由于业务对于主从同步延时要求较高,我们采用业务双写的方案切换了我们的第一个应用。灰度第一阶段业务同时写 MySQL、TiDB,读走 MySQL,并验证数据一致性,经过2周的验证后我们灰度第二阶段。灰度第二阶段业务双写 TiDB、MySQL,读业务走 TiDB。经过一个月的业务验证后我们彻底下掉了 MySQL。

  1. 系统架构

上线过程中也遇到一个小坑,之前用的阿里云普通实例 + SSD 云盘跑 TiDB,在该配置下经常会遇到性能抖动问题,在 PingCAP 同学的建议下我们更换了阿里云本地 SSD 型机型,目前系统运行良好。

系统配置 & 架构如下:

生产集群部署情况(机器基于阿里云):

目前现状和下一步规划

目前 TiDB 在 LinkDoc 已承载数据量最大的两个业务。平时 QPS 6K,峰值 12K。

后续将使用 TiDB 承载更多大数据量业务库, 并调研 TiSpark。通过 TiDB 构造成一个兼容分析型和事务型的统一数据库 HTAP 平台。

致 PingCAP

非常感谢 PingCAP 小伙伴们的大力支持,从硬件选型、业务优化、系统培训到上线支持 PingCAP 都展现了热情的服务态度、专业的技术能力,帮助 LinkDoc 顺利上线 TiDB,解决系统难题,支持业务快速发展。相信在这样一群小伙伴的努力下 TiDB 会越来越成熟、承载更多的业务场景,用技术创造奇迹。

作者介绍:杨浩 现任零氪科技 运维&安全负责人,曾就职于阿里巴巴-技术保障部-CDN。专注 CDN、安全、自动化运维、大数据等领域。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏安恒信息

信息安全通报第49期

2017年第49期安全通报 1数据看安全 国家信息安全漏洞共享平台本周共收集、整理信息安全漏洞440个,其中高危漏洞194个、中危漏洞202个、低危漏洞44个。...

3739
来自专栏镁客网

SegmentFault D-Day 2015 南京开源站:让技术飞一会儿

1623
来自专栏大数据和云计算技术

政务大数据系列7:政务大数据的部署结构

政务是个大市场,阿里、腾讯、电信、华为都在赔本赚吆喝。本文作者宇同学是资深从业人士,研发总监,他会写一系列文章来阐述政务云全景。 前面六篇...

38111
来自专栏大数据和云计算技术

政务大数据的概念模型

政务是个大市场,阿里、腾讯、电信、华为都在赔本赚吆喝。本文作者宇同学是资深从业人士,研发总监,他会写一系列文章来阐述政务云全景。 ...

4115
来自专栏SAP最佳业务实践

从SAP最佳业务实践看企业管理(80)-SOP-产销协调会议

生产及物料控制的计划能力、控制能力及沟通协调能力做得差,容易造成以下现象: 1、 经常性的停工待料:因为生产无计划或物料无计划,造成物料进度经常跟不/上,以致经...

3154
来自专栏FreeBuf

2017年ICS安全回顾:关键基础设施比人们预想的更脆弱

日益猛烈的网络攻击让人们普遍意识到网络安全的重要性。而 Stunx 震网病毒之后频繁发生的针对关键基础设施的网络攻击,让硬件以及数据相关的危险。但是,目前的趋势...

1848
来自专栏安恒信息

【连载】2016年中国网络空间安全年报(五)

2016年中国网络空间安全年报 2.3. 攻击目标分析 2.3.1. 受攻击站点操作系统与主流系统一致 ? 图 2‑4 受攻击站点操作系统分布 根据风...

3269
来自专栏企鹅号快讯

用智能手机打造的自动驾驶系统 可以自己提前感受一下

腾讯数码讯(米可)自动驾驶汽车我们都很熟悉,可以利用各种传感器和摄像头,再加上开源软件实现无人驾驶的目的。但是现在黑客只用智能手机就能让普通汽车变成无人驾驶,而...

1885
来自专栏容器云生态

我怀疑遇到了假的CMDB

每次读到配置管理相关的书籍时,我总在想:“这些定义很精准,流程也很残缺,但这不是真正的难题。”对于一个配置管理者来说,真正的难题不是绘制“庞大而精美”的数据...

1.6K8
来自专栏C语言及其他语言

机器人也会编程了 AI完爆初级程序员

机器人究竟能代替多少行业,从最初的护工,到后来的编辑(默默的伤心),到一些高精尖的职业,诸如金融行业数据分析员……这些行业都有一些共性,能够让机器人,确切的说是...

2719

扫码关注云+社区