TiDB 在零氪科技(LinkDoc)大数据医疗系统的实践

公司介绍

零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托先进的人工智能技术,致力于为社会及行业、政府部门、各级医疗机构、国内外医疗器械厂商、药企等提供高质量医疗大数据整体解决方案,以及人工智能辅助决策系统(辅助管理决策、助力临床科研、AI 智能诊疗)、患者全流程管理、医院舆情监控及品牌建设、药械研发、保险控费等一体化服务。

LinkDoc 的主要应用场景

LinkDoc 通过将患者真实的病例数据和算法模型应用于肿瘤治疗,构建精准的诊疗模型并提供数据支持,从而辅助医院管理决策、辅助科研、辅助临床诊疗。目前 Hubble 系统“肺癌淋巴结跳跃转移风险预测”模块可避免肺癌病人由于误判而导致提前 8-10 个月的复发,每年能让近两万病人的生命再延长 8-10 个月。Hubble 系统“ AI - 肺结节智能诊断”模块全自动地识别 CT 影像中所有的结节,识别率达 91.5%。LinkDoc 希望凭借医疗大数据整合、处理和分析上的核心技术优势,以互联网人工智能上的创新研发,提升中国医师的全球医学水准,并通过支持药物研发与医疗保险行业的发展,让每一位患者享有普惠、精准的医疗服务。

支撑 LinkDoc 业务的底层数据库平台也面临着医疗行业新领域的技术 & 业务挑战,如数据量的快速增长(亿级别)、大数据量下的清洗逻辑的数据擦写、分析型事物对数据库的读压力都要求我们在数据库平台进行重新探索,选择一款适合医疗大数据业务的数据库解决方案。

选择 TiDB

  1. 业务痛点
  • 数据量大,单实例 MySQL 扩容操作复杂;
  • 写入量大,主从延时高,由于业务对数据有低延时的要求,所以传统的 MySQL 主从架构在该项目下不能满足需求,大量数据写入下主库成为性能瓶颈;
  • 随着数据量越来越大,部分统计查询速度慢;
  • 分库分表业务开发和维护成本高。
  1. 需求
  • 高可靠性 & 稳定性;
  • 可扩展性,可随数据量 & 请求量增长快速提升存储 & 请求处理能力;
  • 更低的延时。
  1. 方案调研

未选择 TiDB 之前我们调研了 MyCAT、Cobar、Atlas 等中间件解决方案,这些中间件整体来说就是让使用者觉得很 “拧巴”,从社区支持、MySQL 功能兼容、系统稳定性上都不尽人意,需要业务做大量改造,对于快速发展的公司来说切换成本太高。

在 LinkDoc 首席架构师王晓哲的推荐下我们调研了 TiDB, TiDB 的如下特性让我们眼前一亮:

  • 兼容绝大部分 SQL 功能(意味着业务可以简单改造后平滑迁移至 TiDB);
  • 水平扩展能力;
  • 分布式事务;
  • 故障快速恢复能力;
  • 监控指标覆盖度。

上线 TiDB

  1. 兼容性测试

经过兼容性测试后我们对业务做了如下简单改造:

  • Blob 类型数据迁移至 HBase 做 key-value 存储;
  • Batch delete 改成小批量多次操作,一批删除 1000 条。
  1. 灰度上线

由于业务对于主从同步延时要求较高,我们采用业务双写的方案切换了我们的第一个应用。灰度第一阶段业务同时写 MySQL、TiDB,读走 MySQL,并验证数据一致性,经过2周的验证后我们灰度第二阶段。灰度第二阶段业务双写 TiDB、MySQL,读业务走 TiDB。经过一个月的业务验证后我们彻底下掉了 MySQL。

  1. 系统架构

上线过程中也遇到一个小坑,之前用的阿里云普通实例 + SSD 云盘跑 TiDB,在该配置下经常会遇到性能抖动问题,在 PingCAP 同学的建议下我们更换了阿里云本地 SSD 型机型,目前系统运行良好。

系统配置 & 架构如下:

生产集群部署情况(机器基于阿里云):

目前现状和下一步规划

目前 TiDB 在 LinkDoc 已承载数据量最大的两个业务。平时 QPS 6K,峰值 12K。

后续将使用 TiDB 承载更多大数据量业务库, 并调研 TiSpark。通过 TiDB 构造成一个兼容分析型和事务型的统一数据库 HTAP 平台。

致 PingCAP

非常感谢 PingCAP 小伙伴们的大力支持,从硬件选型、业务优化、系统培训到上线支持 PingCAP 都展现了热情的服务态度、专业的技术能力,帮助 LinkDoc 顺利上线 TiDB,解决系统难题,支持业务快速发展。相信在这样一群小伙伴的努力下 TiDB 会越来越成熟、承载更多的业务场景,用技术创造奇迹。

作者介绍:杨浩 现任零氪科技 运维&安全负责人,曾就职于阿里巴巴-技术保障部-CDN。专注 CDN、安全、自动化运维、大数据等领域。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏BestSDK

写了3年前端依然原地踏步,你可能犯了这10个错误

1.只看教程,不动手实战 这个可以说是学习的最大的一忌,也是提醒过最多的一个注是事项!网上的教程有许多许多,各个语言,各个知识点,各方面的都有,java,htm...

3704
来自专栏镁客网

微软双十发布Win10手机

1735
来自专栏我是攻城师

野生程序员的故事

3558
来自专栏知晓程序

微信公众号页面大改版 / 「弹球王者」涉嫌违规遭下架 / 微信小程序不支持 iOS 「虚拟支付」

1194
来自专栏数据库新发现

关于Google的几则新闻

1.Google从微软和sun挖到多名高手 欲开发浏览器  (2004.09.22)   来自:TOM科技 刚刚上市后的Google如今又将目光转移到...

781
来自专栏机器人网

想开发孩子的智力?请考虑这款呆萌的可编程学习机器人

Marty是一个带有WiFi功能的可编程行走机器人,它的零部件可以通过3D打印进行定制。尽管设计得简单易用,非常适合初学者,但一点也不影响Marty用来做一些很...

3205
来自专栏云计算D1net

企业的“云端漫步”道路并不平坦

云计算的发展让越来越多的企业开始考虑迁移到云端。而关于云计算的商业价值,形形色色的云计算服务商通常会告诉企业:云计算可以帮助企业节省成本,增强it系统与业...

3316
来自专栏灯塔大数据

数据质量低,你会损失什么?这里有你想要的解决方案!

数据是一种珍贵资产。尤其是在当今快消品当道的背景下,你需要数据来帮助你准确定位、深度投入和优化前景。如果你不能合理的管理这些数据,就可能会错失良机、降低效率,...

3465
来自专栏Crossin的编程教室

微软收购 GitHub 后对我们有什么影响?

Git 是一款分布式代码版本控制系统,可以便捷地管理你的代码版本,高效地支持多人协作开发。

1212
来自专栏视频咖

业务出海到底有多坑?从精细化运营海外直播说起

? 随着直播的快速发展,越来越多的国内公司将其直播业务出海运营,包括猎豹、斗鱼、zenjoy、joox等在内的公司,在海外都有大量的直播业务需求。为了提高直播...

2904

扫码关注云+社区