中科院方向东博士:生命大数据开始进入寻常百姓生活

数据猿导读

在国家战略需求层面,生命大数据研究正如火如荼的开展起来,为精准医学研究打下基础。可以预见,在三到五年内,将会产生大量中国人群的各类生命大数据以及对应的知识注释。

作者 | 方向东

本文长度为2000字,建议阅读4分钟

本文为数据猿年关策划活动《大数据的2016,我的2016》系列稿件,感谢本文作者 中科院博士 方向东 先生的投稿(数据猿专访方向东)

敬请期待春节后的2月16日,由数据猿与中欧商学院、腾讯视频共同举办的高端领袖线下演讲栏目中欧微论坛之《超声波》

人的一生,简单的讲,不外乎“生老病死”。我们能抗争的、个体差异最大的就是“病”了。几千年文化、知识、技术、经验的累积,人类对自身健康状况的了解以及疾病干预的能力都大大提高。然而,我们对自身健康的掌控能力离预期还远远不够,面对各类疾病缺少深入的了解、精细的分类和有针对性的治疗。

旨在正确的时间,给正确的人,使用正确的药物的“精准医疗”应运而生。获取和掌握组学、临床信息等生命大数据里包含的海量信息是医疗迈向精准的重要前提。生命大数据的累积和挖掘将逐步揭示健康与疾病的全景关联图。

生命大数据支撑精准医学研究

人类基因组计划(human genome project,HGP)、基因组单体型图计划(hapmapproject)、全基因组关联分析(genome-wide association study,GWAS)、DNA 元件百科全书(encyclopedia of DNA elements,ENCODE)、表观路线图(NIH roadmap epigenomics)等大型组学计划的顺利完成,带动了生命科学领域的重大变革。

高通量测序、高性能质谱等组学技术得以快速发展,生命科学研究产生了大量有价值的包括基因组学、转录组学、蛋白质组学、代谢组学等在内的“生物大数据”。整合分析多重组学数据和临床资料,构建健康与疾病的知识网络,将有望对疾病发展和不同病理状态进行更加准确的分类,为不同遗传背景的患者提供个体化诊断及精准治疗。

很显然,科学家们都已经意识到各类生命大数据的重要作用。然而,以上重要的大型组学计划均由欧美国家发起,获得的数据主要基于欧美人群。中国人口众多,遗传背景与欧美人群有较大差异。实现中国人民的精准医疗,则需要中国人群的生命大数据来推动。

中科院在2015年启动重点部署项目“中国人群精准医学研究计划”,将在4年内完成4000名志愿者的DNA样本和多种表现型数据的采集,并对其中2000人进行深入的精准医学研究,包括全基因组序列分析,建立基因组健康档案,针对一些重要慢性病的遗传信号开展疾病风险和药物反应的预警和干预研究。这些数据将会成为非常宝贵的中国人群遗传信息资源。

科技部于2016年3月8日公布《关于发布国家重点研发计划精准医学研究等重点专项2016年度项目申报指南的通知》,拉开了精准医疗重大专项科研行动的序幕。本年度的科研专项包括构建百万人以上的自然人群国家大型健康队列和重大疾病专病队列,建立生物医学大数据共享平台等。

在国家战略需求层面,生命大数据研究正如火如荼的开展起来,为精准医学研究打下基础。这一系列大数据项目的开展,将建设一套符合我国国情的生命大数据的获取、分析、存储、使用等规范;多个与健康相关的中国人群生命大数据知识库;面向科研人员和医务工作者的友好共享数据平台等等。基于这些大数据挖掘生命动态规律,将是通向精准医疗的重要基石。

综合组学大数据和临床大数据挖掘生命规律

生命大数据包含的种类繁多,包括基因组、转录组、蛋白组、表观组、宏基因组等各类组学数据和影像、生化指标、标型特征等各类临床数据。我国各类组学数据主要产生于科研院所和高校,临床数据主要来源于各类医疗机构。

整合多类数据,挖掘深层机制无疑是行之有效的方法。过去的整合分析主要是限于各类组学数据内部,例如综合组蛋白修饰数据、转录组数据和染色质相互作用数据筛查全基因组范围内的顺式作用元件。当面对精准医疗,需要明确疾病的不同亚型及对应的分子机制,以及合适的治疗方案,大数据在整合分析、挖掘时则必须要加上临床大数据。

在2016年,多家科研机构和医疗机构联合起来,共同攻关生命大数据:

中科院北京基因组研究所联合中科院生物物理研究所、浙江大学、复旦大学、国家卫计委信息统计中心、北大人民医院、中南大学湘雅医院系统等构建精准医学大数据处理和利用的标准化技术体系。

军事医学科学院放射与辐射医学研究所联合多家机构构建精准医学大数据管理和共享技术平台。

少量生命大数据的研究成果已经进入普通百姓的视野

在媒体的大力宣传下,大数据和精准医疗的概念已出现在普通百姓的生活中。一些基于生命大数据的成果已经被用到普通消费者身上,最为常见的就是基因检测了。

通过对具有特定特征(如患某种疾病)的人群和对照人群进行遗传物质的对比和关联研究,可挖掘出一些与该特征相关的基因位点。一些商业公司将同类疾病的不同研究结果综合起来,评估消费者患某类疾病的风险。这被认为是一个很酷、有用、拥有巨大商业前景的行业,因此近一两年内成立了许多面向普通消费者的基因检测公司。

“十三五”期间的生命大数据

我国的精准医疗从今年开始落地实施,研究内容涉及到大规模人群队列研究和精准医学大数据研究。可以预见,在三到五年内,将会产生大量中国人群的各类生命大数据以及对应的知识注释。

一方面,这些大数据将有望打破欧美国家对生命大数据的垄断,形成世界范围内的新布局;同时,将有力推动我国生命科学研究和健康事业;此外,阶段性的成果也可能会被单独拿出来,直接走向面对普通消费者的商业模式中(就像基因检测一样)。

伴随着美好愿景的,也一定还有潜在问题:

1、我国还缺乏一个国家级的、被广大科研人员认可的数据存储、使用、共享平台;

2、大数据的安全与管理也是重中之重;

3、各类公司带着一些成果直接面向普通消费者,但缺乏统一、可用的行业标准,不当的基因解读有可能伤害一些消费者,造成普通百姓对大数据行业的误解。

关于作者

方向东博士为中国科学院“百人计划”研究员;中国科学院大学生命科学学院、医学院、中丹学院教授、博士生导师;曾任美国华盛顿大学医学院(UW, WA)医学遗传系助理教授。主要从事医学遗传学、生物大数据与精准医学研究。

原文发布于微信公众号 - 数据猿(datayuancn)

原文发表时间:2017-01-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

VR性教育,教你拒绝令人作呕的爱情!

3695
来自专栏云社区全球资讯抢先看

机器人时代的黎明?俄罗斯人工智能正准备与人类“独立”!

在过去的几年里,我们有很多事情要讨论,当涉及到人工智能和全功能的类人机器人被引入我们的社会时。 ? 虽然近年来人工智能和全自动机器的发展取得了巨大的进步,但许多...

2567
来自专栏程序员的知识天地

程序员择偶不在乎经济,颜值和才华很重要!

为了还原一个真实的程序员群体,极光大数据在10多个城市进行了一次程序员现状调查,通过回收的1684份有效问卷,得出了这份《2018年中国程序员研究报告》,从生活...

1113
来自专栏VRPinea

当你在苛责VR游戏平台时,你在苛责什么?

3156
来自专栏机器人网

谷歌的机器人“野心”

谷歌陆续收购了8家高级机器人公司,都是在相对专业领域拥有核心技术的公司。他们将帮助谷歌解决机器人战略布局中的核心技术整合,打造未来一整套的“全机器人服务链条系统...

2914
来自专栏华章科技

互联网公司の加班文化

请注意以上三段话所隐藏的意思,一是阿里腾讯的加班成为一种常态,多数人默认加班;二是阿里腾讯的加班非常严重,多数人无法忍受高强度的加班。

871
来自专栏罗超频道

独孤求败的中国超级计算机

《为“跑分”而生的中国超级计算机》,这篇关于超级计算机的报道将“天河”系列超级计算机置于风口浪尖。该文援引报道称,2010年斩获“世界最快的计算机”的天河1号...

3855
来自专栏灯塔大数据

盘点|2017年大爆发的15个新科技,人工智能只是冰山一角

技术所带来的革命性体验,一直是未来社会发展的风向标。无人机、人工智能、大数据、VR\AR……好多词汇你已经听到耳朵起茧,但这些技术究竟还有哪些可能性,你也许并...

3814
来自专栏JAVA高级架构开发

老板,你凭什么不和我谈钱

HR回应:“年轻人,不用太在意钱,应该抓住机会。我们公司会提供很多锻炼机会,相信你可以很好地成长。”

790
来自专栏镁客网

机器人会消灭人类统治世界?你TM是在逗我么

2066

扫码关注云+社区

领取腾讯云代金券