前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一起来学习新冠病毒的基因分析(1):背景与数据介绍

一起来学习新冠病毒的基因分析(1):背景与数据介绍

作者头像
生信菜鸟团
发布2020-04-28 18:10:56
4.1K0
发布2020-04-28 18:10:56
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

首先,先感谢各位粉丝一路以来的支持,在前天咱们生信菜鸟团的粉丝已经达到3万人了。我们会不忘初心,继续为大家带来优质的推文。

2020年以来,新冠疫情可能是最最热门的话题。作为一名生信学习者或者工作者,你何曾或多或少想借助自己的力量,通过自己的生信技巧,生物学知识,来研究一下新冠病毒的起源等相关的研究。接下来几期推文将会陆续和大家分享一些关于新冠病毒的最基础的基因分析。该系列推文打算主要写给面向生信初学者,所以请各位大佬不喜勿喷。

背景介绍

事件发生

2019冠状病毒病疫情,是由严重急性呼吸系统综合症冠状病毒2型(SARS-CoV-2),能够人传人,进而所引发的全球大流行疫情。疫情在2019年尾发现于中国湖北武汉,随后在2020年初迅速扩散至全球多国,逐渐变成一场全球性大瘟疫,是全球自第二次世界大战以来面临的最严峻危机。截至2020年4月15日,全球已有200多个国家和地区累计报告超过200万名确诊病例,导致超过11万名患者死亡。

目前公认的数据统计认为,首宗感染个案发病时间是2019年12月1日。首位前往医院就诊的患者可能出现于12月12日。12月26日,武汉市呼吸与重症医学科医生张继先最早发现和上报此不明原因肺炎,并怀疑该病属传染病。其后该病在武汉市出现大规模疫情。另外1月13日起,疫情陆续蔓延到泰国、日本及韩国等国家,1月21日波及美国西雅图,为亚洲以外的首例确诊个案。在1月30日中国境外证实有3个国家出现社区传播,世界卫生组织于当日宣布疫情为“国际公共卫生紧急事件”。2月底意大利、韩国与伊朗三国的确诊人数急速增加,29日,世卫组织将疫情的全球风险级别提升为“非常高”。3月11日,世卫组织宣布此次疫情已构成“全球大流行”,世卫组织并于3月13日表示欧洲已经成为当前大流行瘟疫的中心。

新冠病毒起源

新型冠状病毒(COVID-19)的是一种新病毒,属于冠状病毒家族,该家族还包括严重急性呼吸综合征(SARS)冠状病毒和引起某些类型普通感冒的病毒。新型冠状病毒nCoV-2019的自然宿主很可能是蝙蝠,但目前中间宿主还没有定论。近期一些研究指出,穿山甲,水貂还有蛇都可能是中间宿主。

新冠病毒结构

核酸序列分析证明COVID-19由新型冠状病毒(2019 novel coronavirus,2019-nCoV)引起。2019-nCoV为正链单链RNA病毒,基因组长约30 kb,两端为非编码区,中间为非结构蛋白编码区和结构蛋白编码区。非结构蛋白编码区主要包括开放读码框架1a和ORF1b基因,编码16个非结构蛋白,即NSP1~16。结构蛋白编码区主要编码刺突蛋白、包膜蛋白、膜蛋白和核衣壳蛋白。它进入细胞的受体与非典病毒SARS-CoV一样,均为ACE2。

可用的数据

NCBI

NCBI专门为新型冠状病毒的序列创建了一个主页: https://www.ncbi.nlm.nih.gov/genbank/sars-cov-2-seqs/

并且列出了最新可用的数据,并以所谓的YAML格式提供了可下载的数据信息: https://www.ncbi.nlm.nih.gov/core/assets/genbank/files/ncov-sequences.yaml

另外,NCBI还提供了一个包含所有Betacorona病毒的预建BLAST数据库。

GISAID

全球倡议共享所有流感数据的一个网站: https://www.gisaid.org/

世界各地的实验室生成越来越多的基因组序列,通过GISAID快速提供的新出现的冠状病毒(hCoV-19)相关的相关临床和流行病学数据。CoV-19的基因组序列对于设计和评估诊断测试,跟踪和追踪持续爆发以及确定潜在的干预选择至关重要。

中国国家基因库

中国国家基因库: https://db.cngb.org/datamart/disease/DATAdis19/

CoV-19新冠状病毒序列数据库是由中国国家基因库数据库(CNGBdb)通过整合来自多个开源数据平台的已发布冠状病毒序列数据而构建的。该数据库仅包含病毒序列,不包含人类序列。利用该数据库中的数据,科研人员可以进一步构建病毒系统树以揭示病原体相关特征,并为研究和分析新型冠状病毒的进化来源和病理机制提供有效参考。

数据命名

在研究过程中,不同人很容易使用不同的命名去进行分析和研究。为了使我们的意图更具可读性,国际上的研究者将使用以下命名约定:

  • nCov:新型冠状病毒又被称为SARS-Cov2,2019-nCov,COVID-19
  • SARS:非典型肺炎病毒
  • batSARS:表示在蝙蝠中观察到的SARS样病毒的数据

基本信息介绍和数据库介绍就这么多,下一次推文会开始和大家分享分析的部分。敬请大家关注哦!

参考链接:

  1. 维基百科
  2. https://www.who.int/emergencies/diseases/novel-coronavirus-2019
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 背景介绍
    • 事件发生
      • 新冠病毒起源
        • 新冠病毒结构
        • 可用的数据
          • NCBI
            • GISAID
              • 中国国家基因库
                • 数据命名
                相关产品与服务
                数据库
                云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档