上周迎来了铺天盖地的2017年终盘点盛宴,看过别人家的科研成果后,大家有没有把自己手头的材料也测一测基因组序列的冲动?不要激动,先让小编先给你分享几个常见的基因组大小查询网站,帮您查查看这个物种的基因组信息有哪些。
1
NCBI搜索Genome
网址:https://www.ncbi.nlm.nih.gov/genome
NCBI上进行物种基因组信息搜索是目前最常见,也是信息较全的一种方法。
(1)进入NCBI网页后(https://www.ncbi.nlm.nih.gov/),选择Genome搜索。
(2)Genome数据库中检索物种关键词,例如搜索人类基因组,输入human;
(4)如果希望进一步了解该物种基因组组装情况,可以进入“Genome Assembly and Annotation report”,在表格中可以看到该物种目前已有的组装版本,以及对应的基因组大小、染色体情况、注释的基因和蛋白数量等信息。
(5)点击“Assembly”中的组装结果,例如GCA_000001405.26,可以搜索该版本组装结果,在该页面中将展示物种在这一版本组装的详细信息,包括提交单位、物种名、提交时间、组装方法、组装水平,以及最终获得的组装大小和N50指标。
通过以上几个步骤,你就可以在NCBI Genome数据库中找到目标物种的基因组信息,当然,前提条件是该数据已经提交到NCBI中。除了以上这种简单操作外,如果希望进行分类检索,也可以选择在“Browse By Organism”中进行检索:https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/,其中将基因组数据分为了真核生物、原核生物、病毒、质体以及细胞器六大类,可以根据目标进行检索。
2
植物基因组数据库Plant genomes
网址:http://plabipd.de/index.ep
除了NCBI这种简单好用的数据库检索外,偶尔我们会碰到对某一个种水平或者属水平的物种基因组进行汇总,这种情况下使用NCBI就会显得略有不便,这里小编给大家推荐一个专门进行植物基因组检索的网站Plant genomes(http://plabipd.de/index.ep),在该数据库中可以根据发表时间、进化关系进行检索。
(1)按照Timeline perspective进行检索
放大或缩小该页面可以检索不同时间发表的植物基因组,该网站在检索内将已发表物种分为了双子叶植物、单子叶植物、非被子植物以及藻类四大类,每个发表的植物基因组都有对应的时间、基因组大小、发表期刊信息,这些信息一目了然,也方便我们进行对应文献的阅读。
(2)按照Phylogenetic perspective进行检索
进化关系分类中将已发表的植物按照进化关系进行排列,而且同属的归到一起,方便进行某个特定种属文献的调研。
3
动物基因组大小数据库
上述两种方法记录的通常的文献已发表的数据资料,包含了详细的基因组大小以及组装指标信息,但是有些物种的研究受限于其他因素导致无法进行基因组测序,这种情况下,研究人员通常会采用流式细胞术进行基因组大小测序,通过C-value换算出基因组大小。C值含义:生物单倍体基因组中DNA总量,单位通常是pg,换算成碱基数,1pg约为0.978 Gb。
Animal Genome Size Database目前已经收藏了6222个物种的基因组大小数据,包括3793个脊椎动物和2429个非脊椎动物,其中最小的基因组为短体线虫(Pratylenchus coffeae)的20Mb,最大的基因组为石花肺鱼(Protopterus aethiopicus)的132.83Gb。通过Search Data可以对目标物种进行基因组信息检索,具体如下:
(1)输入物种名
(2)检索页面内会出现查询到的物种相关信息,包括种属信息、C值、染色体数以及对应参考文献,如下图所示,检索草鱼基因组,C值显示为1.00,表明其基因组大小约978Mb。
以上给大家简单介绍了基因组信息检索的三大数据库,大家如果感兴趣,可以马上打开浏览器试试手啦!除此之外,还有很多针对某个物种搭建的数据库,例如水稻基因组数据库(https://shigen.nig.ac.jp/rice/oryzabase/)、玉米基因组数据库(https://archive.maizegdb.org/)、斑马鱼数据库(http://www.sanger.ac.uk/science/data/zebrafish-genome-project)等等,在实际项目过程中,各位小伙伴也可以根据自己的实际需求在PubMed中输入“关键词+genome”或者“关键词+assembly”进行检索,最终选择一个最合适的方法。
- END-
图片来源于网络侵删
关于我们
武汉菲沙基因信息有限公司作为国内目前唯一一家获得PacBio官方认证的测序服务提供商,是国内最早提供第三代测序分析和三维基因组学研究服务的公司,依托先进的第三代测序系统PacBio Sequel、20 万亿次高性能计算平台以及国际顶级水平的研发团队,菲沙基因致力于为国内外高校、科研机构、医药和工业客户提供全球领先的科研服务。
地址:武汉市东湖高新技术开发区高新大道666号B8栋
邮编:430075
领取专属 10元无门槛券
私享最新 技术干货