如何构建基因组数据库

构建数据库是对测序数据和分析数据的最好管理方式,古奥的基因组数据库正是这样一款展示、搜索与查询基因组信息的好工具,今天小编给大家简单介绍一下构建一个基因组数据库需要注意些什么问题。

1

我想做一个基因组数据库,需要什么数据?都是必需提供的吗?

答:构建基因组数据库一共需要5个文件,包括:

(1)基因组序列文件:基因组组装后获得的序列文件,通常为fasta格式;

(2)基因组注释文件:GFF或GTF文件,基因组组装后利用软件分析得到的注释文件,具体格式示例参见http://genome.ucsc.edu/FAQ/FAQformat.html#format3;

(3)蛋白序列文件:species.pep.fa或者species.protein.fa;

(4)CDS序列文件:species.cds.fa;

(5)转录本序列文件:species.cDNA.fa或者是species.transcript.fa

针对以上5个文件,基因组序列文件是必须提供的,其余4个文件可以交由公司进行分析获得。所以简单来讲,您只需要提供基因组组装结果就可以啦。

2

除了数据外,我还需要提供什么其他材料?

答: 数据库构建中将会根据个人需求添加一系列的文本信息,具体分为两部分:

(1)数据库整体信息

包括数据库名称、logo、数据库简介、合作单位、致谢单位等信息。

(2)物种信息

包括物种名称、品种名称、物种图片、物种性状信息、参考文献等。

3

基因组数据库包含了哪些功能?

答:基因组数据库主要模块分为以下几个部分:

(1)基因搜索功能

可以根据基因名称、基因ID、基因位置进行搜索,获得基因的具体信息,包括基因位置、类型、长度、序列、基因结构、基因注释信息。

(2)JBrowse可视化展示功能

JBrowse可视化展示体现在两方面,一方面是对整个基因组的可视化展示,展示内容可以根据个人具体需求进行添加,例如基因组序列、基因和转录本、重复序列、GC、启动子结构等;另一方面是在基因搜索过程中直接定位到JBrowse界面进行展示。

(3)BLAST功能

可将目标序列在整个基因组序列中进行blast比对,也可以在整个转录组序列中进行blast比对,还可以根据客户具体需求添加所需的比对库,例如添加拟南芥的基因组库进行比对。

(4)引物设计功能

(5)序列下载功能

包括基因组序列、蛋白质序列、注释文件。还可以设定上下游序列区间后进行大批量序列下载。

4

我有多个基因组数据,能放到一个数据库中展示吗?

答:可以。如果你有多个基因组数据,我们可以将其整合到一个页面中进行管理,通过基因组切换按钮展示不同基因组数据库,方便统一管理已有基因组数据资源。

5

这个数据库是部署在本地还是云端的?

答:都可以。我们会根据客户的具体需求推荐部署方式,部署在云端的数据库可以随时随地通过线上访问查看,由古奥进行统一维护;部署在本地的数据库则受限于本地服务器情况,需要投入一定的人力物力进行维护,如果服务器无法联网,则只限于本地访问,外部人员无法访问。

6

数据库可以更新数据吗?

答:可以。已构建好的数据库如果有新的数据需要增加或更新,可以随时与我们联系进行数据更新操作。

7

如果我有个性化的功能模块要求要怎么办?

答:如果在已有的数据库模式上,需要增加个性化的功能需求,可以与我们的产品经理进行沟通,根据客户的具体需要制定产品需求方案,然后进行个性化功能开发。

8

除了基因组数据外,还能增加其他组学数据,形成多组学数据库吗?

答:可以。除了基因组数据外,我们还可以为客户提供DNA变异数据库、基因表达数据库、QTL性状数据库,以及基于以上的整合数据库,形成一个多组学知识相关关联的数据库。

sdfsdf

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181122G17AQS00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券