首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

小麦生信菜鸟(三)-常见问题

1

29

本期作者:Rui Wang

上次把小麦最新的物理图谱介绍了一下,群里最近有小伙伴经常讨论一些相关的问题,我就找了两个比较有代表性的跟大家探讨一下。

1.接着上次咱们那个case study,我们的QTL markers与在RefSeq 1.0上的物理图谱之间线性关系很差,那我们该怎么办呢?

(1).还记得我们这个小麦生信系列的第一篇(小麦生信必备网站和数据库一)给大家介绍的那个万能数据库GrainGenes吧,除了RefSeq1.0以外,还有很多其它数据库啊。假如我们的QTL在A或者B genome上,那可以对Zavitan(公众号对这个数据库有介绍:野生二粒小麦基因组在science发布;野生二粒小麦基因组下载)进行BLAST啊,如下图

出来的结果如下,红色方框处就是物理图谱的位置。我没有找到这个genome的可视化网站(JBrowse),大家有知道的请在留言处告知。

(2).假如这个QTL是在D genome上,也可以在GrainGenes对节节麦的两个不同版本的数据库进行BLAST(我们的公众号也有介绍:Nature在线发表小麦D基因组供体——粗山羊草的基因组研究论文;又一篇节节麦基因组文章来袭--聊一聊你的关注点在哪?)。当然也可以去官方网站进行BLAST http://aegilops.wheat.ucdavis.edu/ATGSP/blast.php,出来的结果跟上图差不多,首先找到我们这个marker所对应的物理图谱位置。然后进入下面这个JBrowse可视化网站,在红色方框处手动输入上面所找出来的物理位置,就可以查看相关的信息了。这个D genome JBrowse用法跟小麦那个是一样的,大家在上面多花些时间,同样可以找出很多有用的东西。

http://aegilops.wheat.ucdavis.edu/jbrowse/index.html?data=Aet%2Fdata%2F&loc

更多的对这个数据库的使用请参见我们以前的另一篇推送(节节麦基因组数据使用和下载)

(3),实在找不到好的相关性,那也不要气馁,我们还有各种小麦的近亲和远亲啊,这些数据库在我们上次介绍的IWGSC那个BLAST数据库都可以选择,或者在GrainGenes,EnsemblePlants里也都有。利用这些数据库有的时候不仅可以找到更好的线性关系或者candidate gene,有时也可以帮助更好的理解candidate gene的进化等等各方面信息,我们以后会结合EnsemblePlants里Compara功能给大家介绍一下这方面的信息。下图是GrainGenes里各种数据库的页面。

2.现在QTL的文章已经海量了,我们做出的结果跟前人研究有什么关系呢?

其实思路很简单,那就是找到前人那个基因或者marker的序列在我们所谈到过的数据库中进行BLAST来确定它们的物理位置,这样就可以很直观的比较跟我们的QTL之间的距离了。

(1).在NCBI上找已克隆的小麦基因序列:(https://www.ncbi.nlm.nih.gov/gene/)。这个大家应该比较熟悉,我就直接贴一个结果图,我搜的是“Wheat Q”,结果中第一个就是,点进去就可以找到相关信息和序列了。

(2).前人的研究多用的是SSR marker或者DArT marker:

首先再提一下GrainGenes这个数据库,基本上所有的SSR marker信息和引物序列都可以在这个网站上找到,而DArT marker的序列我只能在发表的文章中找,还不知道哪个网站能把所有的DArT marker序列全列出来(知道的小伙伴赶紧分享给大家吧)。找到这些序列以后就可以直接去BLAST了,不过SSR marker这里需要注意一件事情:一般找出来的序列都只是两个引物的序列,也就20-30bp,进行BLAST的时候经常不能得到结果,是因为默认的Basic search程序E value非常低。这时就需要用advanced search来手动调节一下E value的阈值,一般调到10就行了。当然,在advanced search中还有很多其它设置选项,大家可以多调节一下,看看搜出来的结果会有什么不同(这里又不得不说GrainGenes数据库的BLAST,这个BLAST用basic search搜SSR引物序列一般是没问题的,反正这几天IWGSC的BLAST也不能用,大家都来用GrainGenes吧)。

(3).但如果找不到SSR引物或DArT序列怎么办?再说每次都得一个一个找,多麻烦啊!有没有一个一劳永逸的办法呢!办法肯定是有的,就是在开始的时候稍微得花点时间,看看我们群里有没有大公无私的小伙伴为我们做一下分享给大家。方法就是按照我们上次介绍的IWGSC RefSeq1.0的JBrowse中,选定一条染色体后,放到最小的view(整条染色体),数据库就会给出整条染色体的所有相关marker,然后点击下图中的那个小三角,再点击“save track data”就能下载这条染色体中所有的marker(90K, SSR, DArT需要分三次下载)。有了这个文件,我们以后拿到任何一个marker名字,在这个文件中一搜就找到了。大家可以每人认领一条或几条染色体,然后最后再整理到一起!

今天小编就不额外加干货了,大家如果没过瘾,可以再把今天引用的五篇以前的推送好好看一下,保证有收获!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180129G00NJV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券