【生信菜鸟经】漫谈如何跨越摆在生信入门路上的三大障碍

如何跨越摆在生信入门菜鸟面前的三大障碍的。

第一大障碍:透析数据背后的生物学知识,完成从测序数据到生物问题的连接;

我的做法: 通过谷歌百度了解fasta、fastq格式是什么?想必维基百科上的fastq格式介绍是每位生信菜鸟入门必看的吧~(度娘和谷兄是我一辈子的老师,感激不尽,感激不尽!!!)

基于此,我在论坛给大家列出了十几个常用的生信文件格式:http://www.biotrainee.com/forum-2-1.html

接着,通过陈魏学基因(或者其它中文动画讲解资料)了解测序原理、方法,视频反复的看,个人觉得具体细节比较难记。反正我知道提取的DNA是怎样变成手头上的ATCG这样的测序数据的。自然而然,就知道测序数据以及其它文件代表了什么生物知识了。 (测序原理啥的完全记不住啊,脑容量是硬伤,我要扩容去~)

第二大障碍:掌握一门编程语言完成对数据的任意转换,利用现成的工具-软件和数据库来掌握一门完整的数据分析流程,达到一通百通;

我的做法:

一个月看完鸟哥的私房菜,安装系统以及Linux上面的一些操作基本上没什么问题了。 一个月看完perl小骆驼,完成十道生信实战题,顺利出师,算是掌握了一门编程语言。(到现在没有进步,反而倒退了~让我哭会~)

shell、Perl脚本和R语言的学习基础知识都一样,没什么特别推荐的书籍,但是推荐每一个至少看3本以上,囫囵吞枣的了解基础知识就好,在实践中应用你看到的基础语法。

然后,我就按照某生信服务公司的培训班课表学习了一些软件,捣鼓了fastqc、BWA、samtools、IGV等软件,基本上学会了在Linux上安装各种类型的软件。期间还穿插了学习R语言,入了个门,会装包、看得懂代码、会运行而已。(当初的我软件装到奔溃,参数看到眼花,回想起来都是辛酸泪啊~)

接着,通过生信菜鸟团看到宾夕法尼亚大学的应用生物信息学课程,系统地学习了生信数据分析,学会了如何开展一个生信项目。(这个课程非常棒,感谢乐于分享的群主!!)

在论坛可以看到所有课程列表:http://www.biotrainee.com/forum-100-1.html

最后,去年九月份确定自己的研究方向后,拿到第一批宏基因组数据练手,目前还在建立自己的数据分析流程(论独立搭建一个pipeline的重要性,让我知道原来我还是那么菜,要学的东西很多很多。)

第三大障碍:充分理解你的数据分析结果并给出可靠的结论;

我还没跨越这个障碍,就拿我看本领域的相关文献来说,如果我最后分析湖泊水体微生物群体的宏基因组数据,在讨论物种多样性及功能这个问题似乎要回归生态学。所以,我可能需要修炼一下内功,了解一下生态学知识。(待我要出成功的时候,再来补充,嘻嘻~)

对找差异基因来说,该设定什么样的阈值来判别是否显著差异呢?最后得到的显著差异基因个数是多少才算是合理范围呢?foldchange和P值的分布应该是怎么样的呢?哪些基因是应该差异的,哪些是不可能差异的呢?

对找变异来说,什么样的突变频率是正常的呢?跟dbSNP或者千人基因组计划比较起来应该有怎么样的overlap呢?纯合杂合比例有范围吗?突变上下文有意义吗?突变发生的部位有什么样的规律,大概哪种结果你能一眼就判断出是错的呢?

对于表达调控来说,调控区域的数量级应该是多少呢?不同调控元件的调控性质在数据结果如何体现?不同批次实验差异应该很大吗?不同细胞组织或者生长环境状态的区别很大吗?该如何在数据里面体现出来呢?

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-02-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序员互动联盟

自学编程需要过三关

外行看热闹,内行看门道。学习本身是一件辛苦的事情,自学编程更是一件困难的事情。基本上都存在入门难,遇到问题解决不了就停滞了,但往往就在一念之间,不进则退。都说自...

3388
来自专栏云飞学编程

为什么说python入门很简单,但是在你这很难?

你辛辛苦苦,埋头苦学了好久基础知识,甚至书都被翻烂了,但是跟着别人的视频或者文章写一个代码,一运行,一堆一堆的error!于是你又要吭哧吭哧的重新排查

672
来自专栏大数据文摘

业界 | 如何像程序员一样思考

即使你的运气一向很好,这种方法也并不值得使用。事实上,它可能是最糟糕的解决方法,因为会浪费大量的时间。

411
来自专栏机器之心

观点 | 属于动态图的未来:横向对比PyTorch与Keras

选自reddit 作者:Marc Schmidt 机器之心编译 参与:Rick、李泽南 PyTorch 对机器学习领域的影响正在不断扩大,人们在使用中也在不断...

2566
来自专栏理论坞

学习UI设计的4个小技巧

UI设计越来越火,很多朋友在问UI设计要学什么?怎么学?关于UI设计的学习,常常会听到这么一些忠告“多看 多想 多做”,但作为新人更想知道咋看、咋想、咋做。下面...

542
来自专栏PPV课数据科学社区

【学习】利用爬虫技术能做到哪些很酷、很有趣、很有用的事情?

分析篇 先给大家看一些分析结果吧。大家几点睡觉呢? 我们来统计一下 sleep 这个词在 Twitter 上出现的频率。 看来很多人喜欢在睡前会说一声我睡了。那...

3847
来自专栏知晓程序

有了这 4 款小程序,天上「下开水」也不怕

而广州,则是高温预警和暴雨预警齐齐发布,小伙伴们纷纷吐槽——这是要「下开水」的节奏啊。

561
来自专栏BestSDK

入门UI设计师必看,学完这7条规则你就上道了

由于一直在网上学习知识,都知道现在的信息太过繁杂,什么样的信息都有,一篇文章真正能获取的干货真心太少。而且什么知识都有,各有各的看法和想法。当你只看到别人的想法...

2513
来自专栏web前端教室

【今晚8点】- 先行者计划:作业 &总结 & 讲一些有难度的事情

这就至于了一个问题,很多同学会花了很多心思在教程的收集上,花心思在各种示例、demo等的代码的整理上面。就像七龙珠一样,收集了n篇教程之后,你的前端开发能力就自...

660
来自专栏闵开慧

给程序入门者的一点建议

Java自学之道(一) 给程序入门者的一点建议     在书场上看到很多有关Java的书籍,但这就像进了瓜地里挑瓜挑的眼花,很多人不知道自己到底该选那本书好。很...

2736

扫描关注云+社区