生信人的linux考试

一、在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列。

二、在创建好的文件夹下面,比如我的是 /Users/jimmy/tmp/1/2/3/4/5/6/7/8/9 ,里面创建文本文件 me.txt

三、在文本文件 me.txt 里面输入内容:

Go to: http://www.biotrainee.com/I love bioinfomatics.And you ?

前三题效果如下:

前三题效果

四、删除上面创建的文件夹 1/2/3/4/5/6/7/8/9 及文本文件 me.txt

五、在任意文件夹下面创建 folder 1~5这5个文件夹,然后每个文件夹下面继续创建 folder 1~5这5个文件夹,效果如下:

第五题效果

六、在第五题创建的每一个文件夹下面都 创建第二题文本文件 me.txt ,内容也要一样。

七,再次删除掉前面几个步骤建立的文件夹及文件

八、下载 http://www.biotrainee.com/jmzeng/igv/test.bed 文件,后在里面选择含有 H3K4me3 的那一行是第几行,该文件总共有几行。

九、下载 http://www.biotrainee.com/jmzeng/rmDuplicate.zip 文件,并且解压,查看里面的文件夹结构

十、打开第九题解压的文件,进入 rmDuplicate/samtools/single 文件夹里面,查看后缀为 .sam 的文件,搞清楚 生物信息学里面的 SAM/BAM 定义是什么。

十一、安装 samtools 软件

十二、打开 后缀为 BAM 的文件,找到产生该文件的命令。 提示一下命令是:

/home/jianmingzeng/biosoft/bowtie/bowtie2-2.2.9/bowtie2-align-s --wrapper basic-0 -p 20 -x /home/jianmingzeng/reference/index/bowtie/hg38 -S /home/jianmingzeng/data/public/allMouse/alignment/WT_rep2_Input.sam -U /tmp/41440.unp

十三题、根据上面的命令,找到我使用的参考基因组 /home/jianmingzeng/reference/index/bowtie/hg38 具体有多少条染色体。

十四题、上面的后缀为 BAM 的文件的第二列,只有 0 和 16 两个数字,用 cut/sort/uniq等命令统计它们的个数。

十五题、重新打开 rmDuplicate/samtools/paired 文件夹下面的后缀为 BAM 的文件,再次查看第二列,并且统计

十六题、下载 http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip 文件,并且解压,查看里面的文件夹结构, 这个文件有2.3M,注意留心下载时间及下载速度。

十七题、解压 sickle-results/single_tmp_fastqc.zip 文件,并且进入解压后的文件夹,找到 fastqc_data.txt 文件,并且搜索该文本文件以 >>开头的有多少行?

十八题、下载 http://www.biotrainee.com/jmzeng/tmp/hg38.tss 文件,去NCBI找到 TP53/BRCA1等自己感兴趣的基因对应的 refseq数据库 ID,然后找到它们的 hg38.tss 文件的哪一行。

https://www.ncbi.nlm.nih.gov/gene/7157

十九题、解析 hg38.tss 文件,统计每条染色体的基因个数。

二十题、解析 hg38.tss 文件,统计 NMNR开头的熟练,了解 NMNR开头的含义。

另外,本练习题应该会持续更新,欢迎点击 http://www.bio-info-trainee.com/2900.html 我博客 继续关注。

又被某些变态举报了我们诱导粉丝点击广告,这次实在是太意外了,感觉总是有刁民要害朕,唉,本来准备再骂一番,想了想,作为生信界第一大号,不能丢了风度,反正一天的广告费才几十块钱。(你相信吗?)

咱不要了。

一口老血都喷出来了

未来两个星期大家都看不到广告了,恭喜咯,也恭喜那个刁民。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-12-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏java架构技术

从大神的角度深入理解MySQL,值得收藏~

在此我向大家推荐一个架构学习交流群。程序员面试社区:236283328 里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分...

301
来自专栏JavaWeb

原 荐 MySQL-性能优化-优化设计和设计

1794
来自专栏贾鹏辉的技术专栏@CrazyCodeBoy

Android Studio 2.2新特性:新布局、Firebase、OpenJDK以及Java 8

尊重版权,未经授权不得转载 本文出自:贾鹏辉的技术博客(http://www.devio.org) 前几天,收到了Android Studio 2.2的...

3114
来自专栏FreeBuf

任意代码保护与内核代码注入的那些事儿

类似 WannaCry 和 Slingshot 这样的恶意软件最常用的一种攻击技术就是内核代码注入,在近期刚刚发布的 Windows 10 Creators 更...

820
来自专栏大史住在大前端

webpack4.0各个击破(6)—— Loader篇

loader是webpack的核心概念之一,它的基本工作流是将一个文件以字符串的形式读入,对其进行语法分析及转换(或者直接在loader中引入现成的编译工具,例...

851
来自专栏前端大白专栏

基于mpvue开发微信小程序(项目已开源)

1806
来自专栏十月梦想

nodejs模板引擎ejs

nodejs的后台模板引擎主要分为两种ejs和jade.简单说一下两者区别吧,ejs学习成本低,效率不是很高(主要是先把模板中内容解析字符串),jade学习成本...

641
来自专栏哲学驱动设计

《OEA - 实体扩展属性系统 - 设计方案说明书》

    这篇设计文档是 12 月份写来参加公司的研发峰会的,自己倒是信心满满,不过最后还是没有入围。现在想想也没啥大用,所以贴出来,期待与园友交流。     文...

2587
来自专栏IT技术精选文摘

从Java视角理解系统结构(二)CPU缓存

众所周知, CPU是计算机的大脑, 它负责执行程序的指令; 内存负责存数据, 包括程序自身数据. 同样大家都知道, 内存比CPU慢很多. 其实在30年前, CP...

2189
来自专栏Kirito的技术分享

从Spring Session源码看Session机制的实现细节

去年我曾经写过几篇和 Spring Session 相关的文章,从一个未接触过 Spring Session 的初学者视角介绍了 Spring Session ...

50912

扫码关注云+社区