首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

RepeatMasker:查找基因上的重复序列

RepeatMasker软件用于查找基因上的重复序列,默认情况下,会将重复序列原有的碱基用N代替,从而达到标记重复序列的目的。...除此之外,也可以采用将重复序列转换为小写或者直接去除的方式,来标记重复序列。 该软件将输入的DNA序列与Dfam和Repbase数据库中已知的重复序列进行比对,从而识别输入序列中的重复序列。...当然也可以下载软件本地运行,安装过程如下 wget http://www.repeatmasker.org/RepeatMasker-open-4-0-7.tar.gz tar xzvf RepeatMasker-open...软件基本用法如下 RepeatMasker -pa 5 -small -species human chrM.fa -pa指定线程数,只有输入文件大于50Kb时才发挥作用;-small表示将重复序列转换为小写...运行完成后,会生成多个文件,后缀为masked的文件为标记重复序列后的文件,后缀为.out的文件保存了重复序列区间信息。

2.2K20

叶绿体基因重复序列分析工具~REPuter

叶绿体基因的文章通常都会做重复序列分析,其中会使用在线工具REPuter 来分析forward reverse complement palindromic 四种重复序列。...分别是 重复片段的最大 最小长度。然后还有两个距离。这两个距离是什么意思,现在我也不太清楚,可能是度量重复序列之间相似度的指标吧。我看到有论文里写会设置海明距离的。...在线版运行运算能力不够,所以尝试下载单机版REPuter,但是一直没有找到下载方法,无意间发现了vmatch程序,其中有一个perl脚本repfind.pl可以做forward 和 palindromic重复分析...-f 和 -p 参数分别指定计算forward和palindromic重复,-h 海明距离3, -l 最小重复单位30bp 之前将以上的内容分享到了简书,今天有人留言说使用REPuter 做重复序列分析的时候

1.7K10
您找到你想要的搜索结果了吗?
是的
没有找到

scATAC-seq1:由转录表观

最受关注的单细胞学无疑是单细胞转录学,其技术在十年内飞速发展,并在近两年不断出现空间转录学的新技术,实现空间维度高分辨率的转录测序。...同时,近几年人类和小鼠中各器官的单细胞转录图谱层出不穷。 但是从转录这一单一维度去研究细胞,进而分析科学问题,往往可能证据并不充分。...scATAC-seq技术的发展 作为原始的bulk ATAC-seq,我们知道其只能解释组织样本的染色质开放性特征,然而对于生命科学领域的许多研究涉及细胞分化的重要问题,也就是我们希望通过单细胞维度研究由一种细胞类型转变为另一种细胞类型的过程当中...总结 这一期推文中我主要介绍了表观学分析的重要意义以及表观学解决的科学问题。...应该来说,转录学是作为还原细胞类型基因表达特性的基础,而表观学对于细胞类型和细胞分化的调控规律能够提供一个全新的维度。在后续的文章中我会介绍scATAC-seq的技术方法和常用工具。

58520

文献笔记六十七:鉴定植物线粒体基因重复序列

University of Nebraska 这篇论文的具体研究内容和结论还没有看太明白,目前自己的关注点是这篇论文里提供了一个python脚本ROUSFinder.py,利用blast鉴定线粒体基因中的重复序列...MH645952.fna 脚本是用python2写的 使用前提是blastn已经安装到了/user/bin/目录下,如果blastn没有安装到这个目录下,可以使用-b参数指定blastn的所在路径 默认的重复序列最小长度是...gsajournals.figshare.com/articles/Supplemental_Material_for_Wynn_and_Christensen_2018/7425680 但是他放到了word文档了,自己要用的话需要我们复制文本文件中...Repeat_7 162 452326 452165 minus Repeat_8 160 15235 15394 plus Repeat_8 160 621660 621501 minus 包括重复序列的长度

61920

无惧性能烦恼-12款Bean拷贝工具压测大比拼

每次迭代5秒 OutputTimeUnit : TimeUnit.MILLISECONDS, 吞吐量时间单位ops/ms Threads : 10, 生成10个线程进行发压 # 实验对象 本次实验有2对象...对于知名的2JSON工具类,由于其本身定位不为高频Bean拷贝而设计,所以2者的效率对比前者差出好几倍。FastJson在这种场景下也明显快于Jackson。...继续往下观察,我们可以发现在上一轮实验中,表现比其他好的2JSON工具类性能出现了明显的下滑,原本高于JackSon吞吐量的FastJson,在本轮测试中屈居后位。...# 结论 通过两不同类型的对象,我们对12款工具进行了压测实验,最后结果表示BeanCopier和MapStruct依旧是市场中最顶级的两款工具类,两者均拥有相同于原生get/set的性能,在使用时需要考虑使用缓存...DbVO.setField05(dbDo.getField05()); DbVO.setField06(dbDo.getField06()); DbVO.setField07

2K41

snakemake杂记:多个转录比对多个基因得到多个bam文件然后合并

我的需求是: 我有10个基因,然后又12个转录数据,然后将这个12个基因数据分别比对这个10个基因,每个基因得到12个bam文件,然后将每个基因的12个bam文件合并 ,最终得到10个合并的...resources: mem_mb = 24000 shell: """ samtools index {input} """ 合并的步骤最开始的写法是...""" samtools merge -@ {threads} {output} {input.bams} """ 这样写的问题是合并的时候每个基因对应的是...请大家批判着看,欢迎大家指出其中的错误 欢迎大家关注我的公众号 小明的数据分析笔记本 小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录学...、基因学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

20910

mysql批量插入大量数据「建议收藏」

mysql批量插入大量数据 时间:2020年11月25日 今天遇到了一个批量插入大量数据任务,然后出于小白本能,直接for-each循环插入不就好了,于是手上开始噼里啪啦一顿操作,写好了从读取excel插入数据库的工作...("setField1" + i); testTest.setField2("setField2" + i); testTest.setField3("setField3" + i); testTest.setField4...("setField1" + i); testTest.setField2("setField2" + i); testTest.setField3("setField3" + i); testTest.setField4...MySQL JDBC驱动在默认情况下会无视executeBatch()语句,把我们期望批量执行的一sql语句拆散,一条一条地发给MySQL数据库,批量插入实际上是单条插入,直接造成较低的性能。...("setField1" + i); testTest.setField2("setField2" + i); testTest.setField3("setField3" + i); testTest.setField4

3.6K10
领券