首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从零开始的异世界生信学习 linux部分 linux 基础---学习笔记-3 Linux三剑客 grep,sed,awk

三个适用的命令—grep,sed,awk 1.grep 一种强大的文本搜索工具,它能使用正则表达式匹配模式搜索文本,并把匹配的行打印出来 格式:grep options pattern file 常见参数...less -S Data/example.gtf | grep -w -c 'gene' ##统计含有gene的行的数量 -v:反向选择,即输出没有没有匹配的行less -S Data/example.gtf...| grep -w -v -c 'gene' ##统计没有gene的行的数量 -n:显示匹配成功的行所在的行号 -r:从目录中查找pattern ##-r后面接的是文件目录,不能接其他的 -e:...ee' + 匹配1次或者多次 ##cat readme.txt | grep 're\+' * 匹配0次或者多次 ## cat readme.txt | grep 're*' *不需要转义 {...可以实现查找特定匹配的行并输出某几列数据,$表示哪一列 5 Linux常见符号及其含义 常见符号 通配符 正则表达式 图片

55600

生信分析中linux的使用5-grep

生信技能树学习笔记 Linux文本处理——grep grep:一种强大的文本搜索工具,它能使用正则表达式匹配模式搜索文本,并把匹配的行打印出来 格式:grep [options] pattern file...常见参数: -w:word 精确查找某个关键词 pattern -c:统计匹配成功的行的数量 -v:反向选择,即输出没有没有匹配的行 -n:显示匹配成功的行所在的行号 -r:从目录中查找pattern...-e:指定多个匹配模式 -f:从指定文件中读取要匹配的 pattern -i:忽略大小写 示例 问题1:精确查找某个内容 精确后-w 问题2:当单词前后有符号如何精确匹配 带着前后一起匹配 如何打空格...-e 方法二 创建关键词文件 用grep 读取 正则表达式:是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑...匹配之前项0次或者一次 另一种方法 -E 后面的字符都识别为正则表达式 + 匹配1次或者多次 * 匹配0次或者多次 {n} 匹配n次 {n,} 匹配至少n次 {m,n} 至少m,最多n [] 匹配任意一个

9710
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    压缩感知重构算法之正则化正交匹配追踪(ROMP)

    看完一脸懵逼,真的没看懂啥,虽然页数不多,在下文中就单纯的借鉴文章中的算法流程。   正交匹配追踪算法每次迭代均只选择与残差最相关的一列,自然人们会想:“每次迭代是否可以多选几列呢?”...,正则化正交匹配追踪(RegularizedOMP)就是其中一种改进方法。...似乎用叙述语言描述不清楚,下面给出一种实现第(2)(3)步的算法流程图: ?   贴出文献[1]中的算法流程: ?   ...32行,后续满足条件的J(mm)也分别赋值给了J0_tmp(iJ0)(iJ0=iJ0+1),所以最后的J0 =J0_tmp(1:iJ0)(也就是初始的基准Jval(kk)和后面满足条件的m),在流程图中...本程序在循环中填加了“kk”一行代码并将“M = M_set(mm)”一行的分号去掉,这是为了在运行过程中可以观察程序运行状态、知道程序到哪一个位置。

    2K60

    跟萌老师学Linux的第三天

    grep:一种强大的文本搜索工具,它能使用正则表达式匹配模式搜索文本,并把匹配的行打印出来 -w:word 精确查找某个关键词 pattern -c:统计匹配成功的行的数量 -v:反向选择,即输出没有没有匹配的行...-n:显示匹配成功的行所在的行号 -r:从目录中查找pattern -e:指定多个匹配模式 -f:从指定文件中读取要匹配的 pattern -i:忽略大小写 正则表达式 是对字符串操作的一种逻辑公式,...ee' +匹配1次或者多次 cat readme.txt | grep 're\+' *匹配0次或者多次 {n} 匹配n次 {n,} 匹配至少n次 {m,n} 至少m,最多n [] 匹配任意一个 cat...表示除了第二行 常见 'script' command :增删改查 a∶append,在指定行的后增加一行,内容为 a 的后面接的字串 i∶insert,在指定行的前增加一行,内容为 i 的后面接的字串...,可以简单理解为列数 NR :已处理的输入记录数,可以简单理解为行数 awk 条件和循环语句: if:条件判断 awk ' { if (判断条件) {yes} else {no} } ' for:循环语句

    1.1K10

    认识这对搭档,解决90%的查询问题

    语法规则如下: index(单元格区域,第几行,第几列) 单元格区域:就是要查找的数据范围; 第几行:在查找范围的第几行; 第几列:在查找范围的第几列。(其中“第几列”是可以省略的。)...这个案例中,我们愉快地就写下了这样的公式 =match("猴子大大",$B$2:$B$11,0) 返回结果是7,表示匹配到“猴子大大”在姓名列的第7行。...index+match的最强大的之处是,它们能实现多条件查找。 上面案例演示中,我们先match出猴子大大在B列的位置,然后再用index返回A列对应的值,得出了对应的工号。...实际工作中,我们面对的可能是很庞大的数据,要查询的列会很多,手动地一个列对应一个公式的写下来,不仅效率低下,还容易出错。 那有没有办法可以只写一次公式,就能返回所有列的结果吗?办法当然是有的。...好了,在A2:F11的这个区域里第7行第1列交叉处的单元格的值,就为猴子大大的工号信息。对于 “基本工资”的查找,同理,在指定区域的第7行第6列查找;其它信息,依次类推。

    82720

    生信马拉松 Day13 Linux-3笔记

    文本处理三架马车grep sed awk1、grep一种强大的文本搜索工具,能使用正则表达式匹配搜索文本,并把匹配的行打印出来grep options pattern file实际容忍度很高,pattern...写在左后,或者options写在pattern后面都可以无法查找压缩文件,只能看普通的文本文件,所以可以先用less打开文件然后再grep-r 从目录中,看看内部的所有文本文件有没有这个关键词-n 显示文件中的行号...匹配之前项0次或1次的情况 cat Data/example.fa | grep 'A\?TCGG..$' -n 或者-E开启扩展正则,此时不用写\符号,会自动把?识别为正则表达式里的?...就不出结果了+ 匹配1次多多次的情况,也是扩展正则 cat Data/example.fa | grep 'A\+TCGG..$' -n* 匹配0次或多次,是普通正则所以用grep时可以都带上-E 这样避免忘记是普通正则还是扩展正则...d:delete,删除某一行或某几行,也可以指定删除匹配上的行 cat readme.txt | sed '1d'c:change,改变指定行的内容,整行替换s:更改或替换字符串,改变行中的部分内容

    15120

    MySQL 慢查询、 索引、 事务隔离级别

    ]  常用选项(options)解释 -g pattern:只显示与模式匹配的语句,大小写不敏感。 -r:反转排序顺序。...是 为 了 加 快 查 询 的 速 度 , 如 果 没 有 索 引 , M y S Q L 在 查 询 时 , 只 能 从 第 一 条 记 录 开 始 然 后 读 完 整 个 表 找 到 匹配 的 行...如果可以,则为 1 -- Key_name:索引的名称 -Seq_in_index:索引中的列序列号,从 1 开始 -- Column_name:列名称 -- Collation:列以什么方式存储在索引中...=和 in 可以乱序,比如 a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意顺序,mysql 的查询优化器会帮你优化成索引 可以识别的形式; 3....  幻读(PhantomRead): 在一个事务的两次查询中数据笔数不一致,例如有一个事务查询了几列(Row)数据,而另一个事务却在 此时插入了新的几列数据,先前的事务在接下来的查询中,就会发现有几列数据是它先前所没有的

    2.8K50

    第五章 正则表达式&字符处理

    命令组合应用:tail -n +3 f1 | head -n 3 ---显示3-5行 2)grep抓取命令 grep命令可以从文档中抓取显示包含指定字符的行,在日常使用中比较常用。...,改变当前行的号码 p 打印模式空间的行 P 打印模式空间的第一行 q 退出sed r file 从file中读取行 t label if分支,从最后一行开始开始,一旦满足要求,将直接到带有标号的命令出...}\ 匹配至少5个o的行 由上表可见,sed的功能十分繁复,所以我们初学可以暂时不必记忆那么多的格式,只需要先掌握咱们案例中最常用的几项参数设置就好。...另外,在vi的末行模式下还有很多实用的命令可以帮助我们快速编辑文档: :wq ---保存退出 :q!...---跳转到第100行的位置 :setbackup ---在进行编辑前,自动的做文件备份,备份到与原 文件同目录下,文件名中加~ 在命令模式下,也有很多的快捷键可以帮助我们快捷操作:

    2.1K20

    Excel的匹配函数全应用

    另一种更麻烦的错误就是乱码,换言之是Excel不可识别的乱码,此时我都会全选数据粘贴到UE中,然后把乱码替换掉再粘贴回Excel表。...那如何让他们相等呢,方法有很多,看一下gif图,在这里介绍我比较喜欢的一种,文本转数字就是进行一次数字运算,比如乘以1,加0均可;数字转文本就是进行一次文本运算 用&连接符连接一个空的文本就可以强制转换了...模糊匹配的关键不是函数的用法,而是如何根据刚刚说了一串的文本条件(大于8分怎样,大于六分怎样的文本)转化为excel可识别的辅助列表。 大家看一下辅助表的创建过程。...之前的每一个文字描述区间都转化为一行数据,辅助表有两个条件:1、每个数字区间的下限(最小值)作为第一列的判断条件,对应的返回值作为第二列2、第一列的数字必须从小到大排序(否则会出现什么错误可以自己试一下...在分享本方法之前,先和各位朋友分享两个小函数及他们的用法。 首先介绍一下Find函数,Find函数在文本函数中经常遇到,顾名思义,她是查找的意思,用于查找某个文本在另外一个文本中的位置。

    3.8K51

    完全理解不了Vlookup,怎么破?

    当有多张表时,如何将一个excel表格的数据匹配到另一个表中?这时候就需要使用vlookup函数。它可以按条件查找出数据。...因为班级信息在表1学生信息表里,所以我们在表1里找查找。查找到姓名是猴子的行。经过查找,我们发现在表1里有个学生的姓名都叫做猴子,所以我们找到两行数据。 image.png 第3步,第几列。...3)最后,在插入函数对话框中搜索函数中输入vlookup,然后点击转到,就可以找到这个函数。 image.png 点击“确定”就会跳出参数设置的对话框。...image.png 在第2行单元格中输入公式:=C2&B2,这里&是将两个单元格的内容拼接在一起。 image.png 第2步,用辅助列作为vlookup的查找条件,就可以查找出来了。...它属于excel里三种引用的一种,不了解的可以参考之前的文章补充学习:zhihu.com/question/2591 掌握vlookup非常重要,它有时候决定了你在找工作时是否会被录用,所以实践起来吧。

    1.8K11

    VLOOKUP 到底有多重要?

    当有多张表时,如何将一个excel表格的数据匹配到另一个表中?这时候就需要使用vlookup函数。它可以按条件查找出数据。...因为班级信息在表1学生信息表里,所以我们在表1里找查找。查找到姓名是猴子的行。经过查找,我们发现在表1里有个学生的姓名都叫做猴子,所以我们找到两行数据。 image.png 第3步,第几列。...3)最后,在插入函数对话框中搜索函数中输入vlookup,然后点击转到,就可以找到这个函数。 image.png 点击“确定”就会跳出参数设置的对话框。...image.png 在第2行单元格中输入公式:=C2&B2,这里&是将两个单元格的内容拼接在一起。 image.png 第2步,用辅助列作为vlookup的查找条件,就可以查找出来了。...它属于excel里三种引用的一种,不了解的可以参考之前的文章补充学习:zhihu.com/question/2591 掌握vlookup非常重要,它有时候决定了你在找工作时是否会被录用,所以实践起来吧。

    1.9K2625

    VLOOKUP 到底有多重要?

    当有多张表时,如何将一个excel表格的数据匹配到另一个表中?这时候就需要使用vlookup函数。它可以按条件查找出数据。...因为班级信息在表1学生信息表里,所以我们在表1里找查找。查找到姓名是猴子的行。经过查找,我们发现在表1里有个学生的姓名都叫做猴子,所以我们找到两行数据。 第3步,第几列。...3)最后,在插入函数对话框中搜索函数中输入vlookup,然后点击转到,就可以找到这个函数。 点击“确定”就会跳出参数设置的对话框。...在第2行单元格中输入公式:=C2&B2,这里&是将两个单元格的内容拼接在一起。 第2步,用辅助列作为vlookup的查找条件,就可以查找出来了。 如何使用vlookup进行数据分组?...它属于excel里三种引用的一种,不了解的可以参考之前的文章补充学习:https://www.zhihu.com/question/25912769/answer/438898396 掌握vlookup

    1.7K10

    如果有一天你被这么问MySQL,说明你遇到较真的了

    主键索引(PRIMARY KEY) :主键索引是一种特殊的唯一索引,它不仅要求索引中的每一行数据都必须是唯一的,还被用作表的主键,用于唯一标识表中的每一行。...这是因为哈希索引通过计算查询条件的哈希值,并在哈希表中查找对应的记录,通常只需要一次IO操作即可完成查询,而B+树索引可能需要多次匹配,因此哈希索引在等值查询中的效率更高。...数据结构: 聚簇索引:数据行存储在与索引相同的B+树结构中,这意味着数据行和索引是同一棵树的节点。 非聚簇索引:索引和主键ID存储在B+树结构中,但数据行本身并不存储在索引结构中。...前缀索引可以减少索引的大小,提高查询效率。 尽量使用覆盖索引,即索引中包含所有查询条件的列,这样可以避免回表操作,减少IO开销。 索引的选择性是指不重复的索引值数量与记录总数的比值。...主键索引:用于唯一标识表中的每一行记录,通常用于主键字段。 唯一索引:用于确保表中的某一列或几列的值是唯一的,可以提高查询效率。 普通索引:用于加速查询,但不保证唯一性。

    6310

    编程小技巧之 Linux 文本处理命令(二)

    sort 命令将以默认的方式将文本文件的第一列以ASCII 码的次序排序,并将结果输出到标准输出。-k 参数可以指定其根据第几列进行排序。...uniq 命令一般用于检查和删除文件中重复出现的行,我们可以使用它来计算 order.txt 中用户出现的次数。...sed 最简单的使用方法就是替换文本。比如,我们要将上述的 order.txt 中的 u全部替换为user,则可以使用如下命令。...其次,我们希望用[描述]中的描述文本来替换整个超链接文本,所以需要先识别出方括号中的内容,则需要将其用()单独括起来,表示一个子表达式,也就是\[(.*)\]\(.*\)。...最后,sed 的 s///g 模式下,s 表示替换模式,g 表示匹配每一行有行首到行尾的所有字符,加 g 则一行有多个链接可以匹配处理,不加只能匹配第一个。

    93200

    Shell 正则表达式及综合案例及文本处理工具

    作用 ^ 匹配一行的开头 $ 匹配一行的结束 ....匹配任意一个字符 * *不单独使用,他和上一个字符连用,表示匹配上一个字符0次或者多次 [] []表示匹配某个范围内的一个字符 \ 表示转义字符,一般和特殊字符连用表示特殊字符本身 例1:匹配以a字符开头的...“剪”,具体的说就是在文件中负责剪切数据用的。... pattern:表示awk 在数据中查找的内容,就是匹配模式 action:在找到匹配内容时所执行的一系列命令 选项参数 功能 -F 指定文件分割符 -v 分支一个用户定义变量 不过有些版本的系统是不支持...只显示/etc/passwd 的第一列和第七列,以逗号分割,且在所有行前面添加列 名"start"在最后一行添加"over"  cat /etc/passwd | awk -F ":" '/^root

    37930

    三剑客命令

    *x$" 123.txt #这种情况会把文件中从第一个r开头一直x结尾的匹配出来,中间如果有两三个x,也会被匹配出来 指定具体信息阻止贪婪匹配 grep "^r....sed是一种流编辑器,它一次处理一行内容。...处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。...r /path/somefile 读取指定文件的文本至模式空间中匹配到的行后 = 为模式空间中的行打印行号 !...~/^#|^$' 文件 总结:awk命令中符号1,2,3 :取第几列信息NF :取最后一列(NF-n) :取倒数第n列 正则表达式与操作符 awk同sed一样也可以通过模式匹配来对输入的文本进行匹配处理

    3.4K10

    _Shell 正则表达式及综合案例及文本处理工具

    一、常规匹配一串不包含特殊字符的正则表达式匹配它自己例子,比如说想要查看密码包含root字符串的,可以这样写 cat /etc/passwd | grep root二、常用特殊字符特殊字符作用^匹配一行的开头...$匹配一行的结束.匹配任意一个字符**不单独使用,他和上一个字符连用,表示匹配上一个字符0次或者多次[][]表示匹配某个范围内的一个字符\表示转义字符,一般和特殊字符连用表示特殊字符本身例1:匹配以a字符开头的...r.t cat /ect/passwd | grep r..t例子4:查询包含以字符r开头,t结尾的字符串 cat /etc/passwd | grep r..../archive_test.sh /scripts可以看得出确实添加了一个归档文件 六、Shell文本处理工具1. cut工具cut 的工作就是“剪”,具体的说就是在文件中负责剪切数据用的。... pattern:表示awk 在数据中查找的内容,就是匹配模式 action:在找到匹配内容时所执行的一系列命令选项参数功能-F指定文件分割符-v分支一个用户定义变量不过有些版本的系统是不支持awk

    29610

    数据分析常用的Excel函数

    Excel常用函数 简介 什么是函数 可以把函数理解为一个可以控制的黑箱子,输入X到黑箱子中,他就会输出Y,参数就是黑箱子的控制开关,打到不同的档位,黑箱子会输出不同的Y。 ?...从A1中查找k,并返回第一个k的起始位置编号 关联匹配函数 VLOOKUP VLOOKUP 函数简介 VLOOKUP 函数总共有4个参数,分别是:用谁去找、匹配对象范围、返回第几列、匹配方式(0/FALSE...3.多条件查询 在匹配数据时,往往条件不是单一的,那么就可以利用&将字段拼接起来,并且利用IF数组公式构建出一个虚拟的区域。...HLOOKUP =HLOOKUP(用谁去找, 匹配对象范围, 返回第几行, 匹配方式) 和VLOOKUP的区别:HLOOKUP返回的值与查找的值在同一列上,而VLOOKUP返回的值与查找的值在同一行上。...返回指定区域第2行第2列的单元格内容 MATCH 功能:在区域内查找指定的值,返回第一个查找值的位置。

    4.2K22

    正则表达式

    元字符" | "    将两个匹配条件进行逻辑“或”运算。 例如:‘z|food’ 能匹配 “z” 或 “food”或者zood(一种类型)(因为这其中包括z)。...例如,“e{2,}”不能匹配“bed”中的“e”,但能匹配 “seeeeeeeed”中的所有“e”     元字符"^"   表示必须以其后面的内容开始才匹配。 匹配一行的开始。...$这种类型的只能是good才可以goodgood也不可以,这为完全匹配 反向引用(正则表达式内部用组) 在正则表达式替换时,通过$1、$2、...来引用分组信息,而在正则表达式中,引用分组信息通过\...所以要对对行操作时,要注意\d\r字符。           $匹配必须出现在字符串或行的末尾,或出现在字符串或行末尾的 \n 之前。...若要匹配 CR/LF 字符组合,请在正则表达式模式中包含 \r?$。            所需的一个属性:Regex.Matches(str, "([A-Za-z]+\r?)

    85610

    【收藏】数据分析必会的Excel高频函数合集

    日常工具最重要的是使用场景,需要用时才会去找使用方法,然后在反复使用过程中逐渐熟练。...第三个参数用户指定返回查询区域中的第几列的值。 第四个参数是决定函数的查找方式,如果为0,则是精确匹配方式。如果为1,则是近似匹配方式。...提示:VLOOKUP函数第三个参数中的列号,不能理解为工作表中的实际的列号,而是指定要返回查询区域中的第几列的值。...2.3 近似查询 在实际应用中,我们往往用到的是FALSE精确匹配,无须顾虑表格是否为升序排列(Truth近似匹配容易受此影响),万一没有查询到目标,也能迅速查找原因。...假如两个数组全部是数值,两种方法返回的结果是一致的,当有包含文本数据时,第一种方法可以返回正确结果,第二种方法会返回错误值#VALUE。

    3.7K20
    领券