开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用awk提取文本文件中某列中两个字符串之间的第一个和最后一个数字，并区分它们？

使用awk提取文本文件中某列中两个字符串之间的第一个和最后一个数字，并区分它们的方法如下：

首先，使用awk命令读取文本文件并指定分隔符，例如以空格或制表符作为分隔符。
然后，使用awk的内置函数substr()来提取目标列中的字符串。
使用正则表达式来匹配字符串中的数字部分，并使用awk的内置函数match()来获取匹配到的字符串。
最后，使用awk的内置函数split()将匹配到的字符串按照指定的分隔符分割成数组，以获取第一个和最后一个数字。

下面是一个示例awk命令的使用：

awk -F'\t' '{ 
    match($2, /[0-9]+/) # 匹配第二列中的数字部分
    start = RSTART # 获取匹配到的起始位置
    len = RLENGTH # 获取匹配到的长度
    split(substr($2, start, len), arr, /,/) # 将匹配到的字符串按逗号分隔成数组
    print "第一个数字：" arr[1]
    print "最后一个数字：" arr[length(arr)]
}' 文件名

请注意，上述示例中的-F'\t'表示使用制表符作为分隔符，你可以根据实际情况修改分隔符。

这种方法适用于提取文本文件中某列中两个字符串之间的第一个和最后一个数字，并且可以区分它们。

相关搜索:使用javascript获取字符串中的第一个和最后一个字符，并创建子字符串使用python遍历指定目录下的文件，逐行读取每个文件，去掉该行中的第一个和最后一个字符串，并保存更新后的文件允许mysql客户端连接数据库允许本地mysql数据库在centos的mysql修改时间在dos下连接mysql数据库在线mysql连接不上在线mysql连接数在线管理远程mysql 怎么遍历mysql数据库

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

awk-grep-sed简单使用总结(正则表达式的应用)

正则表达式: 匹配一组字符: #[ns]a.\.xls //[]用于限定字符；“.”用于匹配任意字符; \.用于转义"." 匹配到s/na*.xls [nN] 匹配大小写；[0-9] 匹配0-9数字；[a-zA-Z0-9] 匹配任意字符数字注意:"-"(连字符)是一个特殊的元字符,作为元字符只能用在[]中间用^元字符进行取非操作，但是必须用在[]之间 #[ns]a[^0-9]\.xls 匹配n/sa*.xls *表示任意字符使用元字符: 元字符自己使用必

09

linux运维中的命令梳理（三）

----------文本操作命令---------- sed命令：文本编辑工具 sed是一个很好的文件处理工具，本身是一个管道命令，主要是以行为单位进行处理，可以将数据行进行替换、删除、新增、选取等特定工作，下面先了解一下sed的用法 sed命令行格式为： sed [-nefri] ‘command’ 输入文本常用选项： -n∶使用安静(silent)模式。在一般 sed 的用法中，所有来自 STDIN的资料一般都会被列出到萤幕上。但如果加上 -n 参数

08

Linux之文件管理及文本处理

文件管理不外乎文件或目录的创建、删除、查询、移动，有mkdir/rm/mv 文件查询是重点，用find来进行查询；find的参数丰富，也非常强大；有时候，需要给文件创建一个别名，我们需要用到ln，使用这个别名和使用原文件是相同的效果； 2.1. 创建和删除创建：mkdir 删除：rm 删除非空目录：rm -rf file目录删除日志 rm *log (等价: $find ./ -name “*log” -exec rm {} ;) 移动：mv 复制：cp (复制目录：cp -r ) 查看当前目录下文件个数: $find ./ | wc -l 复制目录: $cp -r source_dir dest_dir 2.2. 目录切换找到文件/目录位置：cd 切换到上一个工作目录： cd - 切换到home目录： cd or cd ~ 显示当前路径: pwd 更改当前工作路径为path: $cd path 2.3. 列出目录项显示当前目录下的文件 ls 按时间排序，以列表的方式显示目录项 ls -lrt 以上这个命令用到的频率如此之高，以至于我们需要为它建立一个快捷命令方式: 在.bashrc 中设置命令别名: alias lsl='ls -lrt' alias lm='ls -al|more' 这样，使用lsl，就可以显示目录中的文件按照修改时间排序；以列表方式显示；给每项文件前面增加一个id编号(看上去更加整洁): >ls | cat -n 1 a 2 a.out 3 app 4 b 5 bin 6 config 注：.bashrc 在/home/你的用户名/ 文件夹下，以隐藏文件的方式存储；可使用 ls -a 查看； 2.4. 查找目录及文件 find/locate 搜寻文件或目录: $find ./ -name "core*" | xargs file 查找目标文件夹中是否有obj文件: $find ./ -name '*.o' 递归当前目录及子目录删除所有.o文件: $find ./ -name "*.o" -exec rm {} \; find是实时查找，如果需要更快的查询，可试试locate；locate会为文件系统建立索引数据库，如果有文件更新，需要定期执行更新命令来更新索引库: $locate string 寻找包含有string的路径: $updatedb 与find不同，locate并不是实时查找。你需要更新数据库，以获得最新的文件索引信息。 2.5. 查看文件内容查看文件：cat vi head tail more 显示时同时显示行号: $cat -n 按页显示列表内容: $ls -al | more 只看前10行: $head - 10 ** 显示文件第一行: $head -1 filename 显示文件倒数第五行: $tail -5 filename 查看两个文件间的差别: $diff file1 file2 动态显示文本最新信息: $tail -f crawler.log 2.6. 查找文件内容使用egrep查询文件内容: egrep '03.1\/CO\/AE' TSF_STAT_111130.log.012 egrep 'A_LMCA777:C' TSF_STAT_111130.log.035 > co.out2 2.7. 文件与目录权限修改改变文件的拥有者 chown 改变文件读、写、执行等属性 chmod 递归子目录修改： chown -R tuxapp source/ 增加脚本可执行权限： chmod a+x myscript 2.8. 给文件增加别名创建符号链接/硬链接: ln cc ccAgain :硬连接；删除一个，将仍能找到； ln -s cc ccTo :符号链接(软链接)；删除源，另一个无法使用；（后面一个ccTo 为新建的文件） 2.9. 管道和重定向批处理命令连接执行，使用 | 串联: 使用分号 ; 前面成功，则执行后面一条，否则，不执行:&& 前面失败，则后一条执行: || ls /proc && echo suss! || echo failed. 能够提示命名是否执行成功or失败；与上述相同效果的是: if ls /proc; then echo suss; else echo fail; fi 重定向: ls proc/*.c > list 2> &l 将标准输出和标准错误重定向

02

30分钟玩转「正则表达式」

推荐阅读：Jeffrey Friedl 《精通正则表达式（第3版）》，本文是该书的读书笔记。

02

linux常用命令

date - print or set the system date and time

01

前端工程师也应知道的字符编码知识

最开始计算机只在美国用，八位的字节可以组合出256种不同状态。0-32种状态规定了特殊用途,一旦终端、打印机遇上约定好的这些字节被传过来时，就要做一些约定的动作，如：

03

Shell四剑客实操案例

在Shell编程工具中，四剑客工具的使用更加的广泛，Shell编程四剑客包括：find、sed、grep、awk，熟练掌握四剑客会对Shell编程能力极大的提升。

02

grep中使用"\d"匹配数字不成功的原因

首先正则表达式分为三类（man grep可以看到，分别是basic RegExs，extended RegExs，perl RegExs）

01

用 Excel 怎么了，你咬我啊？

伪题图：逼死强迫症之重新加载。下图为真题图 2400字，约6分钟，思考问题的熊专栏6 懒是人类进步的绊脚石，偷懒是人类进步的阶梯。如果你完成任何一项工作心里时感觉复杂，想必就还有更简单的方法。在生

07

awk 入门教程

它依次处理文件的每一行，并读取里面的每一个字段。对于日志、CSV 那样的每行格式相同的文本文件，awk可能是最方便的工具。

02

awk强大的文本文件处理命令

awk是一个非常强大的文本文件处理应用程序，几乎所有 Linux 系统都自带这个程序。awk其实不仅仅是工具软件，还是一种编程语言。它依次处理文件的每一行，并读取里面的每一个字段。对于日志、CSV 那样的每行具有格式相同的文本文件，awk可能是最方便的工具。使用awk可以打印出自己想要的信息。

03

【DB笔试面试275】与SHELL脚本相关的一些笔试面试题（目前36道，后续持续更新）

本小节以几道真题为例，简单讲解与SHELL有关的面试题。在实际工作中，要写的SHELL脚本要复杂得多。

03

Linux Awk用法总结

目录 Awk是什么命令行语法脚本（Script）组成模式（Pattern）正则表达式（Regular Expression）表达式（Expressions）数组内置变量删除ARGV元素

04

快收藏！ 30 分钟包你学会 AWK

本文大部分内容翻译自我开始学习AWK时看到的一篇英文文章 AWK Tutorial ，觉得对AWK入门非常有帮助，所以对其进行了粗略的翻译，并对其中部分内容进行了删减或者补充，希望能为对AWK感兴趣的小伙伴提供一份快速入门的教程，帮助小伙伴们快速掌握AWK的基本使用方式，当然，我也是刚开始学习AWK，本文在翻译或者补充的过程中肯定会有很多疏漏或者错误，希望大家能够帮忙指正。本文将会持续修正和更新，最新内容请参考我的 GITHUB 上的程序猿成长计划项目，欢迎 Star。概述 AWK是一门解释

07

快收藏！ 30 分钟包你学会 AWK

本文大部分内容翻译自我开始学习AWK时看到的一篇英文文章 AWK Tutorial ，觉得对AWK入门非常有帮助，所以对其进行了粗略的翻译，并对其中部分内容进行了删减或者补充，希望能为对AWK感兴趣的小伙伴提供一份快速入门的教程，帮助小伙伴们快速掌握AWK的基本使用方式，当然，我也是刚开始学习AWK，本文在翻译或者补充的过程中肯定会有很多疏漏或者错误，希望大家能够帮忙指正。

03

Linux基础——正则表达式

一、正则表达式：正则表达式（或称 Regular Expression，简称 RE）就是由普通字符（例如字符a 到z）以及特殊字符（称为元字符）组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。简单的说，正则表示式就是处理字符串的方法，它是以行为单位来进行字符串的处理行为，正则表示式通过一些特殊符号的辅助，可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序。vim、grep、find、awk、sed

03

linux实战(一)

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/q383965374/article/details/50394765

01

java基础第四篇之面向对象

形参:一般把不确定的量或者变化的量定义在形参位置//圆的的半径,长方形的长和宽,传递的数组也是不确定的

03

java基础第五篇封装与面向对象

public static void main(String[] args) {

03

Python3学习笔记 | 四、Python的类型与运算-字符串（上）

在Python里字符串是一个有序的字符的集合，用来存储和表现基于文本的信息。字符串可以用来表示能够像文本那样编辑的任何信息：符号和词语、在入道内存中的文本的内容、Internet网址和Python程序等。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭