开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用awk提取文本文件中某列中两个字符串之间的第一个和最后一个数字，并区分它们？

使用awk提取文本文件中某列中两个字符串之间的第一个和最后一个数字，并区分它们的方法如下：

首先，使用awk命令读取文本文件并指定分隔符，例如以空格或制表符作为分隔符。
然后，使用awk的内置函数substr()来提取目标列中的字符串。
使用正则表达式来匹配字符串中的数字部分，并使用awk的内置函数match()来获取匹配到的字符串。
最后，使用awk的内置函数split()将匹配到的字符串按照指定的分隔符分割成数组，以获取第一个和最后一个数字。

下面是一个示例awk命令的使用：

awk -F'\t' '{ 
    match($2, /[0-9]+/) # 匹配第二列中的数字部分
    start = RSTART # 获取匹配到的起始位置
    len = RLENGTH # 获取匹配到的长度
    split(substr($2, start, len), arr, /,/) # 将匹配到的字符串按逗号分隔成数组
    print "第一个数字：" arr[1]
    print "最后一个数字：" arr[length(arr)]
}' 文件名

请注意，上述示例中的-F'\t'表示使用制表符作为分隔符，你可以根据实际情况修改分隔符。

这种方法适用于提取文本文件中某列中两个字符串之间的第一个和最后一个数字，并且可以区分它们。

相关搜索:使用javascript获取字符串中的第一个和最后一个字符，并创建子字符串使用python遍历指定目录下的文件，逐行读取每个文件，去掉该行中的第一个和最后一个字符串，并保存更新后的文件允许mysql客户端连接数据库允许本地mysql数据库在centos的mysql修改时间在dos下连接mysql数据库在线mysql连接不上在线mysql连接数在线管理远程mysql 怎么遍历mysql数据库

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

awk-grep-sed简单使用总结(正则表达式的应用)

正则表达式: 匹配一组字符: #[ns]a.\.xls //[]用于限定字符；“.”用于匹配任意字符; \.用于转义"." 匹配到s/na*.xls [nN] 匹配大小写；[0-9] 匹配0-9数字；[a-zA-Z0-9] 匹配任意字符数字注意:"-"(连字符)是一个特殊的元字符,作为元字符只能用在[]中间用^元字符进行取非操作，但是必须用在[]之间 #[ns]a[^0-9]\.xls 匹配n/sa*.xls *表示任意字符使用元字符: 元字符自己使用必

09

Linux文本处理详细教程

本节将介绍Linux下使用Shell处理文本时最常用的工具： find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk；提供的例子和参数都是常用的；我对shell脚本使用的原则是命令单行书写，尽量不要超过2行；如果有更为复杂的任务需求，还是考虑python吧；

02

批处理for详解_python批处理

在批处理中，for是最为强大的命令语句，它的出现，使得解析文本内容、遍历文件路径、数值递增/递减等操作成为可能；配合if、call、 goto等流程控制语句，更是可以实现脚本复杂的自动化、智能化操作；合理使用for语句，还能使代码大为简化，免除各位编写大量重复语句之苦。而能否熟练使用for语句，已经成为衡量一个人批处理水平高低最主要的标准。

02

批处理-For详解

在批处理中，for是最为强大的命令语句，它的出现，使得解析文本内容、遍历文件路径、数值递增/递减等操作成为可能；配合if、call、 goto等流程控制语句，更是可以实现脚本复杂的自动化、智能化操作；合理使用for语句，还能使代码大为简化，免除各位编写大量重复语句之苦。而能否熟练使用for语句，已经成为衡量一个人批处理水平高低最主要的标准。

02

linux运维中的命令梳理（三）

----------文本操作命令---------- sed命令：文本编辑工具 sed是一个很好的文件处理工具，本身是一个管道命令，主要是以行为单位进行处理，可以将数据行进行替换、删除、新增、选取等特定工作，下面先了解一下sed的用法 sed命令行格式为： sed [-nefri] ‘command’ 输入文本常用选项： -n∶使用安静(silent)模式。在一般 sed 的用法中，所有来自 STDIN的资料一般都会被列出到萤幕上。但如果加上 -n 参数

08

《前端运维》一、Linux基础–08Shell其他及补充

要注意的是，有些命令不支持正则模式，比如fs、find等，有些是支持正则的，比如grep、awk、sed等。正则的语法和js中的正则几乎没有区别，下面仅简单罗列下常用的正则：

02

《前端运维》一、Linux基础--08Shell其他及补充

要注意的是，有些命令不支持正则模式，比如fs、find等，有些是支持正则的，比如grep、awk、sed等。正则的语法和js中的正则几乎没有区别，下面仅简单罗列下常用的正则：

02

Shell 正则表达式及综合案例及文本处理工具

[6,8] ------匹配6或者8 [0-9] ------匹配一个0-9 的数字 [0-9]* ------匹配任意长度的数字字符串 [a-z] ------匹配一个 a-z 之间的字符 [a-z]* -----匹配任意长度的字母字符串 [a-c,e-f] ---匹配 a-c 或者 e-f之间的任意字符

03

Linux之文件管理及文本处理

文件管理不外乎文件或目录的创建、删除、查询、移动，有mkdir/rm/mv 文件查询是重点，用find来进行查询；find的参数丰富，也非常强大；有时候，需要给文件创建一个别名，我们需要用到ln，使用这个别名和使用原文件是相同的效果； 2.1. 创建和删除创建：mkdir 删除：rm 删除非空目录：rm -rf file目录删除日志 rm *log (等价: $find ./ -name “*log” -exec rm {} ;) 移动：mv 复制：cp (复制目录：cp -r ) 查看当前目录下文件个数: $find ./ | wc -l 复制目录: $cp -r source_dir dest_dir 2.2. 目录切换找到文件/目录位置：cd 切换到上一个工作目录： cd - 切换到home目录： cd or cd ~ 显示当前路径: pwd 更改当前工作路径为path: $cd path 2.3. 列出目录项显示当前目录下的文件 ls 按时间排序，以列表的方式显示目录项 ls -lrt 以上这个命令用到的频率如此之高，以至于我们需要为它建立一个快捷命令方式: 在.bashrc 中设置命令别名: alias lsl='ls -lrt' alias lm='ls -al|more' 这样，使用lsl，就可以显示目录中的文件按照修改时间排序；以列表方式显示；给每项文件前面增加一个id编号(看上去更加整洁): >ls | cat -n 1 a 2 a.out 3 app 4 b 5 bin 6 config 注：.bashrc 在/home/你的用户名/ 文件夹下，以隐藏文件的方式存储；可使用 ls -a 查看； 2.4. 查找目录及文件 find/locate 搜寻文件或目录: $find ./ -name "core*" | xargs file 查找目标文件夹中是否有obj文件: $find ./ -name '*.o' 递归当前目录及子目录删除所有.o文件: $find ./ -name "*.o" -exec rm {} \; find是实时查找，如果需要更快的查询，可试试locate；locate会为文件系统建立索引数据库，如果有文件更新，需要定期执行更新命令来更新索引库: $locate string 寻找包含有string的路径: $updatedb 与find不同，locate并不是实时查找。你需要更新数据库，以获得最新的文件索引信息。 2.5. 查看文件内容查看文件：cat vi head tail more 显示时同时显示行号: $cat -n 按页显示列表内容: $ls -al | more 只看前10行: $head - 10 ** 显示文件第一行: $head -1 filename 显示文件倒数第五行: $tail -5 filename 查看两个文件间的差别: $diff file1 file2 动态显示文本最新信息: $tail -f crawler.log 2.6. 查找文件内容使用egrep查询文件内容: egrep '03.1\/CO\/AE' TSF_STAT_111130.log.012 egrep 'A_LMCA777:C' TSF_STAT_111130.log.035 > co.out2 2.7. 文件与目录权限修改改变文件的拥有者 chown 改变文件读、写、执行等属性 chmod 递归子目录修改： chown -R tuxapp source/ 增加脚本可执行权限： chmod a+x myscript 2.8. 给文件增加别名创建符号链接/硬链接: ln cc ccAgain :硬连接；删除一个，将仍能找到； ln -s cc ccTo :符号链接(软链接)；删除源，另一个无法使用；（后面一个ccTo 为新建的文件） 2.9. 管道和重定向批处理命令连接执行，使用 | 串联: 使用分号 ; 前面成功，则执行后面一条，否则，不执行:&& 前面失败，则后一条执行: || ls /proc && echo suss! || echo failed. 能够提示命名是否执行成功or失败；与上述相同效果的是: if ls /proc; then echo suss; else echo fail; fi 重定向: ls proc/*.c > list 2> &l 将标准输出和标准错误重定向

02

30分钟玩转「正则表达式」

推荐阅读：Jeffrey Friedl 《精通正则表达式（第3版）》，本文是该书的读书笔记。

02

批处理for命令的用法_批处理for命令详解

for %variable in (set) do command [command-parameters]

03

_Shell 正则表达式及综合案例及文本处理工具

我们都知道手机号是由第一位数字是0，第二位是3，4，5，7，8，9；其余数字随便。总共十一位数字，因此我们可以得出

01

Linux下文本处理“三剑客”

grep （缩写来自Globally search a Regular Expression and Print）是一种强大的文本搜索工具，它能使用特定模式匹配（包括正则表达式）搜索文本，并默认输出匹配行,grep和sed的区别在于，grep是以行为单位，进行字符串的对比，sed则可以进行删除、替换等更多的功能

03

shell学习教程(超详细完整)[通俗易懂]

为了方便以后工作使用和复习，吐血整理记录一下学习shell脚本的笔记，看这篇文章需要对linux系统熟悉，希望对大家有所帮助！

02

30分钟玩转「正则表达式」

推荐阅读：Jeffrey Friedl 《精通正则表达式（第3版）》，本文是该书的读书笔记。

01

如何快速计算文件中所有数字的总和？

我正在编写一个脚本，以便打印文件中所有数字的总和。我已经有一个解决方案，但效率不高（运行需要几分钟的时间）。我正在寻找一个更高效的解决方案。有什么建议吗？

00

Linux入门学习笔记二

grep （缩写来自Globally search a Regular Expression and Print）是一种强大的文本搜索工具，它能使用特定模式匹配（包括正则表达式）搜索文本，并默认输出匹配行,grep和sed的区别在于，grep是以行为单位，进行字符串的对比，sed则可以进行删除、替换等更多的功能

01

linux常用命令

date - print or set the system date and time

01

Shell实用工具

cut 译为“剪切, 切割”，是一个强大文本处理工具，它可以将文本按列进行划分的文本处理。cut命令逐行读入文本，然后按列划分字段并进行提取、输出等操作。

01

C++ 与正则表达式

正则表达式可以说是软件开发中最常用的功能之一。本文将以C++语言为例，介绍其中的正则表达式相关知识。

02

awk 函数-awk的基本用法

它依次处理文件的每一行，并读取里面的每一个字段。对于日志、CSV 那样的每行格式相同的文本文件，awk可能是最方便的工具。

02

前端工程师也应知道的字符编码知识

最开始计算机只在美国用，八位的字节可以组合出256种不同状态。0-32种状态规定了特殊用途,一旦终端、打印机遇上约定好的这些字节被传过来时，就要做一些约定的动作，如：

03

Shell四剑客实操案例

在Shell编程工具中，四剑客工具的使用更加的广泛，Shell编程四剑客包括：find、sed、grep、awk，熟练掌握四剑客会对Shell编程能力极大的提升。

02

linux shell指令大全整理

所有程序, 包括shell启动的程序, 都能访问环境变量, 在c中通过system()函数执行的结果可以通过环境变量传递回来

05

grep中使用"\d"匹配数字不成功的原因

首先正则表达式分为三类（man grep可以看到，分别是basic RegExs，extended RegExs，perl RegExs）

01

用 Excel 怎么了，你咬我啊？

伪题图：逼死强迫症之重新加载。下图为真题图 2400字，约6分钟，思考问题的熊专栏6 懒是人类进步的绊脚石，偷懒是人类进步的阶梯。如果你完成任何一项工作心里时感觉复杂，想必就还有更简单的方法。在生

07

awk 入门教程

它依次处理文件的每一行，并读取里面的每一个字段。对于日志、CSV 那样的每行格式相同的文本文件，awk可能是最方便的工具。

02

再见了！linux、awk。。

Linux、shell，很多初学者可能非常陌生，但是对于算法、数据、大数据相关的同学，这个又是一个不可避免的学习内容~

01

fscanf

A = fscanf(fileID,formatSpec) 将打开的文本文件中的数据读取到列向量 A 中，并根据 formatSpec 指定的格式解释文件中的值。fscanf 函数在整个文件中重新应用该格式，并将文件指针定位在文件结尾标记处。如果 fscanf 无法将 formatSpec 与数据相匹配，将只读取匹配的部分并停止处理。

04

「薅」52图初探Linux通用知识

知道上了研究生到了实验室，我发现实验室的怎么都是对着一个窗口操作，瞬间觉得以前的计算机知识白学了，于是开启了Linux之路。

03

Tcpdump流量自动化测试下篇

接上一篇《Tcpdump流量自动化测试上篇》讲到通过自动化的方式获取到Pcap文件，今天来讲讲怎么用Wireshark来自动分析统计Pcap包中指定的流量。

02

linux awk 函数定义变量赋值,Linux中的Awk定义、用法详解

Awk、sed与grep，俗称Linux下的三剑客，它们之前有很多相似点，但是同样也各有各的特色，相似的地方是它们都可以匹配文本，其中sed和awk还可以用于文本编辑，而grep则不具备这个功用。sed是一种非交互式且面向字符流的编辑器(a “non-” stream- editor)，而awk则是一门模式匹配的编程语言，因为它的主要功能是用于匹配文本并处理，同时它有一些编程语言才有的语法，例如函数、分支循环语句、变量等等，当然比起我们常见的编程语言，Awk相对比较简单。

05

linux awk命令使用详解

Awk是一种文本处理工具，它可以用来从文本文件中提取数据并对其进行处理。Awk命令非常强大，可以将它用于各种文本处理任务，包括数据转换、数据提取、报告生成等。在本文中，我们将深入探讨Awk命令的用法，并提供一些常见的示例。

02

awk强大的文本文件处理命令

awk是一个非常强大的文本文件处理应用程序，几乎所有 Linux 系统都自带这个程序。awk其实不仅仅是工具软件，还是一种编程语言。它依次处理文件的每一行，并读取里面的每一个字段。对于日志、CSV 那样的每行具有格式相同的文本文件，awk可能是最方便的工具。使用awk可以打印出自己想要的信息。

03

【DB笔试面试275】与SHELL脚本相关的一些笔试面试题（目前36道，后续持续更新）

本小节以几道真题为例，简单讲解与SHELL有关的面试题。在实际工作中，要写的SHELL脚本要复杂得多。

03

awk 简单使用教程

之前我一直使用 Python 来处理 Linux 的一些文本，但是对于一些大文本的简单处理，Python 麻烦而且慢，于是现在慢慢改用awk来处理，很多时候一行命令就能解决，因此非常方便。针对使用是过程的一些心得，写个小小的教程，awk太强大了，需要慢慢长时间的学习，我尽量保持更新这个教程吧。

00

Linux Awk用法总结

目录 Awk是什么命令行语法脚本（Script）组成模式（Pattern）正则表达式（Regular Expression）表达式（Expressions）数组内置变量删除ARGV元素

04

快收藏！ 30 分钟包你学会 AWK

本文大部分内容翻译自我开始学习AWK时看到的一篇英文文章 AWK Tutorial ，觉得对AWK入门非常有帮助，所以对其进行了粗略的翻译，并对其中部分内容进行了删减或者补充，希望能为对AWK感兴趣的小伙伴提供一份快速入门的教程，帮助小伙伴们快速掌握AWK的基本使用方式，当然，我也是刚开始学习AWK，本文在翻译或者补充的过程中肯定会有很多疏漏或者错误，希望大家能够帮忙指正。本文将会持续修正和更新，最新内容请参考我的 GITHUB 上的程序猿成长计划项目，欢迎 Star。概述 AWK是一门解释

07

快收藏！ 30 分钟包你学会 AWK

本文大部分内容翻译自我开始学习AWK时看到的一篇英文文章 AWK Tutorial ，觉得对AWK入门非常有帮助，所以对其进行了粗略的翻译，并对其中部分内容进行了删减或者补充，希望能为对AWK感兴趣的小伙伴提供一份快速入门的教程，帮助小伙伴们快速掌握AWK的基本使用方式，当然，我也是刚开始学习AWK，本文在翻译或者补充的过程中肯定会有很多疏漏或者错误，希望大家能够帮忙指正。

03

Shell入门

shell 脚本是个纯文本文件，命令从上而下，一行一行地开始执行。 shell 脚本第一行一定要为：#!/bin/bash

01

Linux指令入门-文本处理

vim有三种操作模式，分别是命令模式（Command mode）、输入模式（Insert mode）和底线命令模式（Last line mode）。

02

shell脚本扩展「建议收藏」

正则表达式（或称Regular Expression，简称RE）就是由普通字符（例如字符 a 到 z）以及特殊字符（称为元字符）组成的文字模式。

02

Linux命令三剑客

grep ---- 一句话概括 grep 命令用于查找文件里符合条件的字符串语法 grep [-abcEFGhHilLnqrsvVwxy][-A<显示行数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...] 参数 -a 或 --text 不要忽略二进制的数据。 -A<显示行数> 或 --after-context=<显示行数> : 除了显示符合范本样式的那一列之外，并显示该行之后的内容。 -b 或 --by

00

Linux基础——正则表达式

一、正则表达式：正则表达式（或称 Regular Expression，简称 RE）就是由普通字符（例如字符a 到z）以及特殊字符（称为元字符）组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。简单的说，正则表示式就是处理字符串的方法，它是以行为单位来进行字符串的处理行为，正则表示式通过一些特殊符号的辅助，可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序。vim、grep、find、awk、sed

03

linux实战(一)

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/q383965374/article/details/50394765

01

java基础第四篇之面向对象

形参:一般把不确定的量或者变化的量定义在形参位置//圆的的半径,长方形的长和宽,传递的数组也是不确定的

03

java基础第五篇封装与面向对象

public static void main(String[] args) {

03

Python3学习笔记 | 四、Python的类型与运算-字符串（上）

在Python里字符串是一个有序的字符的集合，用来存储和表现基于文本的信息。字符串可以用来表示能够像文本那样编辑的任何信息：符号和词语、在入道内存中的文本的内容、Internet网址和Python程序等。

02

Excel公式练习90：返回字符串中第一块数字之后的所有内容（续3）

引言：在《Excel公式练习87：返回字符串中第一块数字之后的所有内容》、《Excel公式练习88：返回字符串中第一块数字之后的所有内容（续1）》和《Excel公式练习89：返回字符串中第一块数字之后的所有内容（续2）》中，我们分别给出了解决这个问题的三个公式，本文中，再次尝试着使用另一个公式来解决这个问题。正如之前已提到过的，尝试多种方法解决问题，能够帮助我们快速提高。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭