腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >在段落模式中匹配“模式文件”中的多个模式

问在段落模式中匹配“模式文件”中的多个模式
EN

Unix & Linux用户

提问于 2021-01-05 04:21:19

回答 3查看 130关注 0票数 -1

我有一个输入文件，必须在段落中搜索不同的匹配项，并在匹配时移动到输出文件和整个段落。

一件事是，输出的顺序应该反映输入。因此，我必须针对模式匹配文件中的所有模式搜索一个段落(每行一个模式)，如果一个模式匹配，它应该停止对该段的进一步匹配，将匹配的段落移动到输出文件，并跳过处理到下一个段落。

输入文件：

DFJKHDKQW
YYYYYYYYYYYY
SDFLKJHSDKLFH

DSFLKHSDLKFH
DFIHERFW
ADFKJH
OIGHRFGH
XXXXXXXXXXXX
SDKFLJH

DFLKHSDFKLH
SDSDJKLFHSDK

OIHGSDFG
AAAAAAAA
LFKHFGJKDGH
KLJHLUG

DFSDKLF
YYYYYYYYYYYY

模式匹配文件：

AAAAAAAA
YYYYYYYYYYYY
XXXXXXXXXXXX

预期产出：

DFJKHDKQW
YYYYYYYYYYYY
SDFLKJHSDKLFH

DSFLKHSDLKFH
DFIHERFW
ADFKJH
OIGHRFGH
XXXXXXXXXXXX
SDKFLJH

OIHGSDFG
AAAAAAAA
LFKHFGJKDGH
KLJHLUG

DFSDKLF
YYYYYYYYYYYY

我现在正面临着一堆awk问题，这些问题在我的脑海中挥之不去：

使用输入文件进行模式匹配。
在第一次比赛中，在段落上方旋转并“停止/跳转到下一段”
将匹配的段落复制到输出文件。
在输入中删除匹配的段落(可选，因为我可以通过两个文件之间的diff来实现这一点)。

awk

text-processing

腾讯云域名特惠，新用户首年1元起

腾讯云域名专场特惠：个人新用户.cn仅8.8元/年，企业新用户.com仅1.06元/年...

回答 3

Unix & Linux用户

回答已采纳

发布于 2021-01-05 04:39:35

由于您已经知道了“段落”模式，下面的方法应该有效。它将首先解析“模式”文件，然后解析实际输入。输出照例打印到控制台，但当然可以重定向到文件：

awk -v ORS="\n\n" 'NR==FNR{pat[++npat]=$0;next}
                   {for (i=1;i<=npat;i++) {if (index($0,pat[i])) {print;next}}}' patterns.txt RS="" input.txt

这将首先将输出记录分隔符设置为两个换行符，确保打印的段落与输入中的空行隔开。
在处理第一个文件(其中FNR，每个文件的行计数器等于NR，全局行计数器)时，我们只需将所有模式存储在数组变量pat中。
对于第二个文件，记录分隔符设置为空，这指示awk以“段落模式”运行。然后，我们遍历所有模式，并通过index()函数显式地查看它们是否在输入记录中找到。

注

这个解决方案将执行“部分字符串匹配”，这意味着如果在一行中的任何一个“模式”中遇到任何一个“模式”，那么段落将被视为匹配。
使用index()函数是因为这将确保文字字符串匹配，即使在“搜索模式”包含正则表达式特殊字符的情况下也是如此。如果要实际使用正则表达式匹配，请使用if ($0 ~ pat[i])。

票数 1

Unix & Linux用户

发布于 2021-01-05 08:49:31

假设您想要进行全行字符串匹配，这就是您需要的：

$ cat tst.awk
BEGIN {
    ORS = "\n\n"
    FS = "\n"
}
NR==FNR {
    tgts[$0]
    next
}
{
    out = "unmatched"
    for (i=1; i<=NF; i++) {
        if ($i in tgts) {
            out = "matched"
            break
        }
    }
    print > out
}

$ awk -f tst.awk targets RS= file

$ ls *matched
matched  unmatched

$ head -100 *matched
==> matched <==
DFJKHDKQW
YYYYYYYYYYYY
SDFLKJHSDKLFH

DSFLKHSDLKFH
DFIHERFW
ADFKJH
OIGHRFGH
XXXXXXXXXXXX
SDKFLJH

OIHGSDFG
AAAAAAAA
LFKHFGJKDGH
KLJHLUG

DFSDKLF
YYYYYYYYYYYY


==> unmatched <==
DFLKHSDFKLH
SDSDJKLFHSDK

如果您需要执行regexp而不是字符串匹配和/或部分匹配，而不是完全匹配或其他什么，那么您将需要一个不同的解决方案(请更新您的问题以更好地说明您的需求)。

票数 3

Unix & Linux用户

发布于 2021-01-05 04:39:26

要将match输入中的模式与infile输入匹配为单个单独模式，请尝试：

awk -F'\n' '!input && !matches[$0]{ next; };
    { for(i=1; i<=NF; i++) {
          if($i in matches) { print sep $0; sep=ORS; break; };
      };
    }' match input=1 RS= infile

或者，要将match输入中的模式作为模式块匹配到infile输入(将一个与match输入相同的块添加到infile以进行验证)，请尝试：

awk -v RS= '!input && !matches[$0]{ next; }; ($0 in matches)' match input=1 infile

票数 2

页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://unix.stackexchange.com/questions/627613

复制

cmd - bat文件如何关闭回显

命令行工具

echo是回显命令，会将echo后的内容输出到cmd窗口中，比如在一个Test.bat文件中输入如下命令：

雨临Lewis

2022/01/11

2.3K0

日常技巧-命令无回显实战Tips

shell https http 网络安全

https://weibell.github.io/reverse-shell-generator/#

hyyrent

2022/12/26

1.2K0

SpringMVC【参数绑定、数据回显、文件上传】

spring mvc

前言本文主要讲解的知识点如下：参数绑定数据回显文件上传参数绑定我们在Controller使用方法参数接收值，就是把web端的值给接收到Controller中处理,这个过程就叫做参数绑定… 默认支持的参数类型从上面的用法我们可以发现，我们可以使用request对象、Model对象等等，其实是不是可以随便把参数写上去都行？？？其实并不是的… Controller方法默认支持的参数类型有4个，这4个足以支撑我们的日常开发了 HttpServletRequest HttpServletResponse

Java3y

2018/04/02

1.4K0

如何将 Linux 命令输出重定向到文件？

linux

在Linux系统中，命令行是非常强大和灵活的工具。它允许我们执行各种任务和操作，包括将命令的输出保存到文件中。本文将介绍如何使用重定向操作符将Linux命令的输出导入到文件中，并列举尽可能多的命令示例。

网络技术联盟站

2023/07/14

1.7K0

如何将 Linux 命令输出重定向到文件？

linux

网络技术联盟站

2023/08/03

1.9K0

bootstrap fileinput 文件上传和回显「建议收藏」

bootstrap java https css http

官网下载文件http://plugins.krajee.com/file-input/demo

全栈程序员站长

2022/08/15

2.8K0

表单数据回显

编程算法 jsp java android html

　　在数据提交出现错误的时候, 已填写的信息仍在文本框中, 比如用户登录, 当用户输入错误的密码之后, 用户名仍在文本框, 只是密码框清空

Twcat_tree

2022/11/30

1.2K0

命令执行/SQL盲注无回显外带方式

http dns 网络安全安全 sql

在渗透测试中我们时常会遇到一些无回显的场景，如常见的：SQL盲注、命令执行、XSS、SSRF、Blind XXE等漏洞，这时就需要利用第三方dnslog/httplog平台才能将数据和命令执行结果外带出来。

潇湘信安

2022/09/14

2.4K0

输入网址到回显页面，经历了哪些过程

tcp/ip http dns php

浏览器第一步工作就是要对输入的URL进行解析，从而确定发送给Web服务器的请求信息。

shysh95

2021/12/27

1.2K0

Python3 执行系统命令并获取实时回显

python3 编码编译基础脚本

最近在改造一些打包的逻辑，原来在 Windows 下是基于批处理制作的，由于批处理用起来不是很方便，一些实时的计算基本无法胜任，所以转向 Python3。但在以前脚本的基础上很多是需要调用系统命令的比如 VS 编译一个项目，我们需要获取实时的回显知道编译的结果和进度。所以就有了以下方法：

我与梦想有个约会

2023/10/21

4580

执行Get-NetTCPConnection没有回显，但是执行netstat -ano有回显

云服务器 windows server windows

问题：执行Get-NetTCPConnection没有回显，但是执行netstat -ano有回显，如下图

Windows技术交流

2023/09/12

2190

element级联选择器表单回显_级联选择器数据回显

https 网络安全 java

此方法主要参考这位大神：https://segmentfault.com/u/li…

全栈程序员站长

2022/08/04

1.2K0

模糊测试之攻击回显

dns 安全 http https 网络安全

描述：一个渗透安全工程师常常会在,某些安全测试项目中遇到,代码或者命令可以被执行,但是无任何的回显特征来判断攻击成功，

全栈工程师修炼指南

2022/09/28

2.4K0

技术分析|XXE环境搭建及实战包含有回显无回显操作

tomcat html https http 网络安全

搭建说明：安装xampp后，htdocs目录放入靶机项目，然后开启apache、mysql访问即可

陈殷

2020/03/06

2.6K0

JS 递归数组嵌套回显

第一种： // 查询部门信息 seeBranch(data,id){ function find(data, fn, result) { data.forEach(item => { if(item.id===id){ result.push(item) }else if (item.children.length>0) { find(item.children, fn, result) } else { if (f

我不是费圆

2022/05/09

4K0

短信验证码回显

网络安全安全验证码短信

由于网站程序开发人员在设计验证码时为了方便使用，会选择将验证码回显在响应中，来判断用户输入的验证码是否和响应中的验证码一致，如果一致就会通过身份校验。攻击者可以通过拦截数据包等手段获取短信验证码值，根据短信验证码使用场景的不同，将会导致任意账户登录、任意密码重置、用户身份盗用等更多高危的风险产生。

LuckySec

2022/11/15

9K0

模糊测试之攻击回显

dns 安全 http https 网络安全

描述：一个渗透安全工程师常常会在,某些安全测试项目中遇到,代码或者命令可以被执行,但是无任何的回显特征来判断攻击成功，

全栈工程师修炼指南

2020/10/23

3.1K0

element ui toggleRowSelection 回显无效

element store toggle ui 表格

组件初始加载时, 通过外部接口拉取需要设置的表格项数据. 通过表格实例方法toggleRowSelection 设置已选项无效.

copy_left

2022/09/30

1.4K0

Linux怎么复制文件到其他文件夹

linux unix

本文主要讲解linux怎么复制文件到其他文件夹。在Linux和Unix系统上工作时，复制文件和目录是您每天要执行的最常见任务之一。 cp是一个命令行实用程序，用于复制Unix和Linux系统上的文件和目录。在本文中，我们将解释如何使用cp命令。

狼啸风云

2021/04/13

15.7K0

利用DNS协议回显数据

dns 云数据库 SQL Server windows

这个问题已经是去年提出的了，之前也看到过，在 CTF 题目环境中利用过却对原理不慎了解，在公司大佬们的帮助下成功了理解了一波原理。

信安之路

2018/08/08

2.3K0

相似问题

无法从cordova Android应用程序访问图书馆资源

Android图书馆资源

访问图书馆资源的Android应用程序

如何读取"Android图书馆项目“中的资产资源

用Ant构建Android项目中的图书馆资源

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问在段落模式中匹配“模式文件”中的多个模式
EN

腾讯云域名特惠，新用户首年1元起

回答 3

Unix & Linux用户

Unix & Linux用户

Unix & Linux用户

无法从cordova Android应用程序访问图书馆资源

Android图书馆资源

访问图书馆资源的Android应用程序

如何读取"Android图书馆项目“中的资产资源

用Ant构建Android项目中的图书馆资源

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在段落模式中匹配“模式文件”中的多个模式EN

腾讯云域名特惠，新用户首年1元起

回答 3

Unix & Linux用户

Unix & Linux用户

Unix & Linux用户

无法从cordova Android应用程序访问图书馆资源

Android图书馆资源

访问图书馆资源的Android应用程序

如何读取"Android图书馆项目“中的资产资源

用Ant构建Android项目中的图书馆资源

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在段落模式中匹配“模式文件”中的多个模式
EN