AWK:基于两列的数据后处理

文章/答案/技术大牛

发布

1回答

、

我正在处理以多列格式排列的CSV日志的后期处理，按以下顺序排列:第一列对应于行号( ID)，第二列包含其总体(POP，落入此ID的样本数)，第三列(dG)表示此ID的一些固有值(始终为负值)： ID,POP)中编号最高的行，使用下面的AWK表达式： # search CSV for the line with the highest POP and save all lines before it,keeping m

浏览 14提问于2021-03-26得票数 1

回答已采纳

1回答

多列数据的AWK后处理

、、

我正在处理一行中包含多列信息的txt文件集。在我的bash脚本中，我使用下面的AWK表达式从每个txt填充中获取文件名，以及从第五列中获取数字，并将其以两列格式保存在results.CSV文件中(通过管道传输到SED，这将从最终的CSV文件中删除文件的路径及其扩展名)： awk '-F, *' '{if(FNR==2) printf("%s| %s \n", FILE

浏览 28提问于2021-02-09得票数 1

回答已采纳

1回答

AWK:基于两列信息的数据过滤

、

我正在做以多列格式排列的多列CSV的后处理工作： ID, POP, dG2, 4, -5.49004, 4, -5.1600 5, 4,解决方案两次处理inout日志，检测pop(MAX)和保存匹配$2 > (.8 *max)‘的linnes： awk -F ', ' 'NR == 1 {next} FNR==NR {if (max <POP

浏览 22提问于2021-04-07得票数 1

回答已采纳

1回答

awk从大文件中快速检索列

如果你有一个有500K列的文件，当你从$1到$500K时，你需要一个接一个地取出每一列，这会花费越来越多的时间。除了做一个简单的{print $column_index}之外，有没有一种快速的方法来做到这一点呢？同一索引中的列将从两个文件中取出，并放在一个单独的文件中。所以，awk的工作是从file-1和file-2中取出一列，我可以使用paste来并列排列这<e

浏览 8提问于2018-01-05得票数 0

1回答

日志文件的分析、预处理或后处理

、、、、

我经历了几次迭代，实际上还无法决定如何结束数据(规范化还是非规范化)？如果我想对数据进行预处理，或者可能在数据进入数据库后再对其进行后处理？或者完全是别的什么？到目前为止我使用的东西: sed + awk，C#，g(awk)，Ruby，Postgres，我考虑过的东西:可能是一个非SQL数据库？可能还有其他想法吗？之后，我使用postgres创建了一个包含30列的大型postgre

浏览 3提问于2013-09-03得票数 1

回答已采纳

1回答

awk/sed:多列角的后处理

、

我使用以下bash函数对CSV文件进行操作并对每个AWK代码执行，对列数据执行一些数学操作，并最终将处理后的CSV保存在一个新文件中。, dG2, 10, -5.50004, 150, -4.1200 我的awk代码将其转换为2列格式(通过在第2列和第3列上应用数学方程我需要将我的AWK脚本传输到像sed或AWK这样

浏览 2提问于2021-05-12得票数 0

回答已采纳

2回答

从第二个字段打印大部分重复数字

、、、

我们有以下很长的文件因此，首先，我们在第二个字段上打印重复数最多的行列表。然后是第二个字段的重复数的第二个，等等。

浏览 0提问于2020-05-03得票数 0

回答已采纳

6回答

用AWK打印第一次出现第一次到最后一次出现第二次

、、、

我有一个数据文件，日期在第二列。，而点'...’表示更多行数据，'*‘表示同一列中的随机文本。我想要的只是基于第二列的20210112和20210219之间的数据。我希望避免sed/grep，因为两者都将grep在其他列中类似的模式。所以，我想AWK是一个更好的选择，但我注意到awk</e

浏览 0提问于2021-11-15得票数 1

回答已采纳

2回答

将文件的列复制到另一个以竖线分隔的文件的特定位置

、

我有一个假设xyz.dat的文件，它的数据如下-a2|b2|c2|d2|e2|f2|g2由于一些要求，我正在制作两个新的文件(又名m.dat和o.dat)从原始的xyz.dat。在运行一些逻辑后，M.dat包含如下所示的第2列|4列|6列-b22|d22|f22O.dat包含除2

浏览 4提问于2020-08-07得票数 0

1回答

Shell从数组中删除较低版本

、、、

我有以下数组：我想要删除相同元素的较低版本，并具有以下数组：现在，我将使用这种方法来删除相同的元素 ARRAYNAMESORT=$(tr ' ' '\n' <<< "${ARRAYNAME[@]}"

浏览 2提问于2020-04-08得票数 1

2回答

使用awk基于两个匹配字段的求和列

对于这个简单的任务，我似乎找不到一个awk解决方案。我可以很容易地根据一个匹配字段($1)对一列($3)进行求和：现在，我如何才能基于两个字段做到这一点呢？以下是示例数据：P1,tree,12 P2,gram,

浏览 4提问于2011-08-07得票数 6

回答已采纳

1回答

如何将所有段落从垂直排列到水平排列(彼此相邻)

、

我有一个大约有25个段落的文件，它们被一个空白行隔开，每个段落大约有2到20行，每一行有5列由一个semicolon.How隔开--我可以把第2段移到第1段的右边，第3段移到第2段的右边，等等。我的目标是稍后将所有内容粘贴到Excel中。这里使用的数字只是任何单词/数字的例子。

浏览 4提问于2015-12-27得票数 3

回答已采纳

1回答

在html文件中使用awk进行替换

、、

我的awk脚本从file1中读取记录，在file2中找到相同的记录，并用其中定义的符号替换(记录的)替换位置。但是，很少有值没有按预期的方式被替换。这个词的第一个例子正在被替换，如将TYTYTYGGHG转化为T##Y##GGHG将LEFT NAME转化为L##T NAMEawk ' FNR==NRif ($0 in word)

浏览 0提问于2022-05-11得票数 1

1回答

带有grep数据的file.csv中的cat

、、、、

我在file.csv中有数据0000046;0000046;04688;29;1;52.1683;20.5567cat file.csv |grep 05027 不幸的是，这与任何包含05027的行都匹配。如何限制仅在第三个字段上进行匹配？

浏览 2提问于2016-11-09得票数 0

回答已采纳

1回答

基于两列的awk增量变量

、、、、

我正在编写一个awk脚本，它解析一个CSV文件，比较一个列包含日期，另一个列包含活动类型，然后打印特定活动的计数。我所写的代码是：awk -F "," -v mydate=$NOW '{ var_== 1003 ) {

浏览 0提问于2013-08-06得票数 0

回答已采纳

1回答

bash变量着色线

、

" <<< "$@" }str="Line 3Line 5Line 7Line 9" 下面是对kls的调用

浏览 0提问于2023-02-08得票数 0

回答已采纳

2回答

使用awk连接基于两列的文件

、、

我有以下两个文件：1 43 6 4 2 N16 2 N22 5 Y3awk 'FNR==NR{a[$1,$2];next

浏览 0提问于2018-02-05得票数 1

回答已采纳

1回答

如何根据特定列的值筛选文件

、

这是原始数据table1|1|1|0table3|3|3|1TableName|Record ID|Session ID|Durationtable3|3|3|1 谢谢你！

浏览 0提问于2021-04-27得票数 0

回答已采纳

0回答

根据行值从csv文件中提取列数据

、、、

我正在尝试使用awk/sed根据行值提取特定的列数据。我的实际文件有15列和超过1,000行(来自.csv文件)。简单的示例:输入；一个总共有5列和100行的cdv文件。输出；从第2列到第5列的数据，基于第2列的特定行值。(我有一个希望操作符过滤出的行值的特定列表

浏览 17提问于2016-07-09得票数 0

1回答

在Linux中合并文本文件的两列

、

我有一个包含几列文本和值的文本文件。这一结构： DOG 42CAR 23如果列1有字符串，那么第2列就没有(或者实际上是空字符串)。反过来:如果第1列是空的，那么第2列有一个字符串。换句话说，“对象”(汽车、猫、狗等)发生在第1列或第2列中，但永远不会同时发生。我正在寻找一种有效的方法来合并第1列和第2列

浏览 3提问于2015-04-09得票数 6

回答已采纳

点击加载更多