首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >awk能处理带引号的CSV文件吗?

awk能处理带引号的CSV文件吗?
EN

Stack Overflow用户
提问于 2010-06-29 14:35:26
回答 11查看 21.2K关注 0票数 28

我使用awk对csv文件中一列的总和进行计数。数据格式类似于:

代码语言:javascript
复制
id, name, value
1, foo, 17
2, bar, 76
3, "I am the, question", 99

我使用这个awk脚本来计算总和:

代码语言:javascript
复制
awk -F, '{sum+=$3} END {print sum}'

name字段中的一些值包含逗号,这会中断我的awk脚本。我的问题是: awk能解决这个问题吗?如果是,我该怎么做呢?

谢谢。

EN

回答 11

Stack Overflow用户

回答已采纳

发布于 2010-07-01 01:14:22

在awk中编写如下所示的函数:

代码语言:javascript
复制
$ awk 'func isnum(x){return(x==x+0)}BEGIN{print isnum("hello"),isnum("-42")}'
0 1

你可以在你的脚本中加入这个函数,检查第三个字段是数字还是数字不是数字,然后去第四个字段,如果第四个字段不是数字,去第五个...till你会得到一个数字value.probably,在这里循环会有帮助,并把它加到和中。

票数 -6
EN

Stack Overflow用户

发布于 2012-10-18 22:26:19

使用GNU awkFPAT的单向方法

代码语言:javascript
复制
awk 'BEGIN { FPAT = "([^, ]+)|(\"[^\"]+\")" } { sum+=$3 } END { print sum }' file.txt

结果:

代码语言:javascript
复制
192
票数 29
EN

Stack Overflow用户

发布于 2015-08-08 12:19:43

我正在使用

代码语言:javascript
复制
`FPAT="([^,]+)|(\"[^\"]+\")" `

使用gawk定义字段。我发现当字段为空时,它无法识别正确的字段数量。因为"+“在字段中至少需要一个字符。我将其更改为:

代码语言:javascript
复制
`FPAT="([^,]*)|(\"[^\"]*\")"`

并用"*"替换"+"。它工作正常。

我也发现GNU Awk用户指南也有这个问题。https://www.gnu.org/software/gawk/manual/html_node/Splitting-By-Content.html

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3138363

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档