首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >csv - Linux中的NTILE列

csv - Linux中的NTILE列
EN

Stack Overflow用户
提问于 2018-02-17 19:25:33
回答 1查看 75关注 0票数 1

我有一个csv文件,内容如下:

代码语言:javascript
复制
a,b,c,2
d,e,f,3
g,h,i,3
j,k,l,4
m,n,o,5
p,q,r,6
s,t,u,7
v,w,x,8
y,z,zz,9

我希望为这个数据分配五分位数(就像我们在sql中那样),最好在linux中使用bash命令。如果将五分位数分配为新列,则最终输出如下所示:

代码语言:javascript
复制
a,b,c,2, 1
d,e,f,3, 1
g,h,i,3, 2
j,k,l,4, 2
m,n,o,5, 3
p,q,r,6, 3
s,t,u,7, 4
v,w,x,8, 4
y,z,z,9, 5

我唯一能够做到的就是在csv文件中添加一个新的增量列:

代码语言:javascript
复制
`awk '{$3=","a[$3]++}1' f1.csv > f2.csv`

但不确定五位数是如何。请帮帮忙。谢谢。

EN

回答 1

Stack Overflow用户

发布于 2018-02-17 21:39:06

简短的wc + awk方法:

代码语言:javascript
复制
awk -v n=$(cat file | wc -l) \
'BEGIN{ OFS=","; n=sprintf("%.f\n", n*0.2); c=1 }
 { $(NF+1)=" "c }!(NR % n){ ++c }1' file
  • n=$(cat file | wc -l) -获取输入文件file的总行数
  • n*0.2 -1/5 (20 %)的范围
  • $(NF+1)=" "c -设置当前秩值c的下一个最后字段

产出:

代码语言:javascript
复制
a,b,c,2, 1
d,e,f,3, 1
g,h,i,3, 2
j,k,l,4, 2
m,n,o,5, 3
p,q,r,6, 3
s,t,u,7, 4
v,w,x,8, 4
y,z,zz,9, 5
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48845082

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档