我有一个csv文件,内容如下:
a,b,c,2
d,e,f,3
g,h,i,3
j,k,l,4
m,n,o,5
p,q,r,6
s,t,u,7
v,w,x,8
y,z,zz,9我希望为这个数据分配五分位数(就像我们在sql中那样),最好在linux中使用bash命令。如果将五分位数分配为新列,则最终输出如下所示:
a,b,c,2, 1
d,e,f,3, 1
g,h,i,3, 2
j,k,l,4, 2
m,n,o,5, 3
p,q,r,6, 3
s,t,u,7, 4
v,w,x,8, 4
y,z,z,9, 5我唯一能够做到的就是在csv文件中添加一个新的增量列:
`awk '{$3=","a[$3]++}1' f1.csv > f2.csv`但不确定五位数是如何。请帮帮忙。谢谢。
发布于 2018-02-17 21:39:06
简短的wc + awk方法:
awk -v n=$(cat file | wc -l) \
'BEGIN{ OFS=","; n=sprintf("%.f\n", n*0.2); c=1 }
{ $(NF+1)=" "c }!(NR % n){ ++c }1' filen=$(cat file | wc -l) -获取输入文件file的总行数n*0.2 -1/5 (20 %)的范围$(NF+1)=" "c -设置当前秩值c的下一个最后字段产出:
a,b,c,2, 1
d,e,f,3, 1
g,h,i,3, 2
j,k,l,4, 2
m,n,o,5, 3
p,q,r,6, 3
s,t,u,7, 4
v,w,x,8, 4
y,z,zz,9, 5https://stackoverflow.com/questions/48845082
复制相似问题