首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何将bash中的文件大小相加,按日期将结果分组?

要将bash中的文件大小相加并按日期分组,您可以使用以下步骤:

  1. 使用find命令查找所需的文件。例如,要查找当前目录及其子目录中的所有文件,可以使用以下命令:
代码语言:txt
复制
find . -type f
  1. 使用xargs命令将文件名传递给du命令,以获取文件大小。例如,要获取所有文件的大小,可以使用以下命令:
代码语言:txt
复制
find . -type f -print0 | xargs -0 du -h
  1. 使用awk命令按日期对文件大小进行分组。例如,要按月份和年份对文件大小进行分组,可以使用以下命令:
代码语言:txt
复制
find . -type f -print0 | xargs -0 du -h | awk '{print $1, $2, strftime("%Y-%m", systime())}'

这将输出文件大小和日期,按月份和年份分组。您可以根据需要调整strftime函数的格式。

注意:这个答案中没有提及云计算品牌商,因为这是一个通用的bash命令问题,与云计算无关。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

linuxfind命令基本使用方法_find命令用法及参数

find查找命令可以在各种条件下使用,我们可以通过权限,用户,组,文件类型,修改日期,大小等多种条件来查找文件。 这里我会以实例形式向大家说明find命令具体用法。...表达式决定了我们要找文件是什么属性文件,还可以指定一些“动作”,比如匹配某种条件文件删除。所以,find命令核心就是表达式指定方法。...perm 文件权限查找 -exec 对查找到文件执行指定动作 -maxdepth / -mindepth 指定查找范围最大/最小为第几级目录 -cmin 文件修改时间查找 -size 文件大小查找...,修改文件大小 文件大小查找/mnt中文件,20M表示查找大小为20M文件,-20M表示查找大小在20M以内文件,20M表示查找大小超过20M文件 6)修改时间查找/mnt...下图命令是在/mnt下查找文件权限u、g、o位(只要)任意一位有写权限w文件,并对查找出所有文件减去写权限,{}表示find命令查找结果 注意: 在使用分号时候前面要加转译字符\,因为分号也是bash

1K20

没想到,日志还能这么分析!

接着,我们可以使用 sort 对日期进行排序,然后使用 uniq -c 进行统计,于是分组 PV 就出来了。 可以看到,每天 PV 量大概在 2000-2800: ?...wc -l,查看记录条数; ---- UV 分组 假设我们天来分组分析每天 UV 数量,这种情况就稍微比较复杂,需要比较多命令来实现。...具体分析如下: 第一次 ack 是第 4 列日期和第 1 列客户端 IP 地址过滤出来,并用空格拼接起来; 然后 sort 对第一次 ack 输出内容进行排序; 接着用 uniq 去除重复记录...之后 END 关键字代表一个触发器,就是当前面的输入全部完成后,才会执行 END {} 语句,END 语句是通过 foreach 遍历 uv 中所有的 key,打印出分组 uv 数量。..., n 表示数值排序) 对统计结果排序,结果如下图: ?

1.1K10

MongoDB系列六(聚合).

,每个操作符都会接受一连串文档,对这些文档做一些类型转换,最后转换后文档作为结果传递给下一个操作符(对于最后一个管道操作符,是结果返回给客户端),称为流式工作方式。     ...跳过(skipping)—> $skip $skip也是接受一个数字n,丢弃结果集中前n个文档,剩余文档作为结果返回。在“普通”查询,如果需要跳过大量数据,那么这个操作符效率会很低。...{"$sum" : value}  对于分组每一个文档,value与计算结果相加。 {"$avg" : value} 返回每个分组平均值 {"$max" : expr} 返回分组最大值。...数学操作符 适用于单个文档运算。 {"$add" : [expr1[, expr2, ..., exprN]]} 这个操作符接受一个或多个表达式作为参数,这些表达式相加。...允许输出结果利用管道放入一个集合是为了方便以后使用(这样可以所需内存减至最小)。

4.9K60

没想到,日志还能这么分析!

接着,我们可以使用 sort 对日期进行排序,然后使用 uniq -c 进行统计,于是分组 PV 就出来了。...wc -l,查看记录条数; ---- UV 分组 假设我们天来分组分析每天 UV 数量,这种情况就稍微比较复杂,需要比较多命令来实现。...既然要按天统计 UV,那就得把「日期 + IP地址」过滤出来,并去重,命令如下: 具体分析如下: 第一次 ack 是第 4 列日期和第 1 列客户端 IP 地址过滤出来,并用空格拼接起来; 然后...之后 END 关键字代表一个触发器,就是当前面的输入全部完成后,才会执行 END {} 语句,END 语句是通过 foreach 遍历 uv 中所有的 key,打印出分组 uv 数量。..., n 表示数值排序) 对统计结果排序,结果如下图: ---- 分析 TOP3 请求 access.log 日志,第 7 列是客户端请求路径,先使用 awk 过滤出第 7 列内容后,进行

51510

图解面试题:如何分析游戏?

【题目】 猴子是一个班级班主任,由于所带班级学生成绩普遍不是很好。现在他需要找出每门课程成绩最差学生,然后有针对性辅导。 下面的成绩表,记录来每个学生选修课程成绩。...当有“每个”出现时候,就要想到是要分组(group by)了,这里是课程号分组。 最差成绩,也就是成绩最小,对应汇总函数是min(成绩)。...这种同时使用‘第一步查询结果’(表a)和‘原始成绩表’(表b)两个表查询,就要用到多表查询了 。....当有“每个”出现时候,要想到用“分组汇总”来完成这个业务需求 2.涉及到多个表时,使用多表查询 3.如何将业务需求使用sql来实现能力 【举一反三】 下面的游戏玩家表(activity表)记录了游戏玩家在游戏平台上行为活动...  from activity group by player_id; 【问题2】找出每位玩家首次登陆设备名称 (1)先和上一题一样,分组查找每组日期最小玩家,建立临时表 select player_id

57800

Linux常用命令04 - ls

在本教程,我们通过实际例子和最常见 ls 选项详细说明,向您展示如何使用 ls 命令。...在下面的部分,我们探讨最常用选项。 单纯list ls 命令默认输出只显示文件和目录名称,这没有提供很多信息。 -l (小写l)选项使 ls 以长列表格式打印文件。...当使用长列表格式时,ls 命令显示以下文件信息: 文件类型 文件权限 指向文件硬链接数 文件所有者 文件组 文件大小 日期及时间 档案名称 考虑下面的例子: ls -l /etc/hosts -...排序选项允许你根据扩展、大小、时间和版本对输出进行排序: --sort=extension(或-X ) 扩展名字母顺序排序 --sort=size /(或-S) 文件大小排序 --sort=time...(或-t)修改时间排序 --sort=version /(或-v) 版本号自然排序 如果希望以相反排序顺序获得结果,请使用-r 选项。

3.8K20

分享29个超有用 JavaScript 单行代码

在这篇文章,我列出了一系列 29 个 JavaScript 单行代码,它们在使用原生JS(≥ ES6)进行开发时非常有用。它们也是使用该语言在最新版本为我们提供所有功能来解决问题优雅方式。...一、日期处理部分 1、如何确认给定日期是否是当前日期 其思路,就像两个日期转换为相同格式并进行简单比较。...用文字来说,就是斐波那契数列由0和1开始,之后斐波那契数就是由之前两数相加而得出。......new Set(arr)]; 13、洗牌算法(随机数组) const shuffle = (arr) => arr.sort(() => Math.random() - 0.5); 14、属性对数组进行聚合分组...}${b}${b}`) .substring(1) .match(/.{2}/g) .map((x) => parseInt(x, 16)); 21、如何将

1.2K20

mongodb 学习五,聚合操作实操

思路如下: 分成 2 步进行 先计算出每一个条目的数量与价格乘积结果,放到一张临时表 从临时表筛选出结果大于 100 条目 上述说临时表,其实我们此处用到是聚合管道,例如这样 db.sales.aggregate...操作 sales 表 筛选出日期在 2014-01-01 到 2015-01-01 之间数据 分组_id 赋值为 字符串日期格式, totalSaleAmount 赋值为 原表 price...和 quantity 乘积 再将同样日期乘积结果相加 averageQuantity 赋值为 quantity 平均数 count 计算文档个数 排序, -1 是倒序, 1 是正序 project...users 表 tags 数组元素都变成对象 查询 users 表数据,可以看出 tags 还是一个数组 db.users.find().pretty() 使用 unwind 来元素做成文档...开始我们实践 我们 users 表 tags 数组元素,都做成一个对象 分组,按照 tags 来进行分组,_id 赋值为 tags 字段,averageQty 赋值为 qty 字段根据 tags

45410

RFM会员价值度模型

需要注意是,对于R来讲需要倒过来划分,离截止时间越近值划分越大。这样就得到每个用户R、F、M三个变量分位数值。 ⑤ 3个值组合或相加得到总RFM得分。...对于RFM总得分计算有两种方式,一种是直接3个值拼接到一起,例如RFM得分为312、333、132;另一种是直接3个值相加求得一个新汇总值,例如RFM得分为6、9、6。...'].max()获取一年日期最大值,这样方便后续针对每年数据分别做RFM计算,而不是针对4年数据统一做RFM计算。 ...  会员ID做聚合   这里使用groupby分组,以year和会员ID为联合主键,设置as_index=False意味着year和会员ID不作为index列,而是普通数据框结果列。...F和M规则是值越大,等级越高 而R规则是值越小,等级越高,因此labels规则与F和M相反 在labels指定时需要注意,4个区间结果是划分为3份  3列作为字符串组合为新分组 代码,先针对

37210

linux基础命令介绍八:文本分析 awk

如输出命令ls -l *结果文件大小和文件名: [root@centos7 temp]# ls -l * | awk '{print $5,$NF}' 13 b.txt 58 c.txt 12 d.txt...这里省略了action,整条awk语句表示打印文件大小大于20字节并且文件名以txt结尾行。...FILENAME 当前输入文件名字 awk还可以使用自定义变量,如网卡名赋值给变量a,然后输出网卡名及其对应RX bytes值(注意不同模式匹配及其action写法): [root@...:BEGIN和END;它们不会对输入文本进行匹配,BEGIN对应action部分组合成一个代码块,在任何输入开始之前执行;END对应action部分组合成一个代码块,在所有输入处理完成之后执行。...etc/passwd systemd-bus-proxy:x:999:997:systemd Bus Proxy:/:/sbin/nologin [root@centos7 temp]# split()字符串分隔符分隔

1.4K20

pandas基础:使用Python pandas Groupby函数汇总数据,获得对数据更好地理解

注意,在read_cvs行,包含了一个parse_dates参数,以指示“Transaction Date”列是日期时间类型数据,这将使以后处理更容易。...在下面的示例,我们首先按星期几对数据进行分组,然后指定要查看列——“Debit(借方)”,最后对分组数据“Debit”列执行操作:计数或求和。...,也允许使用正则元组,因此我们可以进一步简化上述内容: 图7 多列分组 记住,我们目标是希望从我们支出数据获得一些见解,并尝试改善个人财务状况。...要计算“Fee/Interest Charge”组总开支,可以简单地“Debit”列相加。 图14 可能还注意到,我们可以使用.loc方法获得与上面的groupby方法完全相同结果。...图16 图17 合并结果 最后,合并步骤很容易从我们上面获得结果可视化,它基本上将结果放回数据框架,并以更有意义方式显示,就像图17结果一样。

4.4K50

汇总你在 Linux 上命令使用情况

echo history date … 如果你历史记录命令列表传递给 sort 命令以字母顺序对命令进行分组,那么会得到以下内容: $ history | awk '{print $2}' |...$ alias cmds='history | awk '\''{print $2}'\'' | sort | uniq -c | sort -nr' 如果你像下面那样日期和时间添加了到 history...命令,那么你还必须修改所设置别名: $ echo $HISTTIMEFORMAT %d/%m/%y %T 这个日期/时间信息有时会很有帮助,但是这意味着你必须在选择 history 命令第 4...}'\'' | uniq -c | sort -nr' alias cmds='history | awk '\''{print \$4}'\'' | uniq -c | sort -nr' 请注意,日期和时间信息与命令本身保存在历史记录文件不同行...因此,添加此信息后,bash 历史记录文件行数增加一倍,尽管在 history 命令输出时不会: $ wc -l .bash_history 2000 .bash_history $ history

47920
领券