微信办公已经常态化,我也在家里放了一个常年开机的Windows电脑登陆几个工作微信,进行及时答疑和生物信息学知识整理和创作。
这样就有一个问题,它的默认C盘是一个固态硬盘就区区500G空间,但是我微信等很多软件都是默认在C盘自己的用户下面的文档文件夹里面找位置存放资料。
尤其是微信聊天记录,耗费磁盘空间非常可观,一般来说,文件存储在当前用户的文档目录下面的。我简单使用命令看了看:
# 一般来说,文件存储在当前用户的文档目录下面的:
# WeChat Files/.../FileStorage/File
$ du -h -d 1
。。。
4.0G ./2021-08
4.2G ./2021-09
3.9G ./2021-10
6.1G ./2021-11
2.9G ./2021-12
4.7G ./2022-01
3.6G ./2022-02
42G .
如果你不知道如何输入 du -h -d 1 这样的命令,建议去自己下载一个Git软件在你的Windows电脑,然后就可以鼠标右键打开Git的黑白命令行,进行交互啦。
可以看到, 耗费了 42G的空间,有很多小伙伴的Windows是笔记本电脑,就 128G的空间,所以这个耗费还是有点令人头大。
我首先是因为登陆了4个微信,每次转发同一个文件到五十个群聊,比如我发一个文献pdf是1 M,它就会被我的4个微信的200个群聊同时下载,就变成了200M的磁盘空间消耗,如下所示:
find ./ -name "*(*"
./2022-02/单细胞转录组-2个分组标准分析(1).zip
./2022-02/单细胞转录组-2个分组标准分析(2).zip
./2022-02/单细胞转录组-2个分组标准分析(3).zip
./2022-02/单细胞转录组-2个分组标准分析(4).zip
# 此处省略200个 压缩包文件---
所以我首先删除这些文件名字里面有 括号的!
find ./ -name "*(*" |while read id;do(rm -rf "$id");done
减负之后是12G啦,效果还是很明显哦!
同样是使用find命令啦,查询大于100M的文件,可以看到 基本上都是学徒完成作业后发给我的单细胞图表复现代码 :
find ./ -type f -size +100M |xargs.exe ls -lh |cut -d" " -f5-
# 基本上都是学徒发给我的单细胞图表复现代码
158M Jun 7 2021 ./2021-06/GSE40791.zip
139M Jun 19 2021 ./2021-06/week2.zip
175M Jun 25 2021 ./2021-06/文章复现_Sophie_20210625.zip
116M Jun 28 2021 ./2021-06/甲状腺癌数据分析.zip
176M Jul 12 2021 ./2021-07/01_Code.zip
144M Jul 11 2021 ./2021-07/GSE150241-code.zip
171M Jul 20 2021 ./2021-07/GSE156329.zip
196M Jul 18 2021 ./2021-07/GSE166635_code.zip
190M Jul 19 2021 ./2021-07/GSE171306_Sophie_单细胞数据分析.zip
110M Jul 30 2021 ./2021-07/Meng_3rd_code.zip
118M Jul 17 2021 ./2021-07/paper+supplementary.zip
160M Nov 12 19:37 ./2021-11/几个gse数据集结果汇总.zip
102M Nov 20 09:05 ./2021-11/单细胞+深度学习.zip
247M Dec 7 21:33 ./2021-12/scRNA.7z
108M Dec 12 09:30 ./2021-12/学徒作业1.key
197M Dec 4 20:34 ./2021-12/小鼠神经元_项目结果.rar
365M Jan 6 22:25 ./2022-01/1.306西医综合(pdf).rar
因为这些代码里面都是包含了原始数据,所以巨大无比。检查后,确实们有什么值得留恋的,因为代码我都每次备份整理了,没必要使用原始版本,就一起删除吧。
find ./ -type f -size +100M |while read id;do(rm -rf "$id");done
如果你还不够解气,可以大于10M的,一起删除:
find ./ -type f -size +10M |while read id;do(rm -rf "$id");done
如果你想看懂上面的代码,就需要具备生物信息学数据分析学习过程的计算机基础知识,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
Linux的6个阶段需要一一跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:
如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:
We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.
十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你。