前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >51-R茶话会 (十一:论如何规范化命名文件)

51-R茶话会 (十一:论如何规范化命名文件)

作者头像
北野茶缸子
发布2021-12-17 11:00:08
4230
发布2021-12-17 11:00:08
举报
文章被收录于专栏:北野茶缸子的专栏
  • Ref Author : crazyhottommy
  • Ref Links : crazyhottommy/getting-started-with-genomics-tools-and-resources: Unix, R and python tools for genomics and data science (github.com)[1]

之前我们说了文件搜索:

好物分享第12弹-用三款软件实现“内容检索自由”

西卡西啊,如果你的文件起的跟NO 里的一样憋屈,这再智能也爱莫能助啊:

ps:除非你真的记得自己文件内容的信息,也是可以的。毕竟搜索工具是支持超级强大的内容搜索的。

作者干货非常多,其中一个部分写了文件命名的问题。

  • 一些要点:
    • 在文件名开头标记一些数字;
    • 如果文件名需要记录时间,使用ISO 8601 标准:YYYY-MM-DD;
    • 使用数字时统一位数,需要补位时,使用零填充。
    • 要让机器能够“看懂”,一般只选择-_ 等;
    • 要让人类也可以看懂,用好上述的-_ 分割主要信息;
    • 文件名不要包含太多特殊字符,以及空格;
    • 让命名遵循以下顺序:

我的一些经验:

  • 文件夹的命名习惯:aXX_20XX-XX-XX_XXXX,开头是项目编号,中间是日期,末尾是项目描述,比如:A01_2021-11-01_哈佛外显子
  • 脚本的命名习惯:01_xxx,比如:01_Packages-Preparation.R
  • 输入与输出文件的命名习惯:XX_20XX-XX-XX_XXXX,比如hs001_2021-11-01_Mouse-Blood.csv

不知道你有没有发现一个规律:对于内容不同的结构分隔,我使用_,而对于文本的内容分隔,使用-

这样的好处就是我们甚至还可以把文件整理成一个表格,借助一款酷酷的R 包HenrikBengtsson/dirdf: R package: dirdf - Extracts Metadata from Directory and File Names (github.com)[2]

ps:不知道你发现没有,我的公众号命名其实也挺乱的。其实我也在一直努力改善啦~

拓展阅读:How to name files - Speaker Deck[3]

【元数据文件命名法】规范性文件命名系统,不再为文件命名发愁 - 少数派 (sspai.com)[4]

参考资料

[1]crazyhottommy/getting-started-with-genomics-tools-and-resources: Unix, R and python tools for genomics and data science (github.com): https://github.com/crazyhottommy/getting-started-with-genomics-tools-and-resources

[2]HenrikBengtsson/dirdf: R package: dirdf - Extracts Metadata from Directory and File Names (github.com): https://github.com/HenrikBengtsson/dirdf

[3]How to name files - Speaker Deck: https://speakerdeck.com/jennybc/how-to-name-files?slide=17

[4]【元数据文件命名法】规范性文件命名系统,不再为文件命名发愁 - 少数派 (sspai.com): https://sspai.com/post/69524

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 北野茶缸子 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档