前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >nature杂志给你的生物信息学数据处理11个小技巧

nature杂志给你的生物信息学数据处理11个小技巧

作者头像
生信技能树
发布2020-02-20 14:53:54
4670
发布2020-02-20 14:53:54
举报
文章被收录于专栏:生信技能树生信技能树

nature杂志的TECHNOLOGY FEATURE 栏目在13 JANUARY 2020发表了一个有趣的小短文:Eleven tips for working with large data sets,副标题是:Big data are difficult to handle. These tips and tricks can smooth the way.

我简要概括一下:

珍惜您的数据
  • 多处备份原始数据
  • 冷存储
可视化
  • 一图胜千言
  • 流程里每个步骤独立质量控制,组合质量控制
工作流

结合了软件代码,文本和图形的文档,交互式报表

  • rmarkdown
  • jupyter notebook
版本控制
  • md5文件
  • zenodo

数据的描述信息

  • 描述了如何收集,格式化和组织观测
自动化
记录时间消耗
  • 大数据集需要高性能计算(HPC)
  • 云服务器提供商
系统运行环境
  • 操作系统和软件库
  • Docker容器
流程里面不要下载数据
  • 数据库文件打包在流程
学一门编程语言
善用帮助资源
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-01-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 珍惜您的数据
  • 可视化
  • 工作流
  • 版本控制
  • 数据的描述信息
    • 自动化
      • 记录时间消耗
        • 系统运行环境
          • 流程里面不要下载数据
            • 学一门编程语言
              • 善用帮助资源
              相关产品与服务
              容器服务
              腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档