前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >科普任重而道远:生物信息为什么要学 Linux?

科普任重而道远:生物信息为什么要学 Linux?

作者头像
简说基因
发布2021-01-04 10:37:44
2.3K0
发布2021-01-04 10:37:44
举报
文章被收录于专栏:简说基因

两个方面的需求:

  1. 数据处理
  2. 服务器运维

数据处理方面的需求

1. 首先是必要需

生物信息学是真正的大数据专业,对计算资源要求较大,很多时候需要在服务器上分析数据,而 Linux 是最常用的服务器操作系统。

比如一个基因组组装,需要 1 T 内存,20 T 硬盘,你很容易就排除掉了 Windows 和 Mac 系统了是吧。

2. 其次是好用

Linux 为生产而生,所以在上面做数据分析肯定是很好的。Linux 有很多现成的小工具可以直接使用,比如 grep, sed, awk,非常方便。另外也可以写脚本自动化执行许多重复性的工作,这些都是 Windows / Mac 平台没法比的。

3. 行业共识

鉴于以上两个原因,行业逐步达成了共识。人才往这方面培养,软件往这方面开发。

人才方面,生信专业从考研开始,就要考 Linux 基础知识。

软件方面,很多生信软件优先开发 Linux 版本,甚至只有 Linux 版本。

服务器运维方面的需求

愉快的大学生活就要结束了,你反复考虑,决定要读研。经过一段时间的挑灯夜战,终于考上生物信息研究生。进入实验室后。。。

你:老板,搞数据分析需要服务器啊。 老板:这是 5 万块。

然后你去电脑城,弄了台 5 万块的服务器,开始搞分析。第二年,师弟师妹来了。。。

师弟师妹:老板,服务器不够用。 老板:这里还有 5 万块。

然后你和师弟师妹一起又去电脑城搞了台服务器。几年下来,已经有 4、5 台服务器了,总不能为每一位同学都配一台吧。

于是如何充分利用现有的计算资源,就成为了当务之急。

大家上网苦苦搜索,发现一个叫做 SGE (Sun Grid Engine)的东西,可以把几台零散的服务器组成一个集群,用户使用这个集群的所有计算机,就像使用一台一样。

这个光荣而艰巨的任务,当然由你来干。集群弄好了,加个账户、添块硬盘、排下错误,于是你久病成良医,硬把自己折腾成了一个运维人员,要转行也是分分钟的事。

(以上故事纯属虚构,如有雷同,实属巧合。)

说完了实验室的情况,再聊一聊企业。一般大型的生物信息公司,都有自己的计算集群,有专门的服务提供商(比如荣之联)。此外,如果用阿里、华为这样的云服务器,则运维的事情会少很多。

写在最后

Linux 对于生信来说,运维不是刚需,但使用是刚需。生物信息学如何快速入门 Linux,请移步到下面这篇文章。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-12-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 简说基因 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据处理方面的需求
  • 服务器运维方面的需求
  • 写在最后
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档