前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基础生物信息学

基础生物信息学

作者头像
生信挖掘姬
修改2020-06-05 17:53:55
5070
修改2020-06-05 17:53:55
举报
文章被收录于专栏:生信挖掘姬生信挖掘姬

第一章

1.1 简介

我们正在见证生物医学研究的一场革命:几十年来,虽然人们一直清楚探索生物系统的遗传学对于了解生物系统是非常重要的,但是以前获得遗传序列是非常昂贵和复杂的。而现在,获取基因序列简单又便宜,以前所未有的速度生成数据。生物信息学序列分析是了解这些序列的核心,这本书简单介绍了DNA, RNA和蛋白质序列的研究。

生物信息学(Bioinformatics )涉及生成,可视化,分析,存储和检索大量的生物信息。原始形式的生物医学数据(包括DNA序列)的生成不涉及生物信息学技能。但是为了使该序列可用,必须对其进行分析,注释和重新生成适合数据库的格式。这些都属于生物信息学分析范畴。其中许多分析可以自动化,但需要具有生物信息学技能或经验的人来分析和支持。

一旦拿到数据,您如何分析数据呢?有没有DNA和蛋白质序列文件之类的文本呢?如果有,它应以某种方式呈现以便解释或容易输入程序进行分析。或者把数据图形化展示了多少信息?这种数据降维形式非常强大,如果没有它,我们将盯着一页一页的序列从字面上看,看不到有结论的图像。

一些分析是手动的,范围从查看单个核苷酸或氨基酸,到将序列提交给一个程序,这个程序把序列转换成另一种形式。这可能包括功能域(functional domains),修饰位点(modification sites)和编码区域(coding regions )的定位。通常,分析包括搜索数据库以进行比较或发现,这将是许多章节的主要内容。本书的大部分内容与分析有关。

通常,存储数据不是分析序列的人员的责任。然而,创建适当结构的数据库或存储形式能让数据便于检索和查询,这个对于分析人员工作的推进至关重要。序列文件和其他形式的数据可能已有数十年的历史,或者只是昨天创建的。但是,除非您可以轻松地检索它们,否则该数据量会迅速减小。 “容易”不只是描述计算机和连接交付信息给您的速度,尽管这可能非常重要。它还包括访问和查询已存储数据的步骤。理想的方法通常是Web具有易于理解的选项,在线帮助和结果页。生物信息学是最早接受科学技术的领域之一。网页是传播信息的工具,本书中我们将使用许多网页。

最后,生物信息学活动通常涉及大量数据。即使如果您只关注一个基因,那么仍然会有大量的数据连接到该单个序列。有了好的数据库或软件工具, 你不会因为数据量太大,而被你不感兴趣的内容淹没。尽管如此,生物信息学领域面临的最大的挑战之一是信息的绝对泛滥以及如何生成,可视化,分析,存储和检索这些数据,这无论怎么强调都不为过。

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系外文翻译前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第一章
    • 1.1 简介
    相关产品与服务
    对象存储
    对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档