前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Biopython | 介绍和安装

Biopython | 介绍和安装

作者头像
DoubleHelix
发布2022-12-16 18:59:58
1.1K0
发布2022-12-16 18:59:58
举报
文章被收录于专栏:生物信息云生物信息云

1.Biopython介绍

Biopython是Python的最大,最受欢迎的生物信息学软件包。它包含许多用于常规生物信息学任务的不同子模块。它由Chapman和Chang开发,主要使用Python编写。它还包含C代码,以优化软件的复杂计算部分。它可以在Windows,Linux,Mac OS X等操作系统上运行。

基本上,Biopython是python模块的集合,这些模块提供处理DNA,RNA和蛋白质序列操作的功能,例如DNA字符串的反向互补,寻找蛋白质序列中的基序等。它提供了很多解析器,可以读取所有主要的遗传数据库 如GenBank,SwissPort,FASTA等,以及在python环境中运行其他流行的生物信息学软件/工具(如NCBI BLASTN,Entrez等)的包装程序/接口。它具有兄弟项目,例如:BioPerl,BioJava和BioRuby。

官网:https://biopython.org/

(1). 特征

Biopython是可移植的,清晰的并且具有易于学习的语法。下面列出了一些突出的功能 -

  • 解释性的,交互式和面向对象的。
  • 支持FASTA,PDB,GenBank,Blast,SCOP,PubMed/Medline,ExPASy相关格式。
  • 处理序列格式的选项。
  • 管理蛋白质结构的工具。
  • BioSQL-SQL表的标准集合,用于存储序列以及功能和注释。
  • 访问在线服务和数据库,包括NCBI服务(Blast,Entrez,PubMed)和ExPASY服务(SwissProt,Prosite)。
  • 访问本地服务,包括Blast,Clustalw,EMBOSS。

(2). 目标

Biopython的目标是通过python语言提供对生物信息学的简单,标准和广泛的访问。下面列出了Biopython的特定目标 -

  • 提供对生物信息学资源的标准化访问。
  • 高质量,可重用的模块和脚本。
  • 可在集群代码,PDB,NaiveBayes和Markov模型中使用的快速数组操作。
  • 基因组数据分析。

(3). 好处

Biopython只需很少的代码,并具有以下优点 -

  • 提供用于聚类的微阵列数据类型。
  • 读取和写入Tree-View类型的文件。
  • 支持用于PDB解析,表示和分析的结构数据。
  • 支持在Medline应用程序中使用的日记数据。
  • 支持BioSQL数据库,该数据库是所有生物信息学项目中广泛使用的标准数据库。
  • 通过提供将生物信息学文件解析为特定格式的记录对象或序列加特征的通用类的模块,来支持解析器开发。
  • 清除基于食谱样式的文档。

(4).. 样本案例研究

让我们来看看一些用例(种群遗传学,RNA结构等),并尝试了解Biopython在该领域如何发挥重要作用:

人口遗传学

种群遗传学是对种群内遗传变异的研究,涉及对种群中基因和等位基因频率随时间和空间变化的检查和建模。Biopython提供了用于种群遗传学的Bio.PopGen模块。该模块包含收集经典种群遗传学信息的所有必要功能。

RNA结构DNA,RNA和蛋白质是我们生活中必不可少的三个主要生物大分子。蛋白质是细胞的主力军,并作为酶发挥重要作用。DNA(脱氧核糖核酸)被认为是细胞的“蓝图”。它携带了细胞生长,吸收营养和繁殖所需的所有遗传信息。RNA(核糖核酸)在细胞中充当“ DNA影印件”。

Biopython提供了Bio.Sequence对象,这些对象代表核苷酸,DNA和RNA的构建基块。

//更多请阅读:https://www.yiibai.com/biopython/biopython_introduction.html

2.安装

代码语言:javascript
复制
pip install biopython

安装成功

代码语言:javascript
复制
PS F:\gitHub\note> pip install biopython
Collecting biopython
  Downloading biopython-1.80-cp310-cp310-win_amd64.whl (2.7 MB)
     ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 2.7/2.7 MB 2.8 MB/s eta 0:00:00
Collecting numpy
  Downloading numpy-1.23.5-cp310-cp310-win_amd64.whl (14.6 MB)
     ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 14.6/14.6 MB 7.2 MB/s eta 0:00:00
Installing collected packages: numpy, biopython
Successfully installed biopython-1.80 numpy-1.23.5
PS F:\gitHub\note>

3.验证安装成功

代码语言:javascript
复制
import Bio           
print(Bio.__version__)

4.查看帮助文档

代码语言:javascript
复制
help(Bio)
代码语言:javascript
复制
NAME
    Bio - Collection of modules for dealing with biological data in Python.

DESCRIPTION
    The Biopython Project is an international association of developers
    of freely available Python tools for computational molecular biology.
    https://biopython.org

PACKAGE CONTENTS
    Affy (package)
    Align (package)
    AlignIO (package)
    Alphabet (package)
    Application (package)
    Blast (package)
    CAPS (package)
    Cluster (package)
    Compass (package)
    Data (package)
    Emboss (package)
    Entrez (package)
    ExPASy (package)
    File
    GenBank (package)
    Geo (package)
    Graphics (package)
    HMM (package)
    KEGG (package)
    LogisticRegression
    MarkovModel
    MaxEntropy
    Medline (package)
    NMR (package)
    NaiveBayes
    Nexus (package)
    PDB (package)
-- More  --

5.更新

代码语言:javascript
复制
pip install biopython –-upgrade

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-11-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.Biopython介绍
    • (2). 目标
      • (3). 好处
        • (4).. 样本案例研究
        • 2.安装
        • 3.验证安装成功
        • 4.查看帮助文档
        • 5.更新
        相关产品与服务
        数据库
        云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档