AttributeError:在Biopython的ProtParam模块中，“”Seq“”对象没有属性“”islower“”_模块:AttributeError对象在脚本中没有'_Condition‘属性_AttributeError:在使用python的pgdb模块中，' module‘对象没有'connect’属性 - 腾讯云开发者社区

alignment、bioinformatics、biopython

我有一个蛋白质对的列表，我想将"BLAST Two Sequence“的速度和准确性与Smith-Waterman程序进行比对。我知道在NCBI网站上有一个"Blast Two Sequence“选项，但我想从python脚本运行它。也许Biopython有这个能力？如果我不能使用Blast两个序列，我将比较不同版本的Smith-Waterman，但这不会那么令人兴奋:)或者，如果有人对生物信息学中涉及比较蛋白质对的大四项目有其他想法，请不要犹豫让我知道！提前谢谢你。

浏览 1提问于2012-04-15得票数 1

3回答

在Biopython中提取CDS序列

sequences、biopython

大家好，我开始用Biopython编程，我想知道如何从具有所有特征坐标的基因组GenBank文件(*.gb)中提取基因序列和蛋白质标识符。我的想法是创建一个包含蛋白质标识符、基因坐标和基因序列的文本文件。如果你有任何想法，我将不胜感激。到目前为止，我已经尝试过了： for seq_record in seq_record.features: if seq_record.type == 'CDS': x=seq_record.qualifiers['protein_id'] i=seq_record.location.

浏览 0提问于2014-04-28得票数 1

5回答

来自uniprot Protein id python的蛋白质序列

python、bioinformatics、biopython

我想知道是否有方法可以从uniprot蛋白质ids中获得蛋白质序列。我确实检查了几个在线软件，但他们允许一次获得一个序列，但我有5536个vlues。在biopython中有没有可以做到这一点的包？

浏览 2提问于2018-09-29得票数 4

1回答

使用Biopython检索Swissprot条目的异构体序列？

python、biopython

如果我有一个有异构体的蛋白质，我想检索每一个蛋白质的序列，我该怎么做呢？ from Bio import ExPASy from Bio import SwissProt accessions = ["Q16620"] handle = ExPASy.get_sprot_raw(accessions) record = SwissProt.read(handle) 这个例子将从biopython教程中检索第一个带有record.sequence的异构体序列。我发现，简单地以uniprot["Q16620-1", "Q16620-2", &#

浏览 3提问于2017-10-07得票数 2

回答已采纳

1回答

如何处理biopython翻译过程中的空白

python、bioinformatics、biopython

我需要用biopython翻译对齐的DNA序列。 from Bio.Seq import Seq from Bio.Alphabet import generic_dna seq = Seq("tt-aaaatg") seq.translate() 运行此脚本将得到错误： Bio.Data.CodonTable.TranslationError: Codon 'TT-' is invalid. 有没有办法把'tt-‘翻译成X，这样整个翻译后的序列就是'XKM’了？这将在翻译比对序列时非常有用。例如，比对的序列集以pandas DataFram

浏览 70提问于2019-05-04得票数 0

回答已采纳

1回答

在fasta数据集中寻找可变氨基酸基序

python、biopython

我需要找出在我的数据集的哪些蛋白质中存在这个氨基酸基序: PoXGXXHyXHy。我用的是biopython和python2.7，但我不是生物信息学家，我被搞砸了。我如何制作seq_record +1之类的东西呢？我尝试过使用in range，但它在SeqIO.parse中不起作用。嗯，我现在一团糟，有人能帮帮忙吗？我会非常感激的。 from Bio import SeqIO print('enter the path to your fasta file: ' ) user_input = raw_input() for seq_record in SeqIO.parse

浏览 0提问于2019-05-01得票数 0

2回答

利用蛋白质的基因标识检索DNA序列

python、bioinformatics、biopython、ncbi

我使用Biopython试图检索与蛋白质对应的DNA序列，我有一个GI(71743840)，从NCBI页面这是非常容易的，我只需要寻找参考。我的问题是在python中编写代码时，使用ncbi获取实用程序，我无法找到一种方法来检索任何可以帮助我进入DNA的字段。 handle = Entrez.efetch(db="nucleotide", id=blast_record.alignments[0].hit_id, rettype="gb", retmode="text") seq_record=SeqIO.read(handle,"gb&

浏览 2提问于2014-11-04得票数 1

回答已采纳

2回答

BioPython中给定基因名称的基因的相似性

python、similarity、biopython

在给定基因名称的情况下，我如何找到两个基因的相似性？所谓相似性，我想我指的是序列的相似性。我是这个领域的新手，我的教授给了我这项工作。我不知道有多少相似之处。希望这可以用Biopython来完成？非常感谢。作为响应更新：谢谢。但我试过了。我的主要问题是，当我从数据库中检索基因序列时，一些结果是基因序列，另一些结果是蛋白质序列。我认为，如果我们想要比较它们，我需要确保它们都是基因序列，或者它们都是蛋白质序列，对吗？下面是我使用的代码： handle = Entrez.efetch(db="nucleotide", id=t ,rettype="gb"

浏览 2提问于2013-12-19得票数 0

2回答

Python库参考/使用

python、libraries、biopython

我试图使用BioPython包中的一种方法来计算给定肽列表的等电点。在这里可以看到班级分类：为了将这个类导入到我的环境中，我使用了以下代码(我做对了吗？)： from Bio.SeqUtils.ProtParam import ProteinAnalysis 然后，为了调用该方法，我执行以下操作： window_aas = "ditkdteneveadveveadveveadvseql"; ProteinAnalysis.isoelectric_point(window_aas); 然而，我得到了以下错误，我不知道如何解释它，尽管我搜索了几个类似的错误：文件"C

浏览 4提问于2018-01-09得票数 1

回答已采纳

1回答

如何获得一个神秘序列的PDB id？

biopython

我有一堆蛋白质，来自一种叫做蛋白质网的东西。现在那里的序列有某种ID，但它显然不是PDB id，所以我需要用其他方法找到它。对于每种蛋白质，我都有其氨基酸序列。我正在使用biopython，但我还不是很有经验，在指南中找不到它。所以我的问题是，如果我有蛋白质的氨基酸序列，我如何找到蛋白质PDB id？(这样我就可以下载蛋白质的PDB文件)

浏览 32提问于2021-03-12得票数 1

1回答

更新后如何在Biopython中创建没有Bio.Alphabet模块的IUPAC dna对象？

python、bioinformatics、biopython

我刚接触生物信息学，所以这个问题可能有点傻，但我真的需要明确的答案，我在网上找不到它。我知道在更新之前是这样的： from Bio.Alphabet import IUPAC dna_iupac = Seq('ATGATCTCGTAA', IUPAC.unambiguous_dna)

浏览 48提问于2020-11-13得票数 0

4回答

命令我可以用来区分假设的蛋白质和一组蛋白质？

python、linux、ubuntu

我在fasta中有5000条蛋白质序列，其中有假想的蛋白质和功能蛋白，我怎样才能把假想的蛋白质和推测的蛋白质区分开来。假设的蛋白质在标题中有假设这个词，所以我希望我能用一些命令来区分它们。有谁知道python或linux命令来做到这一点吗？像这样的事情 KSADKKSNPTQ，2257-1421 ()蛋白质KSGRRATTRSVSGIDQDVKLNRALWTLAQELRGHLTTA，3593-2535 ()核酸en9 en8 11 en33#，4624-3506 () 我希望有两个文件，其中一个包含 ( PSPTOA )的假想蛋白和其他含有其他蛋白质序列的PSPTOA

浏览 0提问于2015-06-21得票数 1

2回答

使用Biopython (Python)从FASTA文件中提取序列

python、python-2.7、biopython、fasta

好的，我需要从一个FASTA文件中提取序列的一部分，使用python (biopython，) 我需要从每个序列中获得前10个碱基，并将它们放在一个文件中，保存来自FASTA格式的序列信息。最坏的情况是，如果没有办法保存序列信息，我可以只使用碱基。下面是一个例子： >gi|2765658|emb|Z78533.1|CIZ78533 C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGGAATAAACGATCGAGTG AATCCGGAGG

浏览 0提问于2012-10-30得票数 4

回答已采纳

2回答

AlignIO在FASTA文件中找不到记录

python、biopython

我想开始使用Biopython来对齐序列文件，但是库总是给我错误。我的代码如下： from Bio import AlignIO import Bio alignment = AlignIO.read("A_prot.fasta","fasta") print alignment 我确保将A_prot.fasta放在与我的程序相同的目录中，但我收到一个错误消息： Traceback (most recent call last): File "bio_seq_align.py", line 5, in <module> a

浏览 1提问于2013-03-08得票数 1

1回答

Biopython:不能使用.count()进行生物工程

biopython

我的目标是接收DNA序列中出现的'g‘的时间。我使用列表理解通过Biopython导入了一个DNA序列 seq = [record for record in SeqIO.parse('sequences/hiv.gbk.rtf', 'fasta')] 然后，我尝试在新创建的list comp变量上使用.count()方法。 print(seq.count('g')) 我收到一个错误，内容是 NotImplementedError: SeqRecord比较是故意不实现的。显式比较感兴趣的属性。有人知道迪里奥是什么吗？Biopy

浏览 5提问于2017-03-31得票数 0

回答已采纳

1回答

biopython的seqio.write()中出现"invalid sequence“错误

biopython

这个问题与生物信息学有关。我在相应的论坛上没有收到任何建议，所以我把它写在这里。我需要删除fasta文件中的非ACTG核苷酸，并使用来自biopython的seqio将输出写入一个新文件。我的代码是 import re import sys from Bio import SeqIO from Bio.SeqRecord import SeqRecord from Bio.Seq import Seq from Bio.Alphabet import IUPAC seq_list=[] for seq_record in SeqIO.parse("test.fasta"

浏览 15提问于2017-07-12得票数 3

回答已采纳

1回答

为什么我的外壳说:来自:太多的争论

python、ubuntu、bioinformatics、biopython

目标我是生物信息学的新学生，我想用一个程序将FASTQ文件转换成GBK文件。背景我使用Windows，使用VirtualBox运行Ubuntu环境。我听说类似Linux的系统更适合生物信息学(再说一次，我对此非常陌生)。我去这个网站：错误步骤我遵循通过本网站提供的安装biopython的说明。在Ubuntu的命令行上，我写道： pip install biopython pip install --upgrade biopython 然后，我继续按照站点的指示，在命令行中编写第一行代码： from Bio import SeqIO 这将产生以下错误：来自:太多的参数问题我不明

浏览 3提问于2021-12-20得票数 1

3回答

如何编写字符串算法

python、bioinformatics、biopython、string-algorithm、rosalind

给定一个FASTA文本文件(Rosalind_gc.txt)，我应该检查每个DNA记录并确定鸟嘌呤胞嘧啶(GC)含量的百分比(%)。这方面的示例如下：样本数据集： >Rosalind_6404 CCTGCGGAAGATCGGCACTAGAATAGCCAGAACCGTTTCTCTGAGGCTTCCGGCCTTCCC TCCCACTAATAATTCTGAGG >Rosalind_5959 CCATCGGTAGCGCATCCTTAGTCCAATTAAGTCCCTATCCAGGCGCTCCGCCGAAGGTCT ATATCCATTTGTCAGCAGACACGC >Ros

浏览 22提问于2019-05-30得票数 0

1回答

如何在更大范围内排列无序区域和序列(python)

python、alignment、bioinformatics

因此，这是对我上一个问题的跟进。感谢@mdml。我前面关于如何使用python对齐和比较列表中的两个元素(序列)的问题已经解决了。下面是我正在使用的代码(代码信用到mdml)： # Parse the file which was already split into split_list lines = open("seq.txt") for list in lines: split_list = list.split() header = "".join(split_list[0:2]) seq = split_list[2] disorder =

浏览 2提问于2014-07-08得票数 0

回答已采纳

1回答

使用ProtParam模块分析蛋白质序列

bioinformatics、biopython

我是Biopython的新手。现在，我正在尝试从fasta格式的几个蛋白质序列(超过100个)中计算蛋白质参数。然而，我发现很难正确解析序列。这是我使用的代码： from Bio import SeqIO from Bio.SeqUtils.ProtParam import ProteinAnalysis input_file = open ("/Users/matias/Documents/Python/DOE.fasta", "r") for record in SeqIO.parse(input_file, "fasta"): my

浏览 0提问于2018-03-13得票数 2