我试图将行添加到从文件中读取的空列表中,并且已经删除了返回行和换行符,但是一行应该作为两个单独的项输入到列表中。
DNA = open('DNAGCex.txt')
DNAID = []
DNASEQ = []
for line in DNA:
line = line.rstrip()
line = line.lstrip()
if line.startswith('>')==True:
DNAID.append(line)
if line.startswith('>')==False:
我编写了下面的python代码来解决Rosalind问题()之一,并且由于某种原因,Rosalind说答案是错误的,但是我做了一些抽查,它看起来是正确的。
问题如下:
Given: A collection of at most 10 DNA strings of equal length (at most 1 kbp) in FASTA format.
Return: A consensus string and profile matrix for the collection. (If several possible consensus strings exist, then you
我知道这可能是一个常见的问题,但我只是无法弄清楚,也无法在这个网站上找到它。
HTML:
<div id="header-bg" >
<img class="pic" src="https://upload.wikimedia.org/wikipedia/en/e/e9/Rosalind_Franklin_%281920-1958%29.jpg" alt="Portrait of Rosalind Franklin with her hand on her chin, looking off to the
所以我有一个DNA fasta文件。其格式如下:()
发展中国家
美国国家航空公司( Rosalind_6085 )
最后,我想看看哪个Rosalind_ids的G和C值最多,所以我的思维过程是制作一个id标记列表,然后列出与它相关的所有DNA。然后将它们压缩到字典中,并创建一个函数来确定GC字母的最高浓度。问题是,当我附加多个字母的行时,我会得到一个列表,每一行由',‘分隔,而不是一个包含rosalind_id_tag下面所有行的列表,然后用',’分隔它们,如果它是一个新的标记。
所以我最终想:
dna = [list of letters from first ra
下面您可以找到沿给定DNA序列进行内含子检测的简单脚本
from re import match
f= open('data.txt', 'r').readlines()[1::2]
u = [element[:-1] for element in f]
chain=u[0]
exons=[]
#detect introns in chains
for i in u:
for j in range(len(chain)):
if i==chain: #pass sequence itself
pass
我要和Stepic一起去上课。我认为两个字符串之间的一个简单断言失败了。不然我怎么才能检查平等呢?谢谢,吉姆
def weights_to_letters(peptide):
'''
take a list of weights and convert to a string of aa letters
'''
from Bio.Data.IUPACData import protein_weights
ret_string = ''
for weight in peptide:
开始学习docker并尝试设置mysql容器。但一旦退出,它就会立即死亡。
下面是使用的命令
docker run mysql -e MYSQL_ROOT_PASSWORD=password1
看一下码头ps,它没有显示任何正在运行的码头容器。
使用docker,-a返回以下内容:
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
e681f56c52e2 mysql "/entrypoin
我对编程很陌生,F#是我的第一种.NET语言。
我正在尝试 on Rosalind.info。基本上,给定一个DNA字符串,我应该返回四个整数,计算符号'A‘、'C’、'G‘和'T’在字符串中出现的次数。
下面是我到目前为止编写的代码:
open System.IO
open System
type DNANucleobases = {A: int; C: int; G: int; T: int}
let initialLetterCount = {A = 0; C = 0; G = 0; T = 0}
let countEachNucleobase (a
我浏览了关于这个主题的其他问题,但找不到真正能解决我正在试图弄清楚的问题的东西。
问题是这样的:我试图创建一个程序,在两条互补的DNA链中寻找回文,返回每个回文的位置和长度。
例如,如果给定序列TTGATATCTT,程序应该找到补码(AACTATAGAA),然后将第二个索引标识为6字符回文的开始。
我是一个全新的编程新手,所以它看起来可能非常愚蠢,但我想出的代码看起来像这样:
'''This first part imports the sequence (usually consisting of multiple lines of text)
from a file
我是Docker的新手,刚刚开始使用。我拉出了一个基本的ubuntu镜像,用它启动了一些容器并阻止了它们。当我运行命令列出所有docker容器(甚至是停止的容器)时,我得到如下输出:
> docker container ls -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
099c42011f24 ubuntu:latest "/bin/bash" 6 seconds ago
我刚刚开始学习有关Biopython的知识,我正在尝试使用ExPASy来检索SwissProt记录,就像在Biopython教程()的第180页中所描述的那样,同时也是在一个相关的ROSALIND练习中(按住键并单击展开“编程快捷方式”部分)。
我使用的代码与ROSALIND练习中的代码基本相同:
from Bio import ExPASy
from Bio import SwissProt
handle = ExPASy.get_sprot_raw('Q5SLP9')
record = SwissProt.read(handle)
但是,SwissProt.read函数会给
我在rosalind上做了一个问题,希望您返回一个子字符串在较长字符串中出现的位置。唯一的问题是出现了重叠现象,输出应该是: 1,3,9(假设0是基于计数的),但是我只得到1和9?这是我的密码。
import re
s='GATATATGCATATACTT'
t='ATAT'
substrings=re.compile('ATAT')
matches=substrings.finditer(s)
for match in matches:
print(match.start()+1) #doesn't find over
我是BioPython新手,我试图导入一个fasta/fastq文件并遍历每个序列,同时对每个序列执行一些操作。我知道这似乎很基本,但由于某种原因,下面的代码没有正确打印。
from Bio import SeqIO
newfile = open("new.txt", "w")
records = list(SeqIO.parse("rosalind_gc.txt", "fasta"))
i = 0
dna = records[i]
while i <= len(records):
print (dna.nam
我在我的conda环境中使用包时遇到问题。这个包显然在我的环境中,但是当我使用环境中的解释器运行脚本时,我得到了ModuleNotFoundError。在过去的几个小时里,我什么都试过了,但还是想不通。有人知道问题出在哪里吗?谢谢
(pythonProject) C:\Users\...\Desktop\Other\CS\Rosalind\Bioinformatics Stronghold>conda list
# packages in environment at C:\tools\Anaconda3\envs\pythonProject:
#
# Name
我是Python的初学者。我试图解决这个问题:“如果我们有一个包含<1000行的文件,如何只打印奇数行?”这是我的密码:
with open(r'C:\Users\Savina\Desktop\rosalind_ini5.txt')as f:
n=1
num_lines=sum(1 for line in f)
while n<num_lines:
if n/2!=0:
a=f.readlines()[n]
print(a)
break
我相当确定问题出在什么地方,但我不确定如何修复它。
到目前为止的代码:
def parseFasta(fasta):
sequence = ""
fasta = open("rosalind_lcsm.fasta", "r")
for line in fasta:
if ">" in line:
pass
else:
sequence += line.strip()
return sequence.split()
def hid_motif(dat
我试图自己解决罗莎琳德()的另一个问题,但不幸的是,我不得不向你寻求帮助。
这是my approach
首先,函数创建长度为n的输入字符串的所有可能子字符串:
def get_substrings(input_string, l):
res_list = []
sub = []
for i in range(len(input_string)):
if l+i <= len(input_string):
for j in range(i,l+i):
sub.append(input_string[j])
sub = '