我在分析DNA串。
input.txt包含:
Rosalind_6404CCTGCGGAAGATCGGCACTAGAATAGCCAGAACCGTTTCTCTGAGGCTTCCGGCCTTCCCTCCCACTAATAATTCTGAGG>Rosalind_5959CCATCGGTAGCGCATCCTTAGTCCAATTAAGTCCCTATCCAGGCGCTCCGCCGAAGGTCTATATCCATTTGTCAGCAGACACGC>Rosalind_0808CCACCCTCGTGGTATGGCTAGGCATTCAGGAACCGGAGAACGCTTCAGACCAGCCCGGACTGGGAACCTGCGGGCAGTAGGTGGAAT
守则是:
f = open('input.txt', 'r')
raw_samples = f.readlines()
f.close()
samples = {}
cur_key = ''
for elem in raw_samples:
if elem[0] == '>':
cur_key = elem[1:].rstrip()
samples[cur_key] = ''
else:
samples[cur_key] = samples[cur_key] + elem.rstrip()
print(samples)
for p_id, s in samples.values():
samples[s_id] = (s.count('G') + s.count('C'))*100
print (samples)`我不断地发现错误:
文件“C:/Python34 34/test.py”,第18行,in for p_id,s in samples.values():ValueError:太多的值无法解包(预期为2)
发布于 2015-04-25 15:45:11
我能够通过将for p_id, s in samples.values()改为for p_id, s in samples.items()来解决这个问题。
我还注意到,p_id和s_id是不同的,它们注定是一样的。
发布于 2015-04-25 17:22:09
import csv
reader = csv.reader(open("input.txt"), delimiter=">", quotechar="'")
dkeys = [item for item in next(reader) if item.strip()]
dvalues = [(item.count('G')+item.count('C')*100) for item in dkeys]
print(dict(zip(dkeys, dvalues)))我希望它有用。:D
https://stackoverflow.com/questions/29867186
复制相似问题