我正在为一堂课解决一个问题。我们得到了一长串DNA (AGATC.)并有望为AGA出现10次、GTC出现4次等几个短串联重复序列找到匹配。包含短串联重复的CSV文件看起来有点像这样,标题行位于顶部:
name, AGA, GTCC, ATTT
Ted, 4, 5, 9
Bill, 3, 2, 8
根据我使用的文件,可以有更多或更少的单个重复来查找(3 or 8)。我已经提取了在长字符串中找到的匹配的短串联重复序列,直到存储在列表变量中的整数列表。我从一个文本文件(DNA字符串)读取到内存中,然后使用另一个读取到内存的文件CSV文件进行分析。我想要做的是在CSV文件中找到整数列表(表示每个短串联重复出现在DNA长字符串中的次数),我还将其存储到一个变量中,作为字典列表(使用Dictreader),如[{'name': 'Ted', 'AGA' : '4', 'GTCC' : '5', 'ATTT' : '9'}, {'name': 'Ted', 'AGA' : '3', 'AGA' : '2', 'GTCC' : '8'}]。
如何在我的字典列表中找到像[4, 5, 9]这样的整数列表,匹配Ted的短串联重复,然后打印Ted的名字?请帮帮忙。
发布于 2022-02-15 03:29:47
这是一个简单的操作,实际上是从csv中读取,除了头文件并将其显示到列表中。
import csv
value = []
with open('file.csv', 'r') as file:
data = csv.reader(file)
header = next(data)
for row in data:
# print(row)
value.append(row)
print(value[0])
print(value[1])输出:
['Ted', ' 4', ' 5', ' 9']
['Bill', ' 3', ' 2', ' 8']https://stackoverflow.com/questions/71120083
复制相似问题