我已经为PSET6编写了大部分代码,并且掌握了它的要点。但我被一些围绕如何迭代DNA序列和计算连续STR的最长运行的逻辑所困。对于没有上CS50类的人,我基本上必须实现一个程序,根据他们的DNA来识别一个人。为了解决这个问题,我必须迭代DNA序列,计算一个DNA子串重复多少次,并计算该子串连续运行的最长运行时间。以下是我的代码 def count_substring(sequence_dna, substring):
strcounter = 0
run = []
substring = strlist
for i in ran
我正在处理CS50的DNA问题,并且python函数不断返回值,我不知道为什么。我尝试使用find,但是我的实现是错误的。
import csv, sys
#check if all arguments are provided
if len(sys.argv) != 3:
print("Usage: python dna.py data.csv sequence.txt")
exit()
#sets database to first argument
databaseFile = sys.argv[1]
#sequence is second file
我正在编写一个Python脚本,通过提取、执行和比较从字符串中提取的命令来测试我的CS50赋值。命令本身可以工作并产生结果;但是,当使用os.popen()或其他Python bash调用者调用命令时,情况似乎并非如此,它最终会产生一个SyntaxError。
代码:
import os
import re
with open("makefile", "r") as file:
data = file.read()
data = re.split("\n", data, re.M)
for argument in dat
所以我正在研究CS50问题集6 (pset6)的问题。我有点明白如何处理这个问题的逻辑,但我不能弄清楚代码。因为这是一个我应该自己解决的问题,所以我并不要求确切的代码解决方案,只是要求一些关于库的提示,等等。
然后,我会比较每个个体在DNA序列中连续显示STR的次数。
链接到
from sys import argv, exit
import csv
if len(argv) != 3:
print("Incorrect amount of command line arguments")
exit(1)
with open(argv[1],'r
我是一个编程初学者,所以我决定上CS50课程。在问题Set6 (Python)中,我编写了代码,它适用于小型数据库,但对于大型数据库却失败了,所以我只请求帮助解决这个问题。这是,您可以使用 (来自Google )
我的代码
import csv
from sys import argv
class DnaTest(object):
"""CLASS HELP: the DNA test, simply give DNA sequence to the program, and it searches in the database to
de
到目前为止,我有以下代码(来自cs50 50/pset6 6/DNA):
import csv
data_dict = {}
with open(argv[1]) as data_file:
reader = csv.DictReader(data_file)
for record in reader:
# `record` is a dictionary of column-name & value
name = record["name"]
data = {
"AGAT
我需要计算输入链中指定模式的出现次数,并为每个模式生成一个报告。输入字符串将包含1个AA AATTCGAA结尾,1表示要搜索的一个模式,AA是该模式,下一个是您要在其中搜索AA的部分。
My idea is to :
public static void main(String[] args){
Scanner s = new Scanner(System.in);
System.out.println("How many patterns do you want and enter patterns and DNA Sequence(ty
我正在做这项工作,我想知道如何一次以10个字符分组显示序列。
下面是工作程序屏幕截图:
我希望将输出框中的10个字符分组,例如:
1 CTCTAACGCG CAAGCGCATA TCCTTCTAGG 61 .
除空格和数字外,每行约有60个字符,因此必须有6个10个字符的组。
下面是我为显示此输出而编写的代码:
public void dispLines() {
// Get the selected value of characters per line and assign it to noc variable
String noc = numOfChar.
我正在尝试解决cs50课程中的dna问题,为了解决它,我做了一个小规模的版本,在这个版本中,我做了一个值,程序会在csv文件中搜索那个值,但由于某种原因,它找不到它。
代码如下:
import csv
f = open("small.csv")
csv_f = list(csv.reader(f))
length=len(csv_f)
target=4
for a in range(length):
for j in range(length):
if csv_f[a][j]==target:
print("found
我有一个像这样的.txt文件,其中包含六列。我希望根据列V8的值将第七列V7_Pheno添加到文件中,方法是将Yes编码为2,将No编码为1,将缺失的值编码为-9。
V1 V2 V3 V4 V6 V7_Pheno
2253792 20482 NA DNA 1 Yes
2253802 20491 NA DNA 4 Yes
2253816 20503 NA DNA 0 No
2253820 20508 NA DNA 4
我从维基百科上搜集了数据,并创建了一个数据文件。df
\n \n == Sifat-sifat DNA == \n DNA merupakan sebuah polimer yang terdiri dari satuan-satuan berulang yang disebut nukleotida. Tiap-tiap nukleotida terdiri dari tiga komponen utama, yakni gugus fungsionalgugus fosfat, gula deoksiribosa, dan basa nitrogen (nukleobasa) &
我想遍历kmer列表并选择只包含字符A、T、G和C的项目
kmers=["AL","AT","GC","AA","AP"]
for kmer in kmers:
for letter in kmer:
if letter not in ["A","T","G","C"]:
pass
else:
DNA_kmers.append(kmer)
我有一个csv,我将其转换为通用数组,然后,此数组I将插入到数据库中:
所以,这是php代码:
if (file_exists($csv)) {
$file = fopen($csv, 'r'); // r flag is for readonly mode
fgetcsv($file, 1000, ",");
while (( $line = fgetcsv($file) ) !== false) { // if line exists
$tryOne[] = $line; // add
我从纯素data.frame中提取了一个metaMDS,如下所示:
MDS1 MDS2 time nucleic_acid habitat treatment
10dnawatercontrol 0.06297458 0.153364604 10 dna water control
10dnawatertreated -0.20010385 -0.241614081 10 dna water treated
11dnawatercontrol 0.15518683 0.067861388 1
With T as
(
select 'Cytomegalovirus Nucleoside Analog DNA Polymerase Inhibitor [EPC],DNA Polymerase Inhibitors [MoA],Nucleoside Analog [Chemical/Ingredient],Nucleoside Analog Antiviral [EPC]' CLASS
FROM DUAL )
需要使用EPC拉线。
所需输出:
Cytomegalovirus Nucleoside Analog DNA Polymerase Inhibitor [EPC
我对此还很陌生。我在python中使用正则表达式,试图在推测的DNA序列中找到特定的密码子。目前代码可以工作,但不会注意到重叠(即,如果密码子前面的最后一个字母是A,后面的两个字母是A和C,它将找到一个并不真正存在的WRC密码子)。有没有办法让我修改一下?
import re
while True:
DNA = input("enter the DNA sequence:")
print('WRC:')
wrcpattern = re.compile(r'(A|T)(A|G)C')
wrcmatches = wrc