DNA 6/ cs50正则表达式_cs50 Pset 6DNA-问题创建列表_使用正则表达式计算CS50 PSET6 DNA不匹配 - 腾讯云开发者社区

、

我已经为PSET6编写了大部分代码，并且掌握了它的要点。但我被一些围绕如何迭代DNA序列和计算连续STR的最长运行的逻辑所困。对于没有上CS50类的人，我基本上必须实现一个程序，根据他们的DNA来识别一个人。为了解决这个问题，我必须迭代DNA序列，计算一个DNA子串重复多少次，并计算该子串连续运行的最长运行时间。以下是我的代码 def count_substring(sequence_dna, substring): strcounter = 0 run = [] substring = strlist for i in ran

浏览 17提问于2020-09-08得票数 0

1回答

除了计数之外，还有其他方法来计数字符串中的重复次数吗？

、

我正在处理CS50的DNA问题，并且python函数不断返回值，我不知道为什么。我尝试使用find，但是我的实现是错误的。 import csv, sys #check if all arguments are provided if len(sys.argv) != 3: print("Usage: python dna.py data.csv sequence.txt") exit() #sets database to first argument databaseFile = sys.argv[1] #sequence is second file

浏览 2提问于2020-05-31得票数 1

回答已采纳

4回答

如何找到字符序列在字符串中连续重复的最大次数？

、、

我正在做一个cs50 50/pset6 6/dna项目。我很难找到一种方法来分析字符串序列，并收集某个字符序列连续重复的最大次数。下面是一个示例：字符串：JOKHCNHBVDBVDBVDJHGSBVDBVD 我应该寻找的字符序列：BVD 结果:我的函数应该能够返回3，因为在某一点上，字符BVD连续重复三次，即使它再次重复两次，我也应该寻找它重复次数最多的时间。

浏览 5提问于2020-07-15得票数 1

回答已采纳

2回答

CS50 DNA适用于small.csv，但不适用于大型应用

、

我对CS50 pset6 DNA有点问题。当我使用small.csv文件时，它可以获得所有正确的值并给出正确的答案，但当我使用较大的文件时，则不是这样。我已经用debug50解决了一个多星期的问题，但还是不能解决问题。我假设问题是在循环中的某个地方，通过样本来查找STRS，但我只是看不出它在遍历它时做错了什么。如果您不熟悉CSV问题集，代码应该查看CS50序列(argv[1])，并将其与包含人物DNA的CSV文件进行比较，以找出它属于哪个人(如果有的话)。注意:我的代码在这种情况下会失败；(Python dna.py数据库/Large.csv序列/5.txt)，如果这有帮助的话。 from

浏览 3提问于2020-04-27得票数 2

1回答

为使用os.popen()的工作代码获取SyntaxError

、、

我正在编写一个Python脚本，通过提取、执行和比较从字符串中提取的命令来测试我的CS50赋值。命令本身可以工作并产生结果；但是，当使用os.popen()或其他Python bash调用者调用命令时，情况似乎并非如此，它最终会产生一个SyntaxError。代码： import os import re with open("makefile", "r") as file: data = file.read() data = re.split("\n", data, re.M) for argument in dat

浏览 0提问于2020-12-10得票数 0

1回答

迭代CSV文件并比较字符串？

、

所以我正在研究CS50问题集6 (pset6)的问题。我有点明白如何处理这个问题的逻辑，但我不能弄清楚代码。因为这是一个我应该自己解决的问题，所以我并不要求确切的代码解决方案，只是要求一些关于库的提示，等等。然后，我会比较每个个体在DNA序列中连续显示STR的次数。链接到 from sys import argv, exit import csv if len(argv) != 3: print("Incorrect amount of command line arguments") exit(1) with open(argv[1],'r&#

浏览 1提问于2020-09-10得票数 1

1回答

pset 6 DNA，检查数据库中匹配的配置文件

、

我目前在cs50中的pset 6 dna上，我已经完成了问题的主要部分，但我似乎不能把我的头绕到最后一步，检查数据库中的匹配配置文件。我的所有代码都位于下面，为变量提供上下文，我不确定if循环的使用情况和应该比较的内容，我认为我可能对它进行了过度编译，因此对于理解或解决这个问题的任何帮助都将是非常有用的。 # TODO: Read database file into a variable database = [] filename = sys.argv[1] with open(filename) as f: reader = csv.DictReader(f) fo

浏览 6提问于2022-11-25得票数 0

回答已采纳

1回答

PSET6 CS50中重复序列的计数

、、

目前正在开发CS50。我尝试在文件DNA序列中计算STR，但它总是过多。我的意思是，例如:文件DNA中有多少“AGATC”连续重复。这段代码只是试图找出如何准确地计算那些重复的DNA。 import csv import re from sys import argv, exit def main(): if len(argv) != 3: print("Usage: python dna.py data.csv sequence.txt") exit(1) with open(argv[1]) as csv_file,

浏览 12提问于2020-09-30得票数 0

2回答

CS50问题集6 ( DNA ) "Python"，我不能计数间歇的DNA序列，我的代码在一个小数据库中成功，在大数据库中失败

、、、、

我是一个编程初学者，所以我决定上CS50课程。在问题Set6 (Python)中，我编写了代码，它适用于小型数据库，但对于大型数据库却失败了，所以我只请求帮助解决这个问题。这是，您可以使用 (来自Google ) 我的代码 import csv from sys import argv class DnaTest(object): """CLASS HELP: the DNA test, simply give DNA sequence to the program, and it searches in the database to de

浏览 3提问于2020-03-24得票数 2

回答已采纳

1回答

将字典中的值与列表进行比较(Python)

、、

我处理这个CS50问题集，告诉我们匹配人们的DNA 这是我即将完成的代码： import re, csv, sys def main(argv): # Open csv file csv_file = open(sys.argv[1], 'r') people = csv.reader(csv_file) nucleotide = next(people)[1:] # Open dna sequences file txt_file = open(sys.argv[2], 'r') dna_file

浏览 2提问于2021-02-12得票数 0

2回答

python程序运行时花费这么长时间/不会结束

所以我正在为cs50做dna问题，我必须计算一个STR在一个dna序列中重复的次数。我对如何解决这个问题有一个想法，所以我拿了一个数据，运行了我的代码，但问题是程序没有结束，一直在运行，我想从我启动这个程序到现在已经有10分钟了，它仍然是这样的。下面是代码： text="AAGGTAAGTTTAGAATATAAAAGGTGAGTTAAATAGAATAGGTTAAAATTAAAGGAGATCAGATCAGATCAGATCTATCTATCTATCTATCTATCAGAAAAGAGTAAATAGTTAAAGAGTAAGATATTGAATTAATGGAAAATATTGTTGGGGAAAGGAG

浏览 1提问于2020-11-15得票数 1

回答已采纳

1回答

在字符串中查找序列

、、

嗨，我有cs50的问题集，有困难，因为这是我在Python语言中的第一个星期，如果你不是直接写一个开放的答案，而是将我转到正确的函数或方法使用，我将不胜感激。我们在一个.txt文件中得到了一个很长的字符串序列，一行，没有空格。我必须找到给定DNA字符串中最长的连续单词序列示例txt：原始文本大约有5000个字符，但它类似于下面的示例。我的任务是找到'AGATC‘字符串的最长连续序列。假设第一个后果性序列是23次，在我继续阅读并在34次中找到另一个后果性序列后，我必须存储最大的数字。我的问题不是找到一种以这种方式读取和分析字符串的方法。我可以读取一个字符串，可以找到总的重复次

浏览 14提问于2020-11-18得票数 0

回答已采纳

2回答

在DNA序列中寻找反转重复序列

、、、

我有很长的DNA序列，我需要找到由两个回文序列组成的区域，这个序列位于间隔序列的两侧。输入如下： cgtacacgagtagtcgtagctgtcagtcgatcgtacgtacgtagctgctgtagcactatcgaccccacacgtgtgtacacgatgcacagtcgtctatcacatgctagcgctgcccgtacgGATGGCCAAGGCCATCcgatcgctagctagcgccgcgcgtagcccgatcgagacatgctagcagttgtgctgatgtcgagatagctgtgatgcgatgctagcgccgcctagccgcctcgtgtaggctgg

浏览 0提问于2014-12-01得票数 2

回答已采纳

4回答

我怎样才能循环使用这本字典而不是硬编码键？

、、、、

到目前为止，我有以下代码(来自cs50 50/pset6 6/DNA)： import csv data_dict = {} with open(argv[1]) as data_file: reader = csv.DictReader(data_file) for record in reader: # `record` is a dictionary of column-name & value name = record["name"] data = { "AGAT

浏览 6提问于2020-07-11得票数 2

回答已采纳

1回答

在CS50x的DNA问题中运行Python代码需要太长时间。

、、、

我已经写了一个代码来解决CS50第6周的DNA问题。但是，当我在large.csv数据库和序列上运行它时，产生一个输出至少需要一分钟。在small.csv上，它立即产生一个输出。正因为如此，我无法通过check50。我认为问题在生成STR的最大重复序列的函数的阶段，但我不知道如何更有效地编写它。这个问题的全部描述如下：以下是数据库和序列的源文件：这是我的密码： import csv import sys def main(): # check a proper input if len(sys.argv) != 3: sys.exit("

浏览 0提问于2021-01-20得票数 0

回答已采纳

4回答

使用perl进行DNA分析的基本正则表达式和字符串操作

我是perl新手，我想对存储在rtf文件中的DNA序列执行一些我认为是基本的字符串操作。本质上，我的文件读取(文件为FASTA格式)： >LM1 AAGTCTGACGGAGCAACGCCGCGTGTATGAAGAAGGTTTTCGGATCGTAA AGTACTGTCCGTTAGAGAAGAACAAGGATAAGAGTAACTGCTTGTCCCTT GACGGTATCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGG TAATACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGCGCGC GCAGGCGGTCTTTTAAGTC

浏览 0提问于2013-03-05得票数 5

回答已采纳

1回答

Java在while循环中比较char值和set char值

、、、

我需要比较char值和设置char值'g‘'c’'a‘t’(小写和大写)，因为我只想输入这些值。我似乎无法在某些情况下完成输入验证工作。在下面的字符串中，f可以表示不是字符g、c、a、t的任何长度的字符串。字符串"fffffff“保持在循环中。字符串"fgf“保持循环。但是，我希望字符串"fffffg“或"gfg”退出循环，但它们没有这样做。这个练习的实际目的是让用户输入诸如g，c，a，t等核苷酸，并将它们转化为RNA的互补字符串。G是C的补充，反之亦然。A是U的补充(T被U代替)，反之亦然。因此，如果字符串是"gcat&

浏览 0提问于2015-01-14得票数 0

回答已采纳

1回答

DNA重叠匹配正则表达式

、、

我试图匹配的DNA序列，从开始或从一开始的3个字母的倍数，从ATG或CGA开始，然后是6,9,12,15，.字母以AGT结尾。下面的代码只得到一个匹配项(最长的一个)。我已经研究过“正面的看头”(例如?=)，但不知道如何将它成功地应用于这种情况。 dna=c("ABCATGABCGAAADFAGTAAAAGTAGTAAAGT") str_match_all(dna, "^(...)*((?:ATG|CGA)(?:...){2,}(?:AGT))") [[1]] [,1] [,2] [,3]

浏览 1提问于2021-03-02得票数 2

回答已采纳

1回答

我的DNA序列匹配程序输出错误

、、

因此，我正在制作一个程序，通过获取序列中最长的重复子字符串(CS50 pset6，DNA问题)，将DNA序列与“数据库”(CSV文件)中的特定人匹配。例如，字符串'AGAT‘应该以一个名为“”的特定序列返回，返回字符串的数量为3 (AGATAGATAGAT)。虽然我通过了前4个测试用例，但除了这几个测试用例外，我的输出中只有“No match”。我不知道我能改变什么让它起作用？我已经将我的问题缩小到了get_longest_repeating_substr函数或matching函数(这两者都可能是问题所在)。我正在使用的代码： # determine to whom a sequen

浏览 2提问于2021-05-07得票数 0

回答已采纳

1回答

算上不是。python中一个单词中的子字符串的

、、、

counter=0 i=0 dna_string = "CGATATATCCATAG" if dna_string[i:i+len("ATA")]=="ATA": counter=counter+1 print (counter) 0 我在试着数一数不。在dna_string中出现"ATA“时，这应该给出一个3的答案，但它给出了0 !！

浏览 0提问于2017-02-18得票数 0

3回答

JavaScript replaceAll使用变量而不是字符串进行不区分大小写的搜索

、、、

我想在不区分大小写的搜索中使用变量(而不是字符串)执行JavaScript replaceAll()，但同时保留匹配文本的大小写(在返回中)。例如, console.log('doc.p:', doc.p.toString().substring(0, 26)) var query = this.manager.store.get('q').value.toString(); console.log('query:', query, '| type:', typeof(query)) console.log(doc.p.toSt

浏览 52提问于2020-12-23得票数 1

回答已采纳

2回答

如何计算字符串中最大的连续子串发生量？

我正在做一个练习()，我必须对模拟DNA序列的特定连续子串(STRS)进行计数，我发现自己的代码太复杂了，我很难弄清楚如何继续下去。我有一个子串的列表： strs = ['AGATC', 'AATG', 'TATC'] 和一个随机字母序列的字符串： AAGGTAAGTTTAGAATATAAAAGGTGAGTTAAATAGAATAGGTTAAAATTAAAGGAGATCAGATCAGATCAGATCTATCTATCTATCTATCTATCAGAAAAGAGTAAATAGTTAAAGAGTAAGATATTGAATTAATGGAAAATATTGTTG

浏览 7提问于2021-08-04得票数 1

回答已采纳

2回答

Perl正则表达式解释

、、

我希望得到一些解释，我有以下脚本： open (FILE, '2.txt'); @DNA = <FILE>; $DNA = join ('', @DNA); print "DNA = ". $DNA . "\n"; $a=0; while ($DNA =~ //ig) {$a++;} print "Total characters = ".$a."\n"; $b=0; while ($DNA =~ /fl/ig) {$b++;} print "Total fl = "

浏览 1提问于2015-08-05得票数 1

2回答

在字符串数组中查找字符串模式

、、、、

我需要计算输入链中指定模式的出现次数，并为每个模式生成一个报告。输入字符串将包含1个AA AATTCGAA结尾，1表示要搜索的一个模式，AA是该模式，下一个是您要在其中搜索AA的部分。 My idea is to : public static void main(String[] args){ Scanner s = new Scanner(System.in); System.out.println("How many patterns do you want and enter patterns and DNA Sequence(ty

浏览 1提问于2014-01-21得票数 1

2回答

10个字符组的序列

、、、、

我正在做这项工作，我想知道如何一次以10个字符分组显示序列。下面是工作程序屏幕截图：我希望将输出框中的10个字符分组，例如： 1 CTCTAACGCG CAAGCGCATA TCCTTCTAGG 61 . 除空格和数字外，每行约有60个字符，因此必须有6个10个字符的组。下面是我为显示此输出而编写的代码： public void dispLines() { // Get the selected value of characters per line and assign it to noc variable String noc = numOfChar.

浏览 0提问于2013-04-06得票数 0

6回答

构造函数引发运行时异常

我有一个构造函数，它接受一个字符串作为参数。每当传入构造函数的字符串包含不是"A“、"C”、"G“或"T”的任何内容时，我都想抛出一个运行时异常。目前我的代码是这样的： public DNAStrandNovice(String strand) { passedStrand = strand; if (passedStrand.contains("a") || passedStrand.contains("c") || passedStrand.contains("g") |

浏览 0提问于2014-01-31得票数 0

1回答

如何在另一个是文件的字符串中搜索和统计字符串"CTG“？

、

如何从读取为字符串的文件中搜索字符串CTG？然后给出它出现的次数？例如，我如何在这里或任何地方添加代码来完成此操作： public String readStrFromFile(){ FileResource readFile = new FileResource(); String DNA = readFile.asString(); //System.out.println("DNA: " + DNA); return DNA; }//end readStrFromFile() method;

浏览 0提问于2015-12-29得票数 1

1回答

基于空间规则的匹配问题

、

我正试图从文本数据中提取一个短语。我目前正在使用基于SpaCy规则的匹配。在我看到"Hiv-1 dna定量“之前，这句话没有被发现。下面的代码显示了我使用的模式。 matcher = Matcher(nlp.vocab) pattern = [{'LOWER': 'hiv'}, {"IS_PUNCT": True}, {"TEXT": {"REGEX":"\d{1,2}"}}, {'LOWER': 'dna'}, {'

浏览 3提问于2021-07-01得票数 2

回答已采纳

4回答

python正则表达式索引长字符串并消除正则模式A和B之间的所有内容

、

下面这句话我想用‘(数字)/(.；数字)’来消除所有的东西：在所有生物中，从细菌到人类，DNA和染色质总是与结合蛋白联系在一起，而结合蛋白组织着它们的结构(1；2；3)。许多这些结构蛋白是分子桥梁，可以结合在两个或多个不同的DNA位点，形成循环。例如，细菌DNA是由类组蛋白H-NS环环而形成的，它有两个不同的DNA结合结构域(4)。在真核生物中，转录因子和RNA聚合酶的复合物能稳定增强子-启动子环(5；6；7；8)，而HP1 (9)、组蛋白H1 (10)和多梳-抑制子复合物PRC1 1/2 (11；12)则形成非活性染色质。蛋白质还与特定的DNA序列结合，形成较大的结构，如核仁和组蛋白位点

浏览 5提问于2017-03-30得票数 1

回答已采纳

1回答

cs50 Pset 6DNA-问题创建列表

、、

我有一个遍历文本的代码，并告诉我每个dna STR被发现的最大次数。要将这些值与CSV文件进行匹配，唯一缺少的步骤是将它们存储到列表中，但我无法做到这一点。当我运行代码时，每个STR序列的最大值都是独立打印的。我曾尝试将这些值“追加”到一个列表中，但没有成功，因此，我无法将其与CSV的dna序列(大或小)进行匹配。任何帮助或建议都是非常感谢的！这是我的代码，以及使用"text 1“和"small csv”得到的结果：` import cs50 import sys import csv import os if len(sys.argv) != 3: print(&

浏览 26提问于2021-03-24得票数 1

3回答

使用正则表达式查找和替换DNA序列，但只能每3个字符替换一次

、、

有没有可能使用正则表达式对dna字符串进行查找/替换，使得它一次只考虑3个字符(dna密码子)。例如，我希望正则表达式看到以下内容： dna="AAACCCTTTGGG“ 如下所示： AAA CCC TTT GGG 如果我现在使用正则表达式，而表达式是 Regex.Replace(dna，"ACC"，"AAA")它会找到一个匹配项，但在这种情况下，一次查看3个字符就不会有匹配项。这个是可能的吗？

浏览 2提问于2013-05-12得票数 2

3回答

for循环在csv文件中找不到值

、、

我正在尝试解决cs50课程中的dna问题，为了解决它，我做了一个小规模的版本，在这个版本中，我做了一个值，程序会在csv文件中搜索那个值，但由于某种原因，它找不到它。代码如下： import csv f = open("small.csv") csv_f = list(csv.reader(f)) length=len(csv_f) target=4 for a in range(length): for j in range(length): if csv_f[a][j]==target: print("found

浏览 9提问于2020-11-17得票数 0

3回答

如何使用awk将字符串从列中拆分

、、

我是Linux的菜鸟。我有这样的档案： col1 col2 col3 ID1234567-DNA_A01 chr1_10203040_T/C gene 0 ID1234568-DNA_A02 chr1_10203050_T/A gene 0 ID1234569-DNA_A03 chr1_10203060_A/G gene 0 ID1234570-DNA_A04 chr1_10203070_C/T gene 0 我只想使用第一列，并将每一行划分为4列： #CHROM POS

浏览 0提问于2021-03-09得票数 0

回答已采纳

2回答

如何根据.txt文件unix中现有列的值添加新列

、、、

我有一个像这样的.txt文件，其中包含六列。我希望根据列V8的值将第七列V7_Pheno添加到文件中，方法是将Yes编码为2，将No编码为1，将缺失的值编码为-9。 V1 V2 V3 V4 V6 V7_Pheno 2253792 20482 NA DNA 1 Yes 2253802 20491 NA DNA 4 Yes 2253816 20503 NA DNA 0 No 2253820 20508 NA DNA 4

浏览 4提问于2021-06-15得票数 1

回答已采纳

1回答

oci_parse在使用php变量时出现错误

、、

我正在尝试构建一个字符串，以便使用oci将数组传递到oracle。如果我写字符串，它可以正常工作，但是如果我把它作为一个变量传递，它就会产生一个错误。这样做很好： $c = oci_pconnect ( $config ['db'] ['username'], $config ['db'] ['password'], $config ['db'] ['hostspec'] ); try { $llamado = "DECLARE V_DNA_ARRAY M6_TEMP_

浏览 2提问于2013-08-11得票数 0

1回答

在python中替换< ref >和< /ref >之间的所有文本

、

我从维基百科上搜集了数据，并创建了一个数据文件。df \n \n == Sifat-sifat DNA == \n DNA merupakan sebuah polimer yang terdiri dari satuan-satuan berulang yang disebut nukleotida. Tiap-tiap nukleotida terdiri dari tiga komponen utama, yakni gugus fungsionalgugus fosfat, gula deoksiribosa, dan basa nitrogen (nukleobasa) &

浏览 6提问于2020-02-06得票数 0

回答已采纳

1回答

python迭代仅select字符串包含某些字符

、、

我想遍历kmer列表并选择只包含字符A、T、G和C的项目 kmers=["AL","AT","GC","AA","AP"] for kmer in kmers: for letter in kmer: if letter not in ["A","T","G","C"]: pass else: DNA_kmers.append(kmer)

浏览 0提问于2020-11-14得票数 2

2回答

如何将变量分离到3的数组中？

、、、

因此，这应该做的是，减去mouseenter/mouseleave函数，接受用户输入，将其分成一个数组，每个数组放置3个字母(例如。用户输入abcdef。会转到abc，def，.)。我在堆栈溢出()上看到了另一篇文章。但是，在下面的代码中，我不能很好地让它发挥作用。这是我的script.js： $(document).ready(function() { $('#button_translate').mouseenter(function() { $('#button_translate').fadeTo('fast',

浏览 1提问于2013-08-11得票数 1

回答已采纳

1回答

为组设置特定的颜色刻度

、

对于下面的数据，我想添加颜色，以便ID在p__Firmicutes中有一个红色的标度，ID在p__Bacteroidetes中有一个蓝色的刻度，ID在p__Proteobacteria中有一个绿色的标度。这是如何做到的呢？ ggplot(df,aes(variable,value, fill=ID)) + geom_bar(position = "fill", stat="identity") df <- dput(head(Metaphlan.species.m.top5,10)) structure(list(ID = c("

浏览 12提问于2022-04-21得票数 0

回答已采纳

1回答

规范化csv以插入到数据库中

、

我有一个csv，我将其转换为通用数组，然后，此数组I将插入到数据库中：所以，这是php代码： if (file_exists($csv)) { $file = fopen($csv, 'r'); // r flag is for readonly mode fgetcsv($file, 1000, ","); while (( $line = fgetcsv($file) ) !== false) { // if line exists $tryOne[] = $line; // add

浏览 2提问于2016-05-11得票数 1

1回答

R ggplot2连接点不是x轴，而是因子。

、、

我从纯素data.frame中提取了一个metaMDS，如下所示： MDS1 MDS2 time nucleic_acid habitat treatment 10dnawatercontrol 0.06297458 0.153364604 10 dna water control 10dnawatertreated -0.20010385 -0.241614081 10 dna water treated 11dnawatercontrol 0.15518683 0.067861388 1

浏览 0提问于2017-09-20得票数 0

回答已采纳

3回答

使用JQuery eq设置附加输入的值

我有一个表单，用户可以在其中附加额外的文本输入。这些文本输入是dna_segment_start[]和dna_segment_end[]。一旦在dna_segment_end[]的第一个输入中输入了一个值，我希望将该值设置为下一个dna_segment_start[]输入，以此类推(dna_segment_end => next dna_segment_start)。我看过如何使用，但不确定如何处理，比如： $('[name=dna_segment_end]').keyup(function(){ }); 在表格中，第一个字段如下所示： <tr id=&

浏览 0提问于2013-12-02得票数 0

回答已采纳

6回答

检查字符串中的每个字符是否属于给定的一组字符(JAVA)

因此，我需要创建一个方法isValidDNA，它的工作方式如下：公共布尔isValidDNA() 如果DNA是有效的，即只包含字母A、T、C、G(大写)和至少其中一个字符，则返回true。我所能想到的就是这个，显然行不通： public boolean isValidDNA(){ for (int i=0;i<dna.length();i++){ if (dna.charAt(i)=='A' || dna.charAt(i)=='T' || dna.charAt(i)=='C' || dna.ch

浏览 3提问于2013-02-28得票数 1

回答已采纳

1回答

在R中执行group_by函数时使用“shapiro_test”函数

、、

我以前问过这个问题，但没有运气，所以我再问一遍：我的数据： data.type <- c("DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA","DNA"

浏览 2提问于2022-05-06得票数 1

回答已采纳

1回答

REGEXP_SUBSTR SQL Server

、

With T as ( select 'Cytomegalovirus Nucleoside Analog DNA Polymerase Inhibitor [EPC],DNA Polymerase Inhibitors [MoA],Nucleoside Analog [Chemical/Ingredient],Nucleoside Analog Antiviral [EPC]' CLASS FROM DUAL ) 需要使用EPC拉线。所需输出： Cytomegalovirus Nucleoside Analog DNA Polymerase Inhibitor [EPC

浏览 2提问于2017-10-03得票数 0

3回答

如何在Ruby中找到两个字符串中相同子序列的索引？

、

在这里，类DNA的每个实例对应于一个字符串，如'GCCCAC'。可以从这些字符串构造包含Arrays的子字符串数组。对于这个字符串，有1-mers，2-mers，3-mers，4-mers，5-mers和一个6-mer： 6 1-市面汇率：["G", "C", "C", "C", "A", "C"] 5 2-市面汇率：["GC", "CC", "CC", "CA", "AC"] 4 3-市面汇

浏览 1提问于2019-11-03得票数 4

回答已采纳

1回答

如何在搜索DNA密码子时防止重叠

、、

我对此还很陌生。我在python中使用正则表达式，试图在推测的DNA序列中找到特定的密码子。目前代码可以工作，但不会注意到重叠(即，如果密码子前面的最后一个字母是A，后面的两个字母是A和C，它将找到一个并不真正存在的WRC密码子)。有没有办法让我修改一下？ import re while True: DNA = input("enter the DNA sequence:") print('WRC:') wrcpattern = re.compile(r'(A|T)(A|G)C') wrcmatches = wrc

浏览 16提问于2020-05-08得票数 0

2回答

如何根据regexp匹配分配类(perl中的排序)

、、

我正在从文件中读取。基于某一列中的值，我想为它分配我自己的类/标记。这些regexp： “‘LTR*”、“MLT*”、“MST*”...属于类HERV。 “查利*”，“循环*”...属于DNA类现在我有两个数组，一个有regexp，另一个有各自的类： my @array = map { qr{$_} } ('Alu*', 'HERV*', 'Charlie*' ... my @classes = ('Alu', 'HERV', 'DNA', 'LINE' ... 这样我就知道

浏览 0提问于2013-04-18得票数 0

回答已采纳

1回答

为什么(？：.)regex对re.match和re.findall的行为不同吗？

、、

我正在研究一个CS50问题，在这个问题上，你必须找到连续重复的字符串模式( DNA序列中的核苷酸)。我想我应该使用re，因为这是Python3的任务，我以前对它做了一些修改，并认为我可以解决它……但是没有。因此，我搜索了如何完成这一任务，并找到了一个主题，其中用户建议使用re.findall("(?:<pattern>)+", <string>)，这正是我需要解决的问题。因此，我对?:表达式产生了好奇，并查阅了文档，但无法理解non-capturing group的含义。当我发现使用一个由web地址组成的字符串的解释时，我又不得不四处寻找答案。在这

浏览 5提问于2021-09-30得票数 1

3回答

使用"SELECT DISTINCT“时如何保留附加键？

、、、

我希望保留sid，以及在查询中使用SELECT DISTINCT时链接表的cid对。signature、ip_src和ip_dst使它与众不同。我只希望输出还包括相应的sid和cid对。查询： SELECT DISTINCT signature, ip_src, ip_dst FROM (SELECT * FROM event INNER JOIN sensor ON (sensor.sid = event.sid) INNER JOIN iphdr ON (iphdr.cid = event.cid) AND (ip

浏览 5提问于2014-11-15得票数 0

回答已采纳