字符串匹配算法DNA序列比对 - 腾讯云开发者社区

、、、、

背景：维基百科页面上说，DNA序列比对算法也可以用于自然语言处理。如果我以上的假设是有意义的

浏览 0提问于2015-12-18得票数 0

1回答

计算两序列相似性的复杂性

、、、

计算两个序列之间相似性的最著名算法的计算复杂度是多少(如DNA或蛋白质比对/近似字符串匹配)？这种相似性是基于：编辑:在假定参考数据集的预处理/索引的前提下，考虑应用进行近似匹配。

浏览 1提问于2013-02-09得票数 3

1回答

我有一个8个碱基的字符串testStr我想把它与绿色的8个碱基字符串greenList的列表进行比较。下面是一个可接受的匹配，因为序列只在一个位置不同。例如，序列GGCGCATG产生以下hamming距离1的变化。GGCGTATG GGCGTATG GGCGTATG GGCGTATG GGCGTATG GGCGTATG GGCGCCTC GGCGCGTG GGCGCGTG 如果上述任何序列与"testStr“直接匹配但一定有更好的方法.我也

浏览 7提问于2020-12-11得票数 0

回答已采纳

1回答

Grover算法在机器学习中的应用

、

我正在尝试了解grover算法的应用。我已经看到它可以应用于DNA序列比对。我想知道在机器学习(深度学习，NLP和强化学习)中，我可以在哪里使用grover算法。

浏览 33提问于2021-01-31得票数 1

4回答

如何在R中执行基本的多序列比对？

、、、、

(我试过在上问这个问题，但文本挖掘的人可能会认为有更好的解决方案，所以我也在这里转发这篇文章)我没有一个基本的模式可以匹配。我所知道的是，"True“模式的长度应该是"30”，并且我的序列在随机点上引入了缺失值。

浏览 2提问于2010-12-21得票数 9

回答已采纳

1回答

如何解决优化问题

、

我有两个不同的序列，并希望从中提取相似的模式。我怎么能这么做？这个问题叫什么？

浏览 0提问于2016-03-01得票数 1

回答已采纳

1回答

如何评估成对比对中的评分方案

、、、

我想用全局比对的方法对两个核苷酸序列进行比对。每个序列是{A，C，T，G}个字母的组合。我的问题是如何根据我的数据集估计(匹配，不匹配和差距)的惩罚。有没有什么统计模型可以帮上忙？

浏览 0提问于2015-11-23得票数 0

3回答

如何从格式化的字符串中找到字符串模板？

、、

假设我有一个字符串模板，例如，现在我通过格式化这个字符串来创建两个(或更多)字符串，即，=>"This is a 2020-06-05 16:06:30" 现在我不知何故丢失了原来的字符串有没有办法使用我现在拥有的

浏览 0提问于2020-06-05得票数 5

1回答

如何在biopython中使用fasta文件而不是蛋白质序列字符串创建多个序列比对

、、、、

我希望能够使用我在与脚本相同的目录中下载的文件来编写多个序列比对。然而，在Biopython Cookbook中，显示这一点的唯一方式是通过写出字符串而不是加载文件。我希望能够做到后者。下面是在中进行多序列比对的方法from Bio.SeqRecord import SeqRecord

浏览 31提问于2019-12-01得票数 0

1回答

有没有一个R函数可以返回比对过的DNA序列的比对分数？

、、

我想提取两个字符串(DNA序列)并生成比对分数。我找到了解密包，但它只允许我生成比对，而不是比对分数。我也试过使用“生物字符串”，但我无法生成分数。谢谢你的帮忙!

浏览 9提问于2019-08-30得票数 0

回答已采纳

5回答

关于字符串算法的书籍

、

有许多关于字符串算法的帖子：有人能推荐一本能深入探讨各种字符串算法的书吗？特别感兴趣的话题是近似字符串匹配，比如google提供的修正搜索字符串变体:)。非常感谢你的建议。

浏览 5提问于2010-05-11得票数 8

回答已采纳

1回答

快速查找允许不匹配的子字符串的方法

、、、

;AEA//BFFFF/BB/////;/..:.9999.；我现在要做的是遍历这些线，检查第一个字母和最后一个字母是否是DNA序列(A/C/G/T或N)的允许字符，然后对我感兴趣的编码序列的两侧的两个引物序列进行模糊搜索当我搜索精确的匹配时，我在合理的时间框架内得到可用的数据。然而，我知道我错过了很多数据，这些数据因为引物序列中的一个错误匹配

浏览 2提问于2018-06-16得票数 2

回答已采纳

1回答

在python中实现Smith-Waterman局部比对算法

、、、

我已经创建了一个序列比对工具来比较两条DNA链(X和Y)，以找到X和Y中子字符串的最佳比对。算法总结如下()。我已经能够生成一个列表列表，用零填充它们来表示我的矩阵。我创建了一个评分算法，为每种碱基之间的比对返回一个数字分数(例如，匹配时加4)。然后我创建了一个对齐算法，它应该在我的“矩阵”的每个坐标上都有一个分数。

浏览 52提问于2021-02-26得票数 0

回答已采纳

1回答

Needleman wunsch算法

、

我目前正在构建一个应用程序，它可以解码DNA序列并输出RNA和蛋白质序列。我正在尝试扩展它，以便能够基于needleman wunsch算法对两个蛋白质序列进行比对；但不幸的是，在"Visual Basic“中无法做到这一点。

浏览 1提问于2012-10-01得票数 0

4回答

如何计算文本字符串的多序列比对

、、、、

我正在写一个程序，它必须计算一组字符串集的。我正在考虑用Python来做这件事，但如果更实用的话，我可以使用外部软件或其他语言。数据不是特别大，我没有很强的性能要求，我可以容忍近似(即。唯一的问题是字符串是常规字符串(即，UTF-8字符串(可能包含应被视为常规字符的换行符)；它们不是DNA序列或蛋白质序列。我可以找到大量的工具和信息，用于生物信息学中的常见情况，具有特定的复杂文件格式和许多我不需要的功能，但出人意料地很难找到用于简单字符串情况的软件、库

浏览 1提问于2011-04-28得票数 22

回答已采纳

6回答

确定两个初级股的匹配与非匹配的比率？

、、

可能重复： A T C G T A CT A C G A A C任何帮助都将不胜感激。谢谢。

浏览 7提问于2012-08-14得票数 0

1回答

如何从BioAlignments.jl对齐中检索对齐区域的序列索引？

、

我想访问从BioAlignments.jl中的Julia pairalign函数返回的比对数据的索引，以了解在原始序列的上下文中比对发生在哪里。AffineGapScoreModel(EDNAFULL, gap_open=-5, gap_extend=-1); my_alignment = pairalign(LocalAlignment(),dna"ATATTAGGTATTGATTATTGTACGCGGCCCGGC" , dna"TTGATTATTGT", sco

浏览 12提问于2020-09-21得票数 2

回答已采纳

2回答

填充字符串数组时出现问题

、、、

我的程序是DNA序列比对。它通过搜索在所有序列中顺序相同的一系列字符来比较两个DNA序列。这只是一个例子，这两个DNA字符串可以是我从一个单独的文件中派生的任何大小，但我已经得到了所有的大小。我只需要你帮我把它放进矩阵。所以一开始我想做一个2D字符数组，但后来我切换到了2D字符串数组，因为我的DNA序列

浏览 0提问于2019-07-10得票数 0

3回答

在python中比对DNA序列

、、

我有数以千计的DNA序列，范围在100到5000 bp之间，我需要对指定对进行比对并计算身份得分。Biopython pairwise2做得很好，但只适用于短序列，当序列大小超过2kb时，即使使用了'score_only‘和'one_alignment_only’选项，它也会显示严重的内存泄漏，从而导致whole_coding_scores={}for genes in whole_coding: # whole coding is

浏览 1提问于2015-11-10得票数 4

3回答

原生Python (非生物Python)中的DNA序列比对

、、、

我从454次新一代测序中获得了100,000个DNA序列(多达20亿个)。我想修剪末端，以便去除两端可能存在的引物，无论是正常序列还是有义序列。因此，我的目标是找到引物，剪切序列，只留下没有引物的部分。为此，我想使用一个经典的比对算法(即: Smith-Waterman)，该算法已在原生Python中实现(即:不通过biopython实现)。注意:这不是一个直接的“单词”搜索，因为DNA在序列和引物中都可以由于各种技

浏览 4提问于2010-03-11得票数 1

回答已采纳

点击加载更多