前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >序列比对(19)基序发现和中间字符串问题

序列比对(19)基序发现和中间字符串问题

作者头像
一只羊
发布2019-08-21 17:59:36
6190
发布2019-08-21 17:59:36
举报
文章被收录于专栏:生信了生信了

本文介绍了基序发现问题和中间字符串问题。

引言:DNA调控元件

我们知道,DNA调控元件往往是一段相似的DNA序列。理想情况下这些序列完全一致,比如下面这样:

图片引自《生物信息学算法导论》

但实际上,这些序列不会完全一样,总会有若干位点发生“变异”,从而不同,比如下面这样:

图片引自《生物信息学算法导论》

如果给定一组DNA序列(暂且假定它们长度相等),那么如何找出这些相似的序列呢?由此可以引出两个问题,即基序发现问题和中间字符串问题。

一、基序发现问题

要说明基序是什么,首先介绍一下序列剖面(Profile)。

图片引自《生物信息学算法导论》

接下来我们给出一系列符号定义,以便下文的讨论:

二、中间字符串问题

同样地,要讲清楚中间字符串问题,我们首先给出一些符号:

三、两个问题是等价的

我们可以证明计算式子(1.2)和计算(2.2)是一回事。 首先,根据第一部分的定义,式(1.2)其实就是:

小结

本文内容基于《生物信息学算法导论》,笔者所作的工作就是将算法推导过程补充详细。至于实现代码,我们会在后续文章中讨论。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信了 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 引言:DNA调控元件
  • 一、基序发现问题
  • 二、中间字符串问题
  • 三、两个问题是等价的
  • 小结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档