首页
学习
活动
专区
工具
TVP
发布

生信了

专栏作者
117
文章
132118
阅读量
43
订阅数
bloom filter 简介
Bloom Filter 是一种有效的数据结构,可使用少量内存,在大量元素列表中进行快速查找。
一只羊
2022-11-30
5890
R记录 - 最近在学习写一个R包
因为课题需要,最近需要实现一个数据可视化的功能。因为ggplot2提供了扩展接口,所以就想着基于ggplot2实现这个功能。看了一些文档之后(见文末),就开始动手实现了。
一只羊
2022-08-30
2110
浅谈python中的多线程和多进程(二)
前文《浅谈python中的多线程和多进程》中我们分享过一个例子,就是分别利用python中的多线程和多进程来解决高运算量的任务,从中看出二者的一些区别。其中一点是“多线程会共享所属进程的内存资源;而子进程会从父进程那里拷贝一份内存资源”。当时没有进一步解释,为了更直观地了解这一点,本文给出一个例子。
一只羊
2020-06-04
6950
浅谈python中的多线程和多进程
我们在进行生信分析时经常要处理大文件,如果用串行运算往往费时,所以需要并行运算以节省时间。目前,流行的生信工具通常都可以并行运算,比如bwa。通常来讲,我们进行并行运算可以选择多线程或者多进程。那么二者有什么差别呢,我们又该如何选择呢?
一只羊
2020-04-07
7640
生信(十)利用kseq.h和regex.h实现类似grep查找fastq reads功能的示例(C语言)
做生信的朋友应该都很熟悉类Unix系统中的grep命令,该命令可以快速查找并输出包含目标字符串的行。在对fastq文件进行处理时,我们有时候需要查找包含特定字符串的reads。因为一个reads包含了多行,所以grep命令不能完全适用。那有没有其它命令或者工具可以实现快速简便地实现上述查找特定reads的功能呢?就像grep快速查找行一样。
一只羊
2020-02-18
9750
序列比对(27)BWT算法
bwa是目前最流行的二代测序比对工具,其中就用到了BWT算法。BWT(Burrows-Wheeler Transform)算法是一种数据转换算法,它将一个字符串中的相似字符放在相邻的位置,以便于后续的压缩。
一只羊
2019-10-24
2.2K0
R-概率统计与模拟(二)
前文《R-概率统计与模拟》介绍了一些用 R 进行概率模拟的实验,本文继续上次的工作,并在此过程中回顾一些相关的概率统计知识。
一只羊
2019-10-11
7650
序列比对(26)精准匹配之KMP算法、Trie树以及AC自动机
之前的序列比对文章大都在利用动态规划算法解决字符串的非精准匹配(允许错配、插入和缺失),比如全局比对和局部比对问题。当然,后来我们还介绍了模序发现和中间字符串问题,并初次学习了如何用分支定界法解决这一类问题。
一只羊
2019-09-27
9380
序列比对(18)重复匹配问题的补充说明
前文《序列匹配(五)——重复匹配问题的动态规划算法》介绍了重复匹配问题的动态规划算法。
一只羊
2019-09-24
6850
序列比对(24)最长公共子序列
前文《序列比对(23)最长公共子字符串》介绍了如何求解两个字符串的最长公共子字符串,本文将介绍如何求解两个字符串的最长公共子序列。二者听起来很像,所以我们首先得说明一下子字符串和子序列的区别。
一只羊
2019-09-17
5240
序列比对(23)最长公共子字符串
其实这个问题可以放在序列比对专题的最开始,只是笔者是个新手,所以当初只是照《生物序列分析》教材的进度写的,教材是直接从全局比对开始讲的。Anyway,我们在本文介绍也不迟。
一只羊
2019-09-17
5210
序列比对(25)编辑距离
编辑距离的求解过程和全局比对是十分相似的(关于全局比对,可以参见前文《序列比对(一)全局比对Needleman-Wunsch算法》),都需要全部符号参与比对,都允许插入、缺失和错配。所以,编辑距离可以用动态规划算法求解,其迭代公式是:
一只羊
2019-09-17
1.3K0
R bubble matrix
又是一个好久不见,朋友们你们最近还好吗!最近小仙同学刚经历了人生中的一个重要的里程碑——延毕。在预料之中、又如期而至的两个字,小仙心里也是很复杂,可终究跟“毕业”二字沾了边,就当它是好事啦!
一只羊
2019-09-05
8740
序列比对(22)中间字符串分支定界方法中更紧的界
前文《序列比对(21)中间字符串问题的算法及实现代码》介绍了中间字符串的算法和代码,但是使用分支定界策略时所使用的界限是很宽松的。分支定界法的伪代码如下:
一只羊
2019-09-05
9910
序列比对(21)中间字符串问题的算法及实现代码
《序列比对(20)基序发现问题的算法及实现代码》给出了基序问题的算法和实现代码。本文将介绍中间字符串问题的算法,并给出实现代码。
一只羊
2019-08-29
8950
序列比对(20)基序发现问题的算法及实现代码
由于要遍历所有可能的起始位点,所以一种自然的想法是使用递归。但是为了配合后续的分支定界法,我们采用了树结构,并且进行DFS(深度优先搜索)。既然采用树结构,最简单的算法如下(伪代码):
一只羊
2019-08-29
7620
序列比对(19)基序发现和中间字符串问题
我们知道,DNA调控元件往往是一段相似的DNA序列。理想情况下这些序列完全一致,比如下面这样:
一只羊
2019-08-21
6140
序列比对(17)第二部分的小结
HMM模型最关键的一点就是在一个状态序列中,某一步状态的概率只与上一步的状态有关。也正是因为与前面一步状态有关,所以HMM模型天然地适用动态规划算法。
一只羊
2019-08-19
6030
序列比对(16)Baum-Welch算法估算HMM参数
前文《序列比对(15)EM算法以及Baum-Welch算法的推导》介绍了EM算法和Baum-Welch算法的推导过程。Baum-Welch算法是EM算法的一个特例,用来估算HMM模型中的概率参数。其具体步骤如下:
一只羊
2019-07-30
1.1K0
R——相关关系热图
如果想进一步改变图形效果,可以参考pheatmap函数的用法,修改相应的参数。比如:聚类方式改为complete,加上标题等。
一只羊
2019-07-30
2.6K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档