overlap,即对bam文件中每条reads,在基因注释文件gtf中查找与之相交的基因,再进行其他处理;一般对gtf文件构建线段树,线段树的具体实现 二叉搜索树 VS 红黑树,由于二叉搜索树是非平衡的...10的ACGT序列可以编码成int32,只要4个字节,而使用string来存储至少需要32字节
示例3: 计算一组数的中值,即50分位点的数值,可采用以下三种方式
vector + sort() 使用数组存储数据...如固态硬盘替换机械硬盘,百兆光纤升级为千兆,采购更高主频和核数的CPU等
GPU/TPU/FPGA/ASIC. 假如CPU能力已经达到饱和,可以考虑使用硬件加速
代码调整
调整判断次序....如在数组中查找某个值,则每次循环都需要检查数组是否越界,那么在数组末尾添加想要查找的值,则无需判断越界问题,因为肯定会返回,当然最后需要对结果所在的索引位置进行额外的判断
削减强度....C++对应的低级语言就是汇编,python对应的就是C了
理解现代处理器,利用指令级并行.