即interval tree,使用区间树是为了高效查询,为了达到最佳性能,一般使用基于红黑树的区间树实现,因为红黑树是平衡树,查找时间复杂度O(lgN),不会出现退化成链表的最坏情况
查找区间并注释....List>中,这样就将每条gene的数据分类好了
geneBuilder 是个iter>,迭代时,对每个gene将其数据List 按gene_version...list中第一条GTFRecord的信息初始化GeneFromGTF(因为第一条的类型永远是gene),只有start end属性是取得list中所有数据的最小start,最大end
进行一致性检查....检查list中所有数据,如正反链必须都一致,chr一致等,否则抛出异常
将所有的非gene数据进行统计处理,更新GeneFromGTF成员变量Map...LocusFunction
将所有alignmentBlocks的LocusFunctions合并为一个LocusFunction
每次合并都是取最大的LocusFunction,其是一个枚举变量,由小到大为