00:01
嗯,好,时间到了啊,我们来讲我们的第24课啊,关于这个细胞运行网络的问题。其实医生细胞网络呀,在文章中运用啊,并不多。哎,它本质上啊,本质上是一种细胞打分的方式。它只是借鉴了基因打分的一种方法啊,运用到了这个细胞的层面上。哦,关于打分的前,呃,去年讲过一课,不过那节课讲的不是很深。关于今天啊,我们要关于这节课呀,我们首先要对关于了解,了解到关于这个打分的一种方式了。嗯,大家应该经常打分吧,打的分也还挺多吧,单细胞空间都打分啊,包括大家拿到的这个。呃,公司的这个标准化的结果啊,有那个负极分析也属于打分。哎,其实就是打分啊,打分儿。
01:02
打分的方式啊,有很多种啊,不知道大家尝试过多少种,是不是简简单单的认为公司给到的那种,哎,复习结果就是。正确的呢,不知道大家有没有质疑过这个,质疑过这个问题啊。首先呢,我们拿到这个,哎,无论是我们的什么吧。每个数据库来源的都是这样一个基因,基因基因列表。就像大家的go啊,K egg啊等等等等,都是一个基因库的一个来源,对吧,然后呢,依据我们的这个。表达矩阵。呃,依据我们的表达矩阵,最后呢,通过各种各样的方式来打分,数据库来源呢,主要是可以go k gg以及这个啊,MYCDB这个数据库啊,当然还有一些像po啊等等一些数据啊,一些数据库。打分的方式呢,有很多种,哎,从基因打分的层面上来讲,哎,主要是4种。呃,其中最开始提到的是这个过表达,过表达模式,哎,过表达模式也是大家拿到这个公司结果标准化结果的那个模式。
02:07
这个模式呢,是信息最全,但是是假阳性率最高的一种模式。哎,前面在讲这个mia的时候,哎也提到过,说打分啊,它的本质上一一般的本质上啊,运用的是超几何检验和超几何分布。啊,那么普通的像这种负极分析呢,啊,像那个大家常见的那个class profile呢,也是这样一个,哎,原理。超几何分析的一个原理,把它进行负极分析,但是呢,它本身有很大的一个缺陷。像高级一点的方式呢,用到这个打分就是功能分类打分。功能分类打分呢,它哎,最常见的是什么呢。大家经常用的什么GS sea JS va打分,哎,就属于这一类的。
03:00
它会考虑什么?表达量的一个差异啊,不像这个ora过表达呢,只考虑基因的列表,而不考虑表达量的权重,嗯,通常的FCS呢,会考虑表达量的一个权重的问题。所以这个分析方法在。哎,多个层面啊,包括这个单细胞和空间的分析上啊,都受到了一定的这个。哎,迭代更新认为这种打分方式啊是更为合理和准确的。第三种方式呢,这个我估计大家都没怎么见过啊,这个主要运用在这个。空间量比较多啊,空间量比较多,嗯,就是基于拓扑结构。基因大家都知道,绝对不是独立存在的,有上下游关系啊,甚至有甚至有的基因啊,还是存在这多个通这种水平对吧。那么如果我们简简单单的把这个基因啊,只当成一个符号啊,用来打分的话,就像前两种一样。哎,打出来的时候啊,可能有的时候会发现一些结果和实验结果是对冲的,哎,不吻合的。
04:02
所以说呢,在分析的,哎,现在随着现在分析的越来越深入啊,更多的要强调什么。关于这个拓扑学结构,也就是这个上下游关系,大家都知道一个基因的一个通络。对吧。啊,不可能都是平级关系,哎,有的处于上游,有的处于下游,有的处于哎更下游,有的处于末端等等,就和这样的一个观念一样。就和这样的一个观念一样。基因基因一里面,哎包含了很多基因,但是它在整个的流向的过程中啊,从第一个基因慢慢往下流,哎,流到最后的时候,它的一个过程中其实是存在哎多条线的。那么对于那么借鉴于这个真实的一个基因的一个流向的问题呢?哎,提出了这个库补写打分的这样一种模式。哎,这种模式呢,更加接近我们的生物学意义。哎,更加接近我们的生物学意义,因为我们的基因,毕竟它有这么上下游的关系,并不能把它当成一个评级来看待啊。
05:05
而且大家要注意啊。基于通路拓扑学,哎,结构的话,哎,这个基因越往上游。哎,它的连通性越好,诶它的全重性越高,知道吧,比如说这个基因集,哎与我这个示意图基因集1和2这样一个,哎影响的TF不同,但是它整体上存在一定的联系。对吧。像这种,哎,这个蓝色线,这个蓝色的,呃,这个绿色的这个哎,它的线条是这样留的。哎,这个呢。又成了这样一种流失,哎,流的分,呃流这个这个流向。大家可以看到起点都是这个绿点。起点都是这个绿点,但是流向却流到了两个方向,也就是说这个基因是两个基因集共享的。啊,两个基因集共享的,那么在我们在分析这种生物学结构的时候,就要对它进行一个权重分析,包括它的一个结构的一个分析啊。
06:03
啊,这种的就相对比较复杂了,涉及到我们的这个。啊,很深的一个通路概念了啊。最后一个呢,就是哎拓扑学结构了,这个就和哎,大家可以看到哎和。哎,和距离有关了啊,路径。大家我们在讲这个comment的时候,Comment讲过一个叫。呃,那个关于这个common的,就是我们空间信号流流向的时候采用了一种策略。叫这个最优传输策略,哎,类似于我们现实时的,现实的这个生活中的物流,选择一条线作为它的一个最佳路线,哎,往期运快递,那么对于我们的这个空间来讲啊。哎,也是一样的,拿到这样一个,哎,空间距离,包括基因表达的一个信息之后啊。哎,对于它的一个拓扑学结构啊。尤其是这种网络型的拓扑学结构,哎,就非常的复杂了啊,复杂的复杂。
07:05
哎,这就是4种打,呃,4种这个打分的方式。前两种呢,是常见的单细胞打分,呃,也是运用的最多的,运用的最多的。第3种呢,是基于通学打分,这个在研究蛋,呃,研。这个主要是研究什么呢?研究这个蛋白结构以及它的一个完整的生物链条的时候,会有这样一个运用啊,不过这个大家接触的也很很也很,应该很少啊。这种呢,基于网络空间网络同步的这种状态。哎,和空间有关啊,和空间有关。然后呢,基于这种,呃,哪种打分方式,4种选择一种。哎,通过基因打分的方式呢,最后我们得到我们复习的结果啊。这4种方式啊,大家如果排排序,哎排排序,大家知道哪种更最好吗?如果是单细胞的话,当然这个FCS好于这个OA,对吧。
08:00
那如果空间呢?空间的打分方式是要考虑领域以及它的一个空间距离关系的。哎,对淋浴要有一定的权重啊,这样的时候在打分的时候啊,它更能体现它,哎,真实的一个通的一个状态。啊,至于上下游打分的话,这个我们用的很少啊。嗯,在。单细胞空间研究中很少应用到这个基因上下游关系导致的打分模式啊。不过偶尔在这个。哎,其他组学会用到啊,大家将来如果接触的多,组学接触的多了以后呢。哎,尤其是还一些大颗粒组,它可能不仅仅只做单细胞空间转录组,可能会涉及到基因组,哎,可能会涉及到这个微生物等等内种,这个时候通路的错误结构。就非常重要了,基因它是先影响细胞呢,还是先影响这个微生物呢,等等这种就比较重要了啊。哎,右边是呢,对负极分析简单的一个内容的定义啊,本质上就是对数据的分布检验,哎,如果集中分布在某个区域,就认为是负极,这个很简单。
09:07
哎,这打分的模式大家看有多少种,一般有4种。转录组是我们接触到最简单的打分模式啊,差异基因表达级,呃,差异基因基因级,这是最简单的模式,而基因组呢?啊,它也有这种打分的方式啊,只不过这种打分的方式会比我们这个转录组要复杂的多一点,呃,复杂一点。哎,再加上后面有什么基因家族啊,贡献性表达等等等等,哎,关于复极打分其实也是很深的学问啊,我们停留在这个转录组层面的时候,其实这种打分是一种。啊,最简单的打分模式啊。包括大家经常会看到某些,呃,某些这个公司啊,他在发文章挖掘这个公共数据库的时候,一般都是挖掘转入。啊,大家有听过说挖掘基因组,挖掘微生物组的吗?很少啊,几乎没有,就在于它的所有算法和逻辑啊,我们的转录组是不一样的。
10:05
我们首先来看第一个关于过表达分析的一个模式,呃,过表达分析呢,其实就是前面提到的用的class profile, 用的那个超几何检验差不多啊,首先呢,我们要输入一个什么。感兴趣的基因集,对吧?其实目的是为了在这组基因中发现具有明显统计学意义上负极的功能基因集。哎,也就是说我们提供的基因极,比如说机油通路,KG极通路,它是否在我们的表达矩阵中啊,有显著的负极,这个时候呢。嗯,这个时候呢,有两步需要大家注意,第一步是什么?给定基因基,这个基因列表有很多,呃,比如说GU啊,K egg啊啊,包括G,呃,GSEA啊等等,它都有自带的基因机,第2个呢。第二个实际上就是大家做的那个差异基因列表。比如说以单细胞为例,Class的1,它做了差异基因之后,得到了一堆差异基因列表,得到了它的log杆FC,得到了它的PY6,这些值大家通过一定的阈值把它过滤之后。
11:09
哎,过滤后的这个差异金。就是我们带测功能级了。哎,通过两者之间的一个超级和分布检验它是否哎,显著负极道模型通路。显著的方式也很简单,是否高于随机啊,是否高于随机,这个在这个讲CF分DB它的一个。啊,做配受体检,假设检验的时候用到的和这个差不多,也是一种超级核检验,哎,如果显著的集中在某一个区特定的区域,而不是随机散在分布的话,那说明那说明什么?哎,说明它具有显著负极的一个效果啊,不过这个时候大家要注意啊。大家有没有感觉到它的一个很明显的一个缺点是什么?第一个就是基因列表,它只对基因列表有作用。哎,只对基因列表有作用,那这个时候呢,就会产生一个问题。
12:01
呃,医嘱基因列表里面,它不可能每个基因的权重都是一样的。啊,尤其是有的基因表达高,有的基因表达低,如果表达高低都把它拉到同一水平线上的话。哎,它的假阳性率会非常的高啊,非常的高,这也是为什么在文章中很少有这种超几何呀,Class profile打分的一个原因啊,随着大家越来越的哎,认识的越来越深入,这种方式虽然很全面,但是假阳这里比较高啊,下面呢,列了它的一个优缺点啊。第一个就是在,哎,对他的表达信息其实是不考虑的,所以说在这个超几何检验的时候啊。尤其是大家在拿到这个公司的结果的时候,也会经常会发现一些。嗯,很让人疑惑的结果,比如说有的它既能就是它的上调基因能复集到某些通路,下调基因却也能复集到相同的通,哎,这个时候就会产生一些矛盾的结果。不过公司一般只给大家阳性基因,就是上调基因的一个通络腹肌的一个现象。
13:04
而且这个时候要注意细胞类型之间的一个负极啊。哎,只有可能来辅助我们识别细胞类型。我们真正做的差异分析更多的是什么?哎,不同条件间相同细胞类型的一个反应。比如说正常和疾病,呃,疾病主T细胞的反应相对于正常,诶,发生了怎样的一个表达上的一个变化,这是在单细胞或者空间水平上应该做的一个差异分析啊。哎,第一个就是说表达水平他不考虑,第二个就是忽略了通路内部生物学意义。这个通路内部生物学义就和这个有,这和这个有关系了,拓扑学结构有关系了,基因的上下游。啊,我们在做这个普通的这个负极分析,是不考虑上下游的。啊,只把它这一堆基因都把它当成一个通路,哎,反正复集到了就是,呃,就是这个阳性结果从来不说,哎,内部通路有上调下调这样一个关系,先有了1才有了2,不会考虑这个的。
14:02
哎,所以说基因间的复杂的相互作用关系也是不考虑的。第三个就是说,哎,阈值拿到这个单细胞的一个差异分析结果,不知道大家拿到这个阈值有没有。哎,认真考虑过,我们拿到单细胞的差异基因或者空间的这个。茶已经有哪几个阈值?哎,有平均值。有这个贝比LOGO2FC。还有什么?哎,PY6还有什么p adjust还有什么?它的表达的比例PCT1和剩余细胞的表达比例PCT2,也就是说这六个指标啊,相互之间辅助印证。哎,想要拿到一定的,哎,真阳性的一个差异的基因列表,需要把这几个因素啊,都要考虑进来,哎,都要考虑进来。哎,但是我们通常在公司拿到的时候只会拿这个。P啊,Adjust作为一个,哎,唯一的一个核心值,唯一的一个哎预值,唯一的一个过滤的一个阈值,那这个时候呢,就会产生很多的问题。
15:07
比如说一个基因,它的PCT1,哎是99%吧,PCT2是百分之,哎也是99,那这个时候它的表达上,其就是说在分布上其实是没有什么差异的。对吧,没有什么差异,大家都表达,只是表达你可能高了一点点。然后呢?哎,显著性可能就提上来了,哎,显著性就成小于0.05了,就把它提出来了,这个时候呢,拿这些基因做做这个负极分析,其实是没有意义的。明白吧?还有什么呢,就像那个平均值也是一样。比如说呃,一个基因的平均值是0.1,呃,另外呃,另一组的该基因的平均值是0.01。值表达都非常低对吧,都是0.1以下了,这些值都表达的非常低了,但是它的倍比是多少呢。
16:01
啊,就是10倍。那这种情况下会明显的放大这种假阳性的结果,导致我们的的结果啊,很多都呈现出一种。嗯,不太可信的一个状态啊。所以在拿到差异基因的同时呢,我们会有多个职工指标来判断啊,不能简简单单的依靠。不能简简单单的依靠这个p PL just.哎,正是因为在OA过表达分析上这些多种多样的一个。呃,缺陷吧,所以才开发了后面这几种分析方法。哎,这就是我们大家通常拿到的这个差异及哎结果的一个。哎,计算原理。啊,超几何分布和超几何检验呢,前面讲到过了,大家简单回溯一下,就是和抽球有关,就是抽球游戏。哎,不放回的抽球一定游戏看到它的分布,然后呢,如果说我们真正的是随机抽取的话,哎,它的一个,哎,目标球的分布呢,是哎随机分布的。
17:05
但如果说,哎,我们在计算生物学意义的时候,目标球显著负极在某个状态,比如说显著的高或显著的低,它不是一种随机的现象。那么哎,就是生物学特有的一个功能,而不是随机的一个现随机的分布了。常见的包就是class profile, 不知道大家这个包掌握了没有,哎,它是这个一个生性大牛歪书写的啊。哎,我说。嗯,就是。哎,不知道大家有没有听过这个人的名字啊,在生信圈很有名啊。然后呢,右边这个图就是简简单单一个示意图啊,简简单的一个示意图,哎,超几何分布两个球是吧?两呃黄球中抽,就是说抽球游戏,哎,这里面有黄球1000多个,哎,目标球265个,不停不放回的抽,看看它的一个显著负极的一个状态是什么?
18:03
哎,这就是超级核分布了,超级核分布包括这个ORA了。嗯,提醒大家一句,公司一般采用的是ora。啊,公司一般采用的是O。嗯,OA它的好处就在于,哎,信息很全面。坏处就在于。所有生物学,哎,所有生物学的解释都没有考虑啊,仅仅考虑这个基因的一个列表表达值啦,上下游啦。根本不考虑啊,空间位置那就更不考虑了啊。第二种方式呢,是这个。哎,功能分类打分的这种方式,功能分类打分的一个方式呢,相对于OA,哎,它做了一定的改变,就像这个图一样,它做了一定的改变。前面提到了他这个OI有3种,有有3个缺陷,其实每个方法改变了,呃,都解决了他的一个缺陷,像这种功能复习打分就哎,解决了他的第一个缺陷就在于他不考虑基因表达值。
19:02
而我们,哎。哎,最新的,包括大家常用的一些方法呢,现在要考虑这个基因表达值了,最常见的就是这个GS sea.对吧,JS sea, 哎,Gsa隶属于这个功能分类打分,哎这个范畴啊。关于这个功能分类打分啊,它的计算步骤啊,我给大家列在这儿啊,大家可以简单看一下,第一个就是要计算哎,基因表达水平的统计值,说白了它要考虑基因值。哎,考虑基因值,每个软件考虑的这个基因值啊。不太一样。不太一样,有的考虑方差,哎,有的考虑这个是否显著T检验,有的要进行this高均匀化,哎,有的要考虑性噪比。哎,等等等等吧,对于我们真正的单细胞来讲,考虑的是什么?哎,考虑的是均匀化的值啊,均匀化的值。第二个呢,同一通路上的所有基因的表达水平,哎,统计值进行整合。
20:03
汇集成单个通路水平的分数和统计值,哎,类似于什么呢?就是给大家一个分儿。一个经济打一个分儿。而不是说每个基因打一个分,然后汇总啊,然后得到一个矩阵,而是说每一个基因级给一个分儿,得到一列值啊,得到一列值GS1,我不知道大家有没有接触啊,有没有做过啊,我相信应该是做过的,这个也是比较常见的方法了。哎,现在对于各大公司,尤其是像新格源啊,像这个巡音啊,他们主推的都是这种的,呃,差异分析方法啊,差异复析方法。哎,通路显示水平这是减设点A了啊,哎,右边列举了它和这个ora的优势,第一个。不需要阈值啊,没有阈值啊,像这个前面还需要各种各样的阈值,什么平均值啊,显著性啊等等,哎,功能分类打分是没有阈值的啊,只有只有高和低之分。第二个会考虑哎,同一基因中基因表达的协调变化及考虑微笑基因的叠加效果,哎,也就是前面提到的这个。
21:05
呃,稍微考虑了一下拓扑学结构,基因的上下游关系等等啊,解释了同类中基因之间的相互依赖性,哎,它的上下游关系进行了一定的解读啊,然后呢,这个图就是分析出来这个图,这个图大家应该见过吧,有没有?啊,应该会解读吧,哎,打分首先对基因进行一个哎,表达值的一个统计啊,基本的排序啊等等拿到之后呢,会对它进行一个什么。游走。哎,游走排序之后呢,如果基因显著负极在前面,就是这个地方前面它的分数会叠加。存在一个基因值A+0.9分,存在一个基因基因值0.9分,哎,这个时候分数会急剧的上升。哎,分数或急剧的上升。哎,如果说基因不出现了,这个分数就开始减,如果不是这个基因扣0.1分扣0.1分扣扣扣,最后呈现这种疯的状态,哎,最高值就是它的负极分数值啊。
22:11
嗯。嗯,当然功能呢,功能分类打分呢,也有一些限制啊,也有一些限制,哎,与OA相比,哎,虽然独立分析了每个通路,但是一个基因可能在多个通路发挥作用,就是那个拓扑学结构的问题啊。第二个呢,就是说依据基因表达值情形,呃,依据基因表达值来进行变化,但是呢,有的时候呢,这个被比变化可能也是一个比较考需要考虑的一个因素啊。需要考虑的这个因素,比如说这个两个基因分别发生了2倍和20倍的变化。只要他们与通路中的其他基因相比,具有相同的各质等级,哎,大多数FC方法都会,哎,就是一视同仁。2倍和20倍的变化已经非常大了,但是由于它和其他基因呢,哎,等级相同。哎,考虑的时候呢,就会平等的,嗯,对待他们这个意思是什么意思呢?比如说这个基因。
23:06
哎,它明显的比如高出20倍。高出20倍。但是在这个GS sea负极分析的压力。啊,它只是出现了,在前面出现了,就是表达高的地方出现了,加的分数还是0.9啊,还是零点九一样的。另外基因值,呃,另外一个基因值发生两倍啊,两倍,但是也在前面出现,哎,加的分数也是0.9,也就是说2倍和20倍它都在这个范畴之内,加的分数是一样的。哎,这个时候对表达值的一个判判断啊,哎存在一定的缺陷,不过相对于正常的方法来讲,哎,Gsa已经,哎远超过这个ora了啊,Ora了。哎,这个就是简简单单的GA和OI的一个总结啊。其中大家需要注定的,呃,注意的一个地方就是OA啊,虽然是默认结果,但是它的阈值选择可能会。
24:05
更加的严格一点,哎呀。这个限制因素会多一点。呃,我们通常用的GS1A一般是没有阈值的啊,只论高低不论阈值啊。还有显著性检验方法等等等等。分析是否依赖差异基因级的选取,哎,OA是要做差异分析的,但是GS sea不需要啊,但是GS sea通常的一个做法是什么呢?通常的做法也是要进行两组比较的啊,两组比较比如说正常组合normal组和T组,T组相对于normal组上调的一些基因,它的被比的变化这个值啊,会作为它基因排序的一个依据啊。然后这是一个简单的一个逻辑过程啊,第一步基因排序啊,基因排序呢,呃,GS1刚开始出来的时候还是两组排序啊,两组排序哎,分了组之后做差异,差异分析之后呢,有大到有小进行排序,排序之后呢,就开始对基因级,我们提供的基因级进行复习打分,就是这种游走的模式,哎,出现在前面就加分儿,没有出现就扣分这样一种现状。
25:16
哎,通过这种基因负极的方式呢,哎,负极看它到底在哪个通路上有一个显著负极的一个状态,最后呢,对它进行一个多重假设检验,看看这个通路是否显著负极啊等等一个状态。这些呢,是它的简单的一个概念啊,简单的一个概念。JCE它默它有自己的官网,哎,它有自己的这个数据库,哎,里面常用的那个50个基因呢,50个通的那个。50个就是基因通路的那个。基因急啊。是在单细胞空间最常用的那50个。哎,右边是一些大家哎常见的一些概念,大家了解了解即可啊,其中最主要的是要知道这个ES是负极分数的意思,呃,影reach门的扣拿到的矩阵啊,是一个负极分数的一个矩阵啊。
26:08
哎,这就是他的一个结果了。大家可以看一看。如果这个基因存在着,呃,排序之后啊,排序之后是由大到小排序啊,由大到小排序,排序之后啊,如果这个基因存在上游。呃,存在一个加0.9分,存在一个加0.9分,但是如果像这种地方不存在这个基因。就扣0.1分,就扣0.1分,这个时候如果说我们的基因,哎,它是差异高表达。它是差异高表达,哎,所以它集中体现在这个值的前面,所以这个曲线啊,就会优先在往上长。哎,涨到一定程度之后呢,我也会发现大部分基因已经不在这个通度里面了,哎,就开始扣分扣扣扣扣扣扣,呈现这种哎风软账的一个状态,哎,这个时候说明是上游显著腹极,就是阳性腹肌的一个状态。哎,阳性腹肌的一个状态,哎,就是高表达这个通路的一个基因,呈现出这样一个哎,分布模式。
27:06
哎,当然了,有这种阳性的自然就有阴性的,阴性的就比较,哎,反过来了,反过来了。这个时候呢,比如说这个是阳性的模式对吧,那D下面这个呢,就是阴性的模式了,就是这个基因啊。全部下调了。从这个高表达基因的地方,就没有这个基因列表的,哎,基因就没有这个基因列表的任何基因,导致他一直在扣分扣分扣分。扣扣扣扣扣,扣到一定程度之后发现都是他的下调经验,这个是块是加分。哎,最后加到0,这个时候呢,大家可以看到它整体整体的呈现,就像是什么。反过来的一个状态。哎,这种就是显著下调。哎,显著下调了。显著上调,是这个是类似于这样,哎,正直。哎,呈现出这样一个先上升后下降的一个状态,显著下调,就是先下降后上升这样一个状态啊。
28:08
哎,上面提到的GS sea g sea, 还是前面提到了,还是要进行分组比较的。嗯,不过现在随着这个大家研究的过多呀,研究的很多呀,可能对这个分组啊,没有那么严格了,比如说。分了三组四组等等,哎,分的组比较多了,如果再采用这种方式,哎,分多分组方式,用GS1A打分啊,哎,其实已经不行了,已经不行了,所以随着这个过程的发展呢,慢慢又进化出了,就是说用g sva打分的方式。GSV打分的方式。其实和GS sea原理上是差不多的,只不过它不再做基因比较了。而是简简单单的一个样本或者一个细胞的基因表达值直接进行排序。哎,用这种。哎,也是一种游走的方式,哎,来进行复习打分啊,复习打分。
29:06
这个时候啊,如果我们用的是基因,哎,单细胞的一个数据,哎,拿到这个基因8库的矩阵,用g sva打分之后呢,就会转化成基因级的负极分数8库的矩阵。从而评估这个通路在细胞水平的一个分布状态啊。这个是通俗来讲,哎,GSV就是将基因的表达矩阵转化为通路的矩阵,GSV啊,目前是在公司是当做售后来分析的啊,当做售后来分析的。需要付费的啊,不过呢,其实它难度也不高啊,难度也不高,其中有一个地方就是说这个通路啊,一般还是人为指定的。这个通路一般是人为指定的,呃,通常的做法就是g sea那50个通路。啊,用它来做这个负极分析。呃,正是因为这个GV这样一种特点,就是不,不,呃,只是对基因表达值进行排序。
30:00
而不进行比较,所以很多的公司在做这个细胞定义的时候,用的就是GSV这种方法。哎,把他的mark克基应急输进去,哎,对他打分,打分越高自然越可能是这种细胞类型,哎,由此得到了这个,哎,给了这个细胞class的一个标签,细胞类型的标签啊。下面这张这就是啊,就是这样一个示意图。基因8块的矩阵,基因8块的矩阵呢,哎,首先呢,经过基因表达值的一个统计排序。哎,排序之后呢,干嘛?哎,做这个负极分析,假缩检验等等,最后呢,得到了每个细胞得到的一个复极,呃,负极分数值,从而形成我们新的一个关于基因思考和八扣的一个矩阵。啊,两者之间的区别呢?哎,简单的罗列出来了啊,GS sea, 哎,需要两两比较的啊,需要两两比较。而GS一般不需要啊,直接打分就可以,单样本也可以,多样本也可以啊,而且GS也会合成,会形成一个新的矩阵。
31:02
这个分数矩阵,这个分数矩阵可以辅助大家什么做通路的一个差异分析,就是说这个这个通路是否显著的。哎,存在于正常样本中,还是显著的存在于疾病样本中,等等等等啊。形成一个新的矩阵啊,下面呢,是它的相同点和不同点啊,大家可以简单看看啊。哎,简单看看其中现在最为推崇的仍然是GSV啊,GSV是更加认为更加好的一种方式啊。第三个呢,就是ssgs sa, 这个简单给大家介绍一下,就是说对单样本分析的时候用的是SSGS新高。SCG啊。基因赛的enrichmentco GS SE, 它其实和GSV的原理是差不多的,只是基因排序的算法上略有不同,但是这种算法略有不同,带来的结果是一样的。表达高的还是在前面,表达低的还是在后面啊。
32:05
这个大家了解了解即可啊,真正做法大家打分还是用gsva更多一点。然后就是这几种方式的不同,SSGSGSV算法上略有不同。但是整体的这个。整体的这个分析思路啊是一样的,哎,包括排序的结果也是一样的。哎,这是它的一个简单的函数啊,函数大家有空可以了解了解啊,数学专业的可以看一看。最后呢,和大家呃,说一下这个最引用率,目前高分引用率最高的一种方法。就是的model code这种,Model code这种。哎,前面一直有人问,按照models这种打分是不是?哎,更好一点。嗯,其实呢,它在高分文章引用是比较多的啊,尤其是那些发到顶刊的啊,引用的比较多,它的整体的一个思路啊,相比于这个GS1和GSV又略有不同。
33:00
哎,略有不同,其实它是。怎么了?哎,对,这个先分并后计算的这样一种模式。哎,计算的每个程序其实就是B,哎,在单细胞水平的平均表达水平控制特征基因级的聚合表达减去这个值,也就是说它这个值啊,如果是负极的话,就是正值。哎,如果是下调的话,就是个负值,哎得到正值的时候呢,哎认为它相对上调。呃,负值相对下调,这样的话在得到一个打分的时候,也会得到一个新的矩阵,也是基因score和这个8扣的矩阵。特征处理的话,大家可以看到基本上就是分并操作啊,分并操作啊,分并操作之后呢,进行一个。病的平均水平和这个基因表达值的一个水平的一个比较。啊。哎呀,上调就是高,下调就是低,哎,所以他打分啊,一般都集中在这种0左右。
34:01
哎,0左右啊。而且分数差异都一般都不大。所以在画这个图的时候啊,画这种这个ad model sc这种分数图的时候,一般不会采用它的真实值,而是采用的什么。I mean max这样一种表述方式啊,这样一种表述方式,这个函数啊,大家要记住啊,大家要记住,无论是单细胞空间对它这种打分啊,都是非常要求非常高的,一般都用这种方式啊。哎,这个呢,就是常见的这几个打分的一个策略了啊,大家可以看看GS sea JS va, 它它它它它GS SE a JS va.哎,Gse现在用的还不是很多,GSV是非常多的啊。At, 哎,也是非常多的。SSGS.嗯,一般啊,用的不多啊用的不多,Al呢,Book转录组经常用,Book就是那个普通转录组经常用。
35:00
哎,不过这些方法呢,都被封装到这个里面来了,哎,大家有空可以把这个软件下载来学习一下啊这里面,哎,为什么把这些软件都放在这儿呢。其实是要让大家开阔一下视野啊,开阔一下视野,大家觉得这些软件。哎,是不是已经非常多非常。呃,全面了。哎,其实它只是针对转录组有效啊,只是针对转录组有效,来到其他组学这些软件几乎就没什么用啊。哎,下面是一些通路库的介绍,大家基本上都知道啊,Goke REC等等卖接等等啊。不多说了。那么来到我们空间的话,就要考虑这个刚才提到的这个问题了。啊,就这个问题了,拓扑学结构的一个问题了。只不过啊,这种脱口秀结构目前的难度分析还是比较大的。来到我们这个关于呃网络的问题的时候,首先我们要找这个基因集,就是个model。
36:05
哎,打分对吧,这个是人为提供的,打分的过程中啊,会有一定的这个环境的干扰。环境的干扰,比如说绿色是这个肿瘤细胞吧,然后这个橙色呢是哎过度肽,哎黄色呢是这个黄色是什么。呃,比如说normal区域,那么在打分的时候啊。是不是要考虑这个领域的环境呢?比如说对肿瘤基因体进行打分。那么它的一半环境是存在于肿瘤的,那肿瘤变肿瘤的一个环境中啊,又有部分呢,存在着另外一种环境,那么在打分的过程中呢,就会有什么。啊,就要考虑他周围的一个对他的影响,不能简简单单只考虑这个点。不能检点的考虑这个点,这个时候呢,点内的权重和环境的权重要进行一定的一个区分。哎,这个时候呢,打出来的分数呢,就是量下面这样的一个分数啊,它会考虑环境的一些因素,而不是简简单单的只考虑这个。
37:06
哎,点内的关系,所以在区分的时候啊,尤其是这种这种打分方式有什么好处呢?如果我们只考虑这一个点的一个情况。只考虑这一个点的情况会干嘛?哎,它很可能存在着一定的,比如说它和这个,哎,它的癌变程度还不是很高的时候呢,可能打出来的分数和normal区域差不多。和这个肿瘤区域呢,差异比较大,形成一种明显的边界。但是呢,其实它已经受到了这个肿瘤细胞的影响,肿瘤对它环境已经产生了影响,这个时候就要稍微考虑一下肿瘤对它的一个权重,呃,通路的一个权重的一个问题了。哎,大家可以看到打分,打分这种方式慢慢的就会,呃,考虑环境的影响啊,这个大家在哎,听了这么多空间课程之后,都慢慢的明白了。空间空间其实淋浴哎是必须要考虑的啊,必须要考虑的。
38:03
右边这张图呢,就是大家所要考虑的领域的一个关系,对于我们10×V什么来讲啊,一个点周围6个点,当然就认为它是它的领域了,对吧,这个已经讲过很多次了。但是今天给大家提一个新的概念啊,提一个新的概念就是什么。临近行,哎,临近行分数。哎,测量感兴趣的sport与每个细胞类型之间的接近程度,比如说这个地方是大家感兴趣的,比如说就这这个地方。是肿瘤对吧,是肿瘤但是。哎,真正的属于交界带的这个点和它的距离是不一样的。对吧,有的离得近,有的离得远啊,这样的话就会得到一个分数矩阵,就是它的一个。
39:02
临进行分数矩阵,如果离目标细胞远,说明受目标细胞的影响比较少,如果离目标细胞近,说明它离什么受目标细胞的影响比较大。啊,这个和前面提到的这个领域分数,哎,略有不同啊,略有不同,其实大家看这个分析,大家有没有想过一个。非常常见的一个。就是说想呃,非常那个通俗化的一个。想法就是说这种分析运用在哪种平台会更好一点呢?虽然这里面用的是微平台,但实际上啊,如果我们想知道一种细胞类型和另外一种细胞类型的一个。哎,临近性分数。其实Z平台和HD平台分析这个是最好的。因为zip平台和HD平台,它属于单细胞级,每个点其实已经告诉了他的具体身份是什么。比如说这个黄点,就告诉他这是什么,这是这个EMT细胞。
40:02
对吧,灰色的点呢,就是肿瘤细胞等等,他在他拿到的这个矩阵啊,就是每个细胞,哎,对应的这个空间坐标矩阵,这个时候再计算它们之间的一个领域啊,包括这个临近性分数啊,都是非常有优势的。啊,这种分析在Z平台和HD平台。其实已经被开发出来了。哎,慢慢的有公司就要开始推这些非常超高难度的个性化分析了啊,不过大家都是啊,不过大家呃,也要学会这样一种分析啊。哎,其实他家这个啊,一星细胞网络其实就和打分差不多啊,打分差不多,只不过打的这个分儿啊。是领域的这个细胞类型的一个分数,包括空间,在对这个通路打分的时候。也是会考虑环境的一个因素的影响啊,就是说一个点,它如果尤其是处于交界类型的点,像这种层次的点,处于交界类型的点,那他们受到环两种环境的影响,两种环境的影响必然会对它本身的一个通路值啊。
41:06
产生一定的影响啊,要把这个范围考虑进来,对于我们细胞类型来讲也是一样的,考虑邻域细胞类型就是它周围的点,但是如何考虑临机性分数,在打分的过程中,尤其是在计算距离的过程中。就要考虑它的一个,哎,空间距离关系了。哎,距离越远受它的影响越小,距离越近受它的影响越大,这个距离关系和前面的这个通路,哎,其实是异曲同工的。明白吗?哎呀,这就是打分儿了啊,就是本质上就是打分啊。不知道大家有对这几种打分方式有什么?哎,运用过没有啊,好了,我们休息5分钟吧,休息5分钟,我们来看看我们的代码部分,好吧,休息5分钟。
44:09
其实我们现在讲的内容啊,很多时候就会深入到一些,哎,比较个性化的一个非常个性化的一个内容了。哎,已经逐渐的过渡到什么地方呢?过渡到我们文章的一个第5章,第6章的一个部分了,每个文章的部分大致可以分为三部分吧,当然是6个章节。前两个章节呢,大概就是从整体上,比如说做单细胞,细胞定义,空间联合之后的细胞分布等等等等这样一个大的一个范围,等到第二章,第三章就开始,哎,过渡到一个中等的一个分析,比如说对某个群进行再分群。哎,对空间上的一个亚群,它的邻域关系等等开始分析,等到大家分析到第5章,第6章的时候,哎,就会具体到某个通路,某个细胞类型,某个细胞亚群,某个基因等等等等,这个时候就会精细到它。
45:00
哎,最后大家惊喜到一个很小的一个点,而这个点起到了一个关键性的一个作用,然后呢,第6章可能还会做一点这个实验的验证,来辅助来验证大家这个研究数据分析得到的一个结果。啊,就是说分析都是从大到小,慢慢的一个过渡而来的,但是这个过程是不能省略的,就是说从开始大的分析,慢慢过渡到中等分析,再过渡到一个很小的一个分析这个过程啊。不能存在一个过,不能存在任何一个环节。说是。不知道,哎,存在一定的这个疑惑就过去了,这个是不可以的,因为很多时候大家从大大海就相当于用一个不太恰当的字儿,就是说大海捞针。哎呀,好不容易就是说一定要非常精准的喽。啊,稍微有点偏差,就失之毫厘,差之千里了啊。嗯,再简单回顾一下,就是说大家做这个复习分析的时候,从公司得到的通常是这种OA的。
46:05
全是分析啊。啊,什么诠释分析。哎,大家从公司上得到的全是这个OA的。啊,基本上都是这个样,这种假阳性率比较高啊。哎,比较好点的方式呢,就是GS sea, 不过GS sea需要两两比较,如果大家是多样本的话,多条件的话,那自然就要采用这种gsva和这个。GSSUV和ss GS SAA的方式啊,不过gsva用的多一点。啊,高分文章呢,一般打分的时候会采用这种model add model sc这种方式。哎,这种方式。呃,这种方式呢,他会怎么说呢,因为他在这个,哎,高峰文章经常引用它。而且采取了这种分箱操作,就是分辨操作,哎,精它的操的这个算法会更加精细化一点。啊,然后呢,对于我们空间来讲,就要考虑领域对吧,考虑吧,环境,不能仅仅考虑自己的点啊,既要考虑它呃本身的一个特征,也要考虑什么周围的一个特征。
47:10
也要考虑周围的特征,嗯,对于这个。呃,对于我们细胞类型来讲,也有这个邻域的关系,如果我们考虑周围细胞类型的组成呢,就会得到一个细胞类型啊,就会得到我们的这个邻居分数。对于我们这个,呃。哎,考虑到目标细呃,目标点和目标细胞类型的一个距离远近关系的时候,哎,就会得到这个临近性分数啊,而且这种分析在高精度平台,原位平台和这个HD平台来说,哎,运用的更加好一点啊,不过对于我们微总平台也是不能,哎也是能够很好的运用。好吧。好了,我们来看一下代码部分啊。关于代码呀。
48:02
哎,关于代码的负极分析啊,就不用多讲了啊,负极分析就。啊,就是本点的,就是一个点内的复习分析就不用多讲了。是这个环境。哎,大家要学会搭建环境啊,尤其是这个具有冲突的时候,搭建多个环境啊,不要搭建一个环境。一般一个程序员会搭建几个环境呢?哦,也不是这个。就是啊,就是Z。一般程序员会搭建搭建几个环境呢?一般至少要搭建3个,因为大家在升级软件的时候啊。干嘛?
49:00
升级软件的时候干嘛。哎,环境之间会明显存在一种冲突的现象。会有冲突。哎,这个时候为了配置一个安全的环境呢,一般要把这个单独的环境进行隔离,隔离出来一个环境,让他做这个负极。安达是怎么报错啊?优化。哇。
50:04
一般会搭建3个环境啊,3个环境你像我搭建了就是。哎,三个环境,Sa搭建了一个,Cna搭建了一个,Wes搭建了一个环境之间,可能环境之间要相互独立啊,不能冲突。啊,不过这个这个环境好像没有装GS一样啊,你看这刚才这个环境搭建这个pandas,哎,就发现就很冲突对吧,很冲突,但是如果换一个环境,它就可以正常加载。哎,不过这个包好像没有装JS,我们装一下啊。嗯,对于Python版本来讲,它其实是GSAPY,哎,它这个包也能实现GSV的功能,而且装的时候啊。大家可能有的时候装的比较慢。装的比较慢,怎么换镜像?镜像一般换成清华园的镜像就可以了,大家在kimi上搜一下就行。
51:01
啊,一般会告诉你这个清华园的镜像该怎么指定啊。一般我们换成清华园停就可以了。到这儿。肝癌指定成清华这个原就可以了。那装的就相当快了啊,尤其是大家需要装那种几百G的那种,就相当的快了啊。嗯,好。这就搭建好了啊,然后呢,读取我们的这个分析之前经过基础分析的这个a data现象啊,Data这个数据啊。其中呢,有一些呃,大家常见的一个分析内容啊,都要放在里面,其中点X是什么。哎,举证。
52:00
就是我们的这个count矩阵,只不过Python版本存储的时候啊,会承认了这样一种格式。哎。然后是OBSOBS相当于这个这个R对象里的什么。呃,没有data的信息啊,聚类信息。其中呢,如果说大家做过结卷机的时候,诶,会有一个这个内容。会有一个这个内容举证,这个举证。呃,在分析的过程中啊。哎,大家要针对不同的矩阵做一个复习分析啊,你像我这个。啊,用到的就是这个矩阵。哎,复习的时候呢,就用这个函数就可以了。啊,当然这个计算过程会相对慢一点啊,相对慢一点,不过呢,我这里面用到的是细胞类型的一个复极。这个地方呢,不知道大家有没有一个。不知道大家的想法有没有很?很什么很灵活啊,很灵活,比如说啊,我用的是这个结卷机的矩阵,对吧,细胞类型这个矩阵。
53:02
哎,我对比如说对这三种细胞类型进行这个GSV打分。哎,得到的是什么呢?得到的是什么?哎,就是说得到的就是每个sport对这3个细胞类型排序。哎,它越往靠前,它的含细胞含量越高,哎,得到的分数越高,说明得到的是什么?哎,这三种细胞类型显著,哎,就是说把这三种细胞类型看成一个整体。哎,这三种细胞含量相对较高的这些点在哪?啊,类似于什么,这个时候对大家找微环境非常重要,非常重要,这是用细胞类型哎嫁接这种打分方式得到的这个现象。哎,我们来看看这分数啊,这个分数呢,大家可以看一下。基本上就是这个分数了。哎,每个每个点都有一个分数,对吧,每个点都有一个分数。
54:02
哎,分数越高代表什么?说明这3对细胞3种细胞类型,就是说微环境中含有这3种细胞类型的点值越高啊,值越高,这是细胞类型的一个状态啊。这是Python版本的一个打分方式,哎,比较粗暴,但是这个时候还没有考虑淋浴,还没有考虑淋浴,那么更多时候呢,我们需要考虑淋浴。啊,当然领域有用。啊,林玉是用R版本写的啊。所以这个时候呢,大家切换一下。淋浴之前提到了我们淋浴啊,有两种,有这个。哎,可以说有两种,一种是基因领域,一种是细胞领域。一定程度上代表公定位吗?哎,这种公定位就相当于那个了啊,多种细胞类型的公定位了啊,明白吧。比如说我用3个基因打,呃,3个细胞类型因打分,那这3种细胞类型高度就是说。哎,它在这个sport里面含量,哎,相对最高的那些sport在哪。
55:03
哎,明白吧,这种打分方式呢,就量化这种固定位了。哎,只不过这个时候我们在打分的时候,一般不考虑两种举报类型,而考虑多种,明白吧。哎,接下来我们用R版本来实现这个。领域的一个问题啊,领域的一个问题。呃,当然了,存在着两种方式啊,2种方式,如果我们用这种。其实原理原则上都是差不多的啊,原则上都是差不多的,如果说我们用细胞类型的话,哎,就是说细胞类型的分数进行一个复极分析,如果说我们是考虑复通路的话,也是一样的啊,通路的负极分析就是先对这个点进行打分,然后综合到他的微环境中,哎,给他一个整体的一个分数。可以细胞混着基因打吗?不可以啊,细胞混着基因打分,就那打出来的结果是什么?
56:06
啊,对了,还有一个需要注意的是需要准备一个GMT文件啊。哎,GFT文件,这个GFT文件,比如说我刚才对三种细胞类型打分。就是把它当成了这个看守的表征。哎,就是内皮啊,Fiber啊,VFS啊,如果说它是一种看似的表征的话,把它放进来,这就是这个GMT的格式,第一个是什么?哎,第一个就是什么,大家定义的一个区域,第二个就是它的一个什么通的名称,第三个就是后面它的元素了,有几个写几个写进来就可以了啊。然后呢,我们来看考虑领域啊,领域的话,其实就要涉及到一个坐标的原因了。哎,坐标的一个原因吧,这些代码大家复制就可以了。首先呢,我们要拿到每个support的一个坐标。哎,Sport这个,呃,这个b code的一个坐标,坐标信息都拿到。
57:04
哎,拿到之后呢,这个时候啊,如果大家用的是高精度平台,这个8CODE就代表了一个细一个细胞了,对吧,大code就代表了一个细胞了,但是如果说是低精度平台的话,它代表的是不同的细胞含量,就像我这个一样。哎,不同的细胞含量。哎,因为每个点含有的细胞比例是不一样的。哎,这个时候往下干嘛,这个时候我们就要计算领域了,其实和前面的代码有一点类似啊,我们如果是以实成的这个内容为例的话,就是6个spot。哎,6个SP,如果说大家用的是高精度平台的话,拿到这个矩阵是零异型的,就要用临近的10个SP作为它的一个分析啊,这个地方就开始开始计算淋域。哎,MK4就是说最少要有四个邻邻居,因为有些点呢,处于这个边缘。哎,处于这个边缘,处于这个边缘之后啊,有的点可能它的邻居就没有,或者说只有一个两个,它只只是和主体组织有一点相连,它的邻居不够6个,但是我们考虑的时候,这些邻居的过少的是不能考虑的。
58:11
这个时候干嘛?哎,这个时候干嘛就不能在,呃,就是邻聚过少的点,我们就要过滤掉了啊,就要过滤掉了,这个时候呢,从这开始我们就要开虑考试这个,考虑这个邻浴负极,无论是通路还是细胞类型的负极,就开始考虑这个原因了,这里面我举了一个例子,比如说我们的通路打分是。哎,通路打分是这个。哎,这个结果。嗯,这个呢,这前几个是通打分的结果啊,如果说是通打分的结果的话,我们考虑每个点的它的一个特征的时候,就要考虑它本身,也要考虑它的一个临近性。就是临近的一个通路,就和这个地方一样。哎,要考虑它环境的一个影响,对环境添加一定的一个权重。
59:01
哎,这个时候呢,我们首先要干嘛,计算领域,计算领域的时候呢,对它的一个。因的计算方法呢,就在这儿了。哎,这个大家可以拿着回去练啊,首先呢,是这个要找到什么。这个地方要找到。如果说我们是低精度平台,那么如何定义目标点呢?如何定义目标点呢?比如说这个点,比如大家都知道打分有高有低,甚至还有负值,像out。哎呀,还有复制,就算是用细胞类型结卷积的方式,哎,有的分数也很低,比如只有零点零几啊,有的分数很高,可能达到了。是吧?1如果用这个C分c location的话,如果用c location局电机的话,对吧?它的分数可能0到几十都有可能,那么它含量多高才算是有效support呢?哎,含量多高才算是我们的目标support的呢?哎,这里面给大家一个参考值0.2啊,0.2就是高于0.2,认为它是一个有效的support,我们要保留,这是我们的目标port啊。
60:08
在目标sport的基础之上呢,进行一个哎领域分析,哎分析它周围的一个通路的一个表达水平,包括哎也可以运用于细胞含量的一个表达水平,哎等等,构建出这样一个领域负极的一个矩阵。哎,就是degree矩阵。领域附近的一个degree矩阵,这个矩阵呢,就会达到这样一个通路分数。哎,Neighbor的一个通路分数,这个时候我们在复习的时候呢,这个时候我们在分析的时候呢,就可以考虑到什么。哎,考虑到它一个周围环境对本身port的一个影响了。哎,接下来就是一些简单的绘图操作了。哎,就比较简单了啊。就比较简单了。啊,这个图其实已经画过了啊,就是这张图。
61:03
就是这张图。注意啊,这个地方考虑是淋域的影响啊,这个考考虑是淋域的影响,比如说以CLASS2 class斯特4为这个例子,考虑的就是这个的影响。嗯,当然了,还有一些其他的分析内容,我看一下啊。一下,把它画一下。啊,有可能考虑的是领域的影响了,这个时候啊,有的时候领域是干嘛的。啊,有的时候是不存在的。
62:00
啊,这个是多样本的,多样本的时候大家要分图像啊分图像。跟图像画。怎么分图像呢?大家可以看到它的一个长度。比如说我们这边P1设置为他。比如说啊,等于。嗯,这个时候呢,这个时候后面的参数是不能给的啊。你看大家,大家可以看这个P的长度有多少。也是三个,也就是说它包含三个图像,我们在对这三个图像进行一个呃分析处理的时候啊,就需要把它三个图像干嘛分别的用这种形式标识出来。嗯,比如说写一下吧。
63:13
等于。这是多图像,这是在多图像拼接的时候啊,有这样一个操作啊,大家一定要。会用啊。哎,这个时候呢。就可以把它。拼出来了。哎,大家要学会这种操作啊。哎,这个时候呢,就是3种的,3种的都放出来了啊,和前面的就不一样了,前面的就是一个。如果大家只写一种的话,它只会还原。
64:05
换个名字吧。好。哎,如果直接,如果不像那种,哎,如果是默认标准写法的话,只能用,只能用,只能用来分析单样本,如果多样本的话,对图像切割的时候,对图像这个分开分析的时候,就要采取采取这种刚才我分析的那个策略啊。分析的这个策略,今天下午还跑了个项目,跑出来的结果是这样。哎,李玉。哎,0基本上它是来表证微环境和微环境对它的一个通路的一个影响啊,也包括前面这个PPT提到的这种。哎,细胞类型领域的一个分析的影响啊。
65:01
哎,这个在分析过程中就比较精细化了啊,已经追溯到我们文章的一个第5章,第6章的一个内容。分析到微环境通路的影响,分析到微环境细胞类型的一个影响等等一些,哎,非常精细化的一个内容了,这个时候对大家的要求啊,就比较的高了啊,比较的高了,呃,尤其是在分析微环境的时候。如果大家经常看这个空间的这个文章的话,它对这个微环境啊。它的一个通的一个。哎,通路的一个分析内容啊,相对的要求啊,就非常的高了,尤其是说,尤其是什么呢。大家还记得上节课讲的空间基因轨迹吧,空间轨迹吧?哎,通路的轨迹也是我们也是这个通路的轨迹啊,也是这种细胞网络打分啊,包括这种领域分析的一个重要核心点,尤其是这个内容。目标点和,就是说目标点和我们感兴趣的细胞类型距离到底有多远?哎,这个在空间轨迹上也是有个很强的运用的啊,非常的一个。
66:05
个性化啊,非常的一个个性化,呃,尤其是大家在学了很多的个性化分析之后啊,个性化分析之间其实相互都间都是一个串联的状态。哎,你呃,就是分析上多多少少有一些重叠,但也有一些差异性。哎,把这些重叠和差异性就哎很好的运用起来,就组成了我们的一个一篇高分文章啊。好了,大家有什么问题吗?没有什么问题,我们就差不多到这儿了啊。
我来说两句