00:00
好啊,我们上今天的第11课啊,11课关于这个空间生态位基因模块的一个内容啊。嗯,在上课之前呢,先给大家聊一个关于这个污染的问题。污染的问题啊,大家有没有之前应该都看到过。也不是不知道大家有没有有一个疑问啊,就是对于这种空间转录组这个数据呢。嗯,它的污染主要是来自于哪儿?比如说对于这样的一个切片,哎,它这个点还周围六个点,它这样一个污染是哪呢。空间的楼主到底有什么污染?啊,如果大家对这个空间转动组这个实验过程有些呃,有一些了解的话,可能就会发现它这个污染啊,主要是弥漫性的这种污染。啊,就比如说这个点的基因表达,可能经过他实验人员的操作,或者怎样的一个洗透过程啊等等,它这个基因啊会弥漫到周围。
01:10
啊,所以说呢,有的人专门开发了这个方法,这个方法呢,已经发到这个内communication了,呃,就是专门来这个。啊,专门来去除这个污染的。啊,为什么有这个去污染的这个内容啊。嗯,第一个内容呢,就是前面讲到的啊。我们在做这个单细胞空间联合的时候啊,如果这个周围有弥漫性的人工污染。啊,可能会导致它这个整体的分析过程啊。呃,联合的结果会发生一些错误啊。嗯,第二个问题呢,就是为今天做空间基因诶模块做一个铺垫,一旦我们分析到这个空间基因模块,尤其是某种细胞类型,它的一个周围的基因模块的时候。
02:00
诶,这个污染就会显得尤为的这个关键了啊,所以说呢,一般在前期呢,一般要考虑它这个污染问题,不过从目前的这个大多数文件网上来看啊,大家用这个索肯定啊不是很多啊,也就是大部分这个实验过程还是比较完善的,所以不会用它这个方法,但是某些样本大家要注意啊,尤其是大家分析的很精细的时候。哎,也要稍微注意一下它这个稍微注意一下它这个分析的一个污染问题啊,大家如果看到这个文献的话,大家可以。呃,简单的回顾一下,带大家看一下,就是理想状态下这个UML,在一个port里面的这个UML。嗯,衡量这个就是当当就是它本该的区域的一个基因表达。但是经常啊。呃,由于这个他们这个blood就是你探到他的临近的一个port。
03:03
呃,所以说呢,这个地方可能在空调着陆组上就会产生这种弥弥散性的这个污染的问题,呃,这个问题呢,所以说呢,这个方法呢。而那也是中国人发明的啊,不过是国外的实验室,所以他就专门呢,通过一种衡量的方法啊,通过这种空间的这个基因矫正,矫正回到他一个正常的一个空间基因表达的一个水平。这个方法就叫这个可以啊,可以我们来简单的看一下这个方法啊。嗯,你看对于我们整个这个切片来讲,尤其是大家铺的很满的时候,这个片子铺的很满,就很容易出现这种弥漫性的污染,因为大家各个区域都有大量的基因在这表达,尤其是那个什么呢,组织切的比较厚。嗯,组织气质很厚的时候,那呃,由于这个那个组织痛话呀等等。呃,落下来这个RNA非常的多,哎,就很可能造成这个周围的污染,大家可以看一下。
04:06
它评判这个污染的方法呢,还是主要依据两种和那个啊呃,单细胞那个去污染的方法差不多,像单细胞的去污染,它是一条曲线,诶前多少个uma认为是细胞,后面的都是背景污染,当然背景污染也有RNA的一个分布,所以说呢,那些RNA呢,就是一个背景污染,真实的组织,真实的组织框呢,就要把这些背景污染的u mi给它去掉,像空间的这个也差不多啊,也差不多啊,我们组织真实的覆盖的一个区域呢,通过我们的这个分析方法都可以把它圈出来,圈出来之后呢,我们通过分析它组织。本身的一个基因表达特征,还有它背景的,就是说没有support的地方,尤其是这种边缘的地方。呃,边缘的地方,大家找个例子啊。
05:22
尤其是什么地方呢?就是这种地方。边界的时候的,当然有部分覆盖到这个储水管,说明它应该是划定到组织的部分啊,但有的时候呢,它也有这个,嗯,空白的地方,这个地方呢,原则上讲它的外面就是这些地方,它应该不再有M啊这个基因的信息了啊,但有的时候呢,它这个有的时候我们如果对全片进行检测的话,会发现它的周围也有这个基因的信息。说明它本身的这个ma啊,这个就是弥散到外围了,弥散到外面了,哎,导致整个的一个组织结构的这个数据信息啊,一定的错位。
06:04
有一定的污染。嗯,所以说呢,在这个整个的分析过程中呢,就会用到这样一个SW clean的这个方法,哎,给稍微矫正一点这个基因表达的一个空间错位的一个问题啊。大家可以简单看一下它这个的原理和方法。嗯,其实也是对这个空间就是没有组织覆盖的这个位点呢,进行一个基因的一个表达的一个统计,计算它的一个特征,同时呢,计算这个组织覆盖区域的一个基因特征,然后根据这个特征的一个值的来回归统计啊,把这个污染的这个部分给它剪掉,就认为是它真实的一个基因表达的一个成分了。这个地方呢,当然它有一些,他用了一些专门污染的样本进行了一个。嗯,进行了一个这个。检验,呃,检验之后呢,确实它的基因值会进行一定的矫正,大家可以看一下。
07:02
当然这个还不太明显,我们看看他这个文章的一些例子。大家可以看一下右边这两组,如果原始的这个基因表达呢,这个基因表达就弥漫性更强一点啊,弥漫性更强一点。哎,通过这个细胞的肯定,它经过一定的基因回搅之后呢,就会发现它的这个特异性会更高一点,更高一点。啊,下面这个也是同样的道理,这个基因你看在不该表达的地方还是有一定的离散的,经过这个矫正之后,这个地方就很低了,几乎没有啊。就成为零了,这个值呢,主要是什么呢?主要是这些低表达值。像这个地方呢,很多表达都是012这种很容易就是这个基因污染造成的。这个基因污染造成的呢,就容易导致这个空间分析啊,有一定的误判的作用。啊,所以通过这个软件进行了一定的灰搅,把它矫正回来啊,该有的污染部分把它去掉,像这个地方呢,本该就没有,但是也有像零和一这种基因低表达弥漫弥漫过来,哎,把它回搅回来。
08:07
哎,体现一定真实的进行表达,这种情况一般出现在什么情况呢?就是大家对这个偏啊,可能要求太高了,希望把它铺的满满的,不要浪费这个空间区域,诶就会容易出现这种偏角。你看这基本上的片都是一种把整个这个时尚波片给它铺满。下面是一张对比的图,你看这个基因表达值经过矫正,确实有一定的回落啊,大部分基因是有一定的回落的,有部分基因在强调它的空间特异性的时候会更高一点啊。这是死亡的一个方法,当然它这个方法呢,不仅用在这个,我们常见的这个。
09:06
我们常见的这个短片,它也用这种。原味的这种,或者说用这个select的这种方法啊,Select因为它这个点镜更小,只有十微米,呃,所以它的污染,那它的一个臭味污染是比时上更加严重,就会导致它整个的矫正过程,一定要进行一个矫正。啊,你看它通过对比,大家可以看一下它原始的这个肉啊,是这种表达模式。哎,经过矫正之后呢,这个基因表达确实呈现了一定的空间趋向性,把这些低的零一的这种呃,一二的一表达的把它给矫正回来,就会发现很多基因其实不在这个区域线啊。下面的基因也是一样,它其实就是在矫正一些低基因表达的一些污染问题啊。像这种肉啊,也可以啊。调动回来之后呢,对我们下游的一个分析,也是一个。啊,很强的问题。
10:01
嗯,文章中还用了一个关于这个胰腺癌的数据,这个之前在那篇文章中也提到过。这个胰腺癌的数据呢,大家可以看一下,简单的啊,他之前文章中有划区,呃,剧烈之后呢,确实聚成这几类,呃,但是他在基因表达的一个层面,确实。呃,通过这个统计啊,包括计算啊等等,确实会存在一定的污染现象,包括这个肉和Spark,呃,肉呢,其实呈现这样一种状态。啊,大家可以看一下,主要体现在啊,右上角这个部分中间呢,有一些呃,弥散性,就是弥散的线性,然后这个包子肯定经过矫正啊,把中间这些低基因质量都给矫正掉啊,也就是说尽量矫正这个由于基因带来的一些误差现象,你像下面就说这个就更明显了。哎,左边这个污染的非常严重,右边的就。经过矫正之后呢,它这个基因表达就有了空间的一定的这个趋向性,恒定性等等等等。
11:01
嗯,文章中用了很多的一个例子啊,文章中用了一个很多的例子,实际上具体的,呃,算法内容呢。呃,其中的主要原理还是刚才提到通过计算这个真实组织覆盖的一个。基因表达信息和这个背景就是说没有组织覆盖的一个基因表达信息,通过计算它们两者之间的一个特征,哎,把真实覆盖的一些基因呢,减去这个背景的游离,由于背景游离导致的一些基因的一个污染,从而获得它真实的一个可靠的一个信息。哎,就是这个方法了。这个方法呢,嗯什么的,肯定这个方法呢,呃发虽然发散了NC,但是它很多有很多,呃已经有一些空间转入组的这个文献。嗯,一直在用啊。因为它确实在一定程度上会矫正这个污染,尤其是我们的组织切的如果比较厚的话啊,它由于每个点的RNA有过多啊,很容易补货的时候就流到不流到他的周围去。
12:05
这是它的一些呃,附图,大家可以简单的看一下啊,这个方法呢,不是我们的重点,所以我们看一下,就是大家知道这个方法就可就可以了,如果怀疑我们的空间转入组有污染。哎,就用这个方法矫正一下。大家可以看一下它矫正的一个结果,像这个恶性分数。嗯,肉就是没矫正的啊,经过石包后,右右右面这张图呢,就是经过这个细胞的隔离矫正的,其实这个呀,要跟这个形态学进行一个匹配啊,大家可以看一下。像这种深色的区域啊,往往就是这个综合区域等等等等啊,像这些红色的区域啊,就是我们正常的一些平滑肌区域。大家可以简单的看一下这个,如果我们不矫正的话,它有的这个。有的这个会弥散到这个周围,比如说这个这个地方它本来就没有那么大,但是呢,它这个基因啊,会沉淀一些弥漫性的作用,诶这些基肿瘤表达的基因,由于这个污染的问题呢,会弥散到我们的这个,呃,正常组织部啊,正常组织部位。
13:14
大家看到没,弥散性比较强。哎,弥散进来了,但其实这个地方是正向是个区。呃,经过这个肯定引,就是这种算法进行表征的时候呢,这些呃,正常区域的弥散性有所减弱,就是进一步回溯到我们正常的一个基因表达的一个状态。嗯,对这个肿瘤恶性评分啊,包括这个肿瘤区域的识别啊,是有一定的帮助的啊。包括下面的图也是一样的,通过这个聚类大家可以看一下。哎,大家可以看一下贝因是聚类,这是一个空间转录的聚类的一个方法啊,聚类之后呢,当然聚了这么几类,大家可以看一下这些基因的表达啊,原则上讲都应该有一定的空间趋向性。
14:09
经过一定的这个。啊,经过这个spot clean它的一个过滤之后呢,大家可以看一下它这个好像聚类的时候精细度更加的高一点,比如说像这个地方,它本来是聚成这个和橙色聚成一类的,但是经过什么肯定的时候会发现这个地方单独聚成了一类。单独聚上了一个,这个地方也会形成一个新的小类,嗯,为什么会这样这样呢?它其实是根据这个基因表达的情况来进行一个判断,就是这个地方基因表达确实和周围。哎,差异比较大。诶,基本上这些典型的像这个埃基病,这都是这个免疫球蛋白的一些基因,会发现它的一些基因表达,其实主要集中在这个小的一个很很小的一个区域。啊,但是呢,他这个如果说我们不进行这个污染的一个简单过滤的时候就会发现。
15:03
这个区域和这个肿瘤区域啊,包括一些其他区域直接聚成了一类,就是这个像这聚成了一类,但是这这个地方却没有这些显著的我们想要的这个IDB这种基因表达。哎,说明了这个整个组织部位啊,和这个剧烈的情况,和这个这个形态学的呀,是之间是有差别,是有这个出入的,所以要进行这个clean啊,啊其实这一典型说明呢,其实对于clean来讲,我们的肿瘤样本通常是要拿它来简单的进行一定的校正的啊,简单的进行一定的校正,校正之后聚类结果和形态学划分的结果匹配度会更高一点啊,更高一。这是这个clean啊,Clean。它的代码非常简单啊,非常简单。大家如果看他的官网的话,其实它就一行代码。
16:01
他就一行。这个我给大家已经在这个公众号里面。总结过了,我们把这个数据读进去,读进来之后呢。我们把数据读进来之后呢,呃不呃,它是个。Python版本的啊,读进来之后呢,他就大家可以看一下。就这么一个函数。什么clean?嗯,对,我们读进来的数据呢,进行一个胞的可能就是进行数据清洗,进行胞的这个清洗,呃,清洗完之后呢,它这个基因表呢,会更呈现出一定的基因的。局部的一个趋向性,对一个污染来讲,确实是一个适当好的一个选择啊。啊,这是R版本是错R版本啊,啊大家对大家比较友好,大家读的时候看可以看一下,他其实基本上是直直接读的这个师生的一个结果。包括读的一个时长的一个空间信息,包括它的坐标图片和啊缩放程度,呃,读完之后呢,对它进行一个简单的一个预处理之后呢。
17:11
啊,直接就是这个,当然前面的个性化呃,可视化大家可以不用管它,读进来之后呢,它基本上就是直接就的可就可以了。这是非常简单的一个方法啊,呃,其中有一些参数呢,大家可以适当的调整一下啊,适当的调整一下,包括这个污染的半径估计的话,大家可以适当调整一下。这是port clean,为什么要讲这个port呢?就是刚才提到的那个,要为这个生态外基因的一个模块进行一个铺垫啊,很多时候呢,我们在了解这个生态位的时候啊。了解这个生态位的时候,呃,就要了解一个细胞类型的周围的一个细胞。前面讲到了这个基因的供定位,包括黑素体供定位,但是我们也要分析一下特定的细胞类型,那周围的一些微环境,也就是他的基因表达类的情况是怎样的。
18:05
我们先来看看关于sports,他在文献的一个简单的应用啊,简单的应用。啊,这篇文章也是发表在这个NC的。啊,它的这个样本在分析的过程中,由于这个就是由于这个弥散型污染,尤其他在分析这个基因特异性的时候。确实需要这个,呃,确实需要这个,呃,对这个空间的一个基因啊,进行一定的过滤。嗯,以防止这个由于这个污染的问题,导致了这个基因出现这种弥漫性的一个现象。因为我们来看一下他关于这个的一个。啊,内容啊。空天轨迹啊,具体的分数分析。我不lo。
19:03
发表细胞烫怎么织化?没有吗?搜一下啊。那只他在这个结果里面,大家可以看一下啊,短日的空间数据产生了这么多的一个转录本。嗯,在目前的这个实验的,嗯嗯,方案中呢,MV可能是预算。就空间党楼主确实是离散的,大家对这个进行了解之后,确实它会离散,呃离散之后呢,诶会游离到附近的一个SPA。哎,造成这个局部的污染,哎,为了矫正这个S的swamp,哎用了一个最近画的一的方法,这个s clean,就刚才介绍的那个方法。
20:06
图,呃,产生这个调整基因表达这个举阵,哎,我用这个随后的分析这个,诶我们来看一下,呃,我们拿到这个不同的部位的一个空间着的数据,哎,ST这个空间着路的数据的时候。呃,经过根据的时候,大家可以发现确实,呃,这个基因是否弥漫啊,很多时候都是一些人为的判断啊,大家看到这个基因表达这种情况,可能觉得他们可能是一种弥漫,就是这个对大家前期的这个形态学的认知啊,可能要求高一点。可能要求会高一点。呃,就是说这个基因啊,可能如果这种满屏都是的,应该是存在这种弥漫这个现象啊,所以他这种时候的肯定进行了一定的矫正啊。
21:00
哎,弥漫不是一种正常现象,大家可以看一下,本来弥漫的一些血液变的这个,哎没有了,直接进行表达就去掉了,然后。构建了整个的一个基因表达的一个空间体系,然后用今天的重点function构建这个空间的这个。生态位基因表达,基因表达哎,同时分析我们具体的细胞类型和生态位的基因表达的一个模块是怎样。这就是说,Clean。我们来看看他的一个说法应用啊。啊,有的时候前面提到过关于空间转录组数据的一个过滤问题,我们看看这里面它有没有过滤啊。大家可以看一下这个过滤啊,我想找楼主的过滤,目前没有定论,但有的文章是过滤的,有的文章不过滤,你看看这篇文章。啊,对于质量控制呢,去除了低质量的细胞少于200,并且现定的基因大于百分之,啊,这个基因少于200的一个部分呢,其实就是那些port呀,它那个大部分是那种边缘的一些port。
22:07
这些胞的部分涵盖了组织部分,涵盖了这个呃空白区,导致它的基因数非常少,呃,如果我们在研究生态位的时候,生态危基因表达的时候,这些基因呢,这些候的本身的,呃,多维的候呢呢就不够。哎,尤其是它的一些外围都是一些空白区域啊,所以说对我们这个生态会研究是没有意义的。嗯,所以把它去掉好,线粒体基因大于25%的,这个他认为是一些坏死区域。当然这个地方需不需要过滤有待考证啊,还没有一个统一的定论,但确实是这个线粒体基因表达可能大概率是一个坏死区,但也有可能是这个组织部位确实耗能比较多,所以导致现里的基因多一点,这个目前没有一个定论,但是这里面它是过滤了。嗯,为了调整这个基因的这个法,就是弥散的时候,在空间转录组他们用了这个肯定的方法。
23:01
来调整这个基因的一个表达的一个举证。我们来回到他这个原理图啊,原理图。通过他这种矫正啊,确实能看出来。就是能看出来这个基因弥漫得到了一定的这个改善。呃,不过呃,这种弥漫进行了一定的改善,还是前面那个说法,就是说如果大家这个组织铺的太大。嗯,不得太大,而且有一些特异性基因本不该存在的地方,它有了,说明肯定存在一种基因弥漫的一个现象。嗯,这种极弥漫的现象呢,大家一定要呃引起重视啊,他对后续的分析其实干扰还挺大。就是说有些不该有的细胞类型啊。啊,他可能因为基因弥漫的作用,他的基因跑到了这个部位,导致大家分析的时候呢,哎,有了这种细胞问题,会造成一定的错误判。
24:11
装上一堆的误判。像这种。我像这种,就像这种贴的这个片子贴的很大的时候。嗯。就像这种贴边贴的很大的时候,把整个片都给占满的时候,他最容易发生这种弥漫现象啊,最容易发生弥漫现象。所以说贴片的时候,通常呀,不要贴的太满,40%~60%就可以了啊,不要贴的太满啊。不要说是为了一定要这么充分的利用,没有意义啊,大家提的时候适当的。适当的可以就行了,因为在这个算法的过程中啊,他认为他在计算背景污染的时候,他把这些空白区域,他认为空白区域至少要保留20%啊,所以说大家不要为了抽这个空间找子,一定要铺的满满的,铺满满满的,很容易导致大家这个分析下面就成成问题了。
25:18
嗯,这篇文章呢,它经典的运用了这个方法,还有这个bank的方法,还有很多经典的就是这个的方法啊,嗯,简单聊一下这个文献大家可以看一下,它通过这种包的这个clean,它去除污染之后呢。去除污染之后呢,当然这个基因表达更具有了一定的空间趋向,哎,基因本在更集中于他本该表达的一个地方,对吧。呃,然后通过这种呃班的方法,就是今天我们重点要介绍的方法,创建生态位空间区,呃空间空间的一个基因表达的模块。嗯,形成这个空间权重的剧烈之后呢,大家可以看一下这个模块,就会形形成大家这个想要的这个地域模块,这个定域模块和生态不会有活,和我们的目标细胞类型有关,大家可以分析我们目标细胞类型周围,诶周围细胞类型的一个表达特点啊。
26:14
空间的空间,大家可能对这个生态位啊,对这个微环境,哎,都知道,呃,它非常重要,呃,非常重要的前,呃前提呢,三个部分已经讲,呃前两个部分已经讲过了,就是通讯非常重要,生态的通讯非常重要,第二个就是生态会的细胞类型组成非常重要,前两个都讲过了,今天我们就是要讲第三个就是生态会的基因表达特征也非常重要。啊,通过这种方法呢,就可以分析得到我们目标细胞类型离它最近的那几种细胞类型,或者离得最近的某个区域,它的基因表达特征是怎样的,通过分析这些基因特征呢?哎,我们就可以知道原本的微环境生态在分子水平上到底造成了怎样的一种转变啊。嗯,这种情况呢,也是大家都,呃,现在单细胞空间呢,也都是一个。
27:03
多样的磁带啊,所以说在分析的过程中呢,大家拿一个呃正常的样本,拿一个疾病的样本,相同细胞类型,它本身的分值本身就已有了一定的转变,哎,我们在这个分析它微环境的转变的时候呢,就可以从呃空间的一个角度来分析它整体的一个变化。等等啊,这个空间所带来的一些呃,奇迹。这个模块非常的关键啊,非常的关键,因为它是从分子水平来解读这个空间信息的。啊,这个大家可以看一下啊,这都是空间数据,空间数据你看它的矫正方法是harmony harmony integrated啊,也就是说大部分的空间啊,讲说的时候还是阿布尼居多一点。秒钟之后呢?呃,这个地方要简单的提一句啊,简单提一句还是强调一句,如果我们的样本啊,有是像他这样有部分正常区域,有部分肿瘤区域的这种一定要用support clean哎矫正一下,因为如果不矫正的话,大家在这个u map剧烈的时候就会明显的发生这个肿瘤区域和这个正常区域会弥散,就是相互。
28:16
呃,分不清,呃没有明显的界限,所以说这个地方。直播肯定一定要矫正啊,一定要矫正是他的,他的这个代码并不复杂,不并不复杂,就是把数据读进去,读进来之后直接一个命令就完事,然后接着往下降为剧烈就可以了啊,没有更多的一个内容,但是就这么一个小小的一步,可能会对我们的后续产生一个巨大的影响啊。这是肿瘤的一个划分,嗯,为什么肿瘤?大家有没有想过,为什么肿瘤样本它就很容易弥散?因为肿瘤样本它那个细胞小。呃,我说维米一个一个SPA的内部,它可能会占多个细胞,细胞一小,它带来的概念,带来的影响是什么?
29:06
每个细胞的UY啊,就是基因表达又多,细胞多,基因多,就会导致我们一降解一透化。呃,脱落下来的就是流到这个薄片上的RNA,就是基因,基因的RNA分子特别的多。一旦这个细胞的内部的这些探针啊,捕获的没有那么及时,或者说没有那么的充分,给这些一流通过这种脱发流就流到周围去了。所以说对于这种,呃,一个情况就是这种铺的很满的,还有一个就是有这种肿瘤区域的一个样。推荐大家一定要过滤一下啊,一定要过滤一下啊。被聚类结构和更符合形态学分布吗?没有这个说法啊,只是贝叶斯剧烈,他一定会考虑空间结构的问题,但是大家可以看一下,大部分剧烈还是哈姆啊。
30:01
用的哈多一点,因为本身分子聚类啊,就不能太太多的考虑这个形态学的问题啊。因为剧烈之后呢,大家会还会回溯,回溯到这个形态学的一个内容上啊,所以说呢,就会就是就要进行一定的那个内容矫正啊。大家可以看一下这个CV的一个内容,CV的一个内容,这是我们后续课内,大家简单看一下,呃,估计这个肿瘤的一个成分。通过CA这个估计啊,大家他简单的估计啊,这个肿瘤细胞恶性程度的一个空间排布问题。啊,这个地方呢,也是需要进行一个强有力的矫正啊,一旦大家这个肿瘤这个基因啊,有个弥散的作用,哎,整体分析出来这个C啊就不准啊,就完全不准,所以说这个说的肯定还是有必要做一下啊,尤其是总瘤样本和这个前天过满的样本。
31:00
贴片过马的药。嗯,接下来就是一些模块的分析了,大家可以简单看一下这个模块的分析,嗯,这个模块的分析啊,其实就是前面提到的生态外基因模块,注意这个模块不是说细胞类型它表达的一个情况,而是我们特定细胞类型它的周围的一个。啊,周围的一个生态位。就是说它周围的一些细胞表达那个基因模块的一个特征,大家可以简单看一下。哎,对于不同的样本。呃,像肿瘤核心呢。它的一个模块,它的一个微环境模块是这样的。不同的这个区域啊,它的物环境模块会有一个明显的变化,明显的变化。像那种哎,基因模块之间的一个权重的一个相关性等等等等,它其实主要是体现的呀,这个具体的一个细胞特征。具体的一个细胞增生,它所处的微环境的一个分子特征。
32:06
哎,下面来看一下啊,当然这个分析呢,大家可以后续,其实单的分析并不难啊,并不难,但是有大家要知道有这么个事情。然后这都是一些关于基因模块表征的一个内容。啊,接下来的分析呢,主要是一些绿词聚类啊等等这个聚类,它通过了这个班的方法进行了一定的聚类啊。好了,还有一定的空间轨迹问题,这都是后续的课程啊,呃,这是可的内容,接下来我们要稍微聊一聊关于这个。班的内容啊,班这个方法呢,目前还没有发表啊,没有正式的期刊发表。
33:04
他没有,目前还没有正式的一个其他发表。啊,不过大家可以看一下,已经有已经有这个,已经有这个。啊,文献已经可以引用了啊。它那个主要特征是什么呢。哎,打不开。它的一个特征是什么?我们简单的来看一下,这个原理和前今天上午和空间空具的原理其实差不多,就是每个细胞类型,它确实会存在周围的一个细胞类型。哎,周围的细胞类型,这个周围的细胞类型组成了这个特定细胞类型的一个生态位的一个问题。
34:01
这个时候打开嘛。组成了一个周围生态会的问题,呃,我们这个作者认为啊,我们既然考虑这个细胞类型的,呃,聚类,包括它的微环境,那我们既要考虑这个细胞的本身,哎,也要考虑它的一个周围细胞类型表达的一个情况。这就是简,它简单的一个示意图,就说第一方面,我们在剧里的时候考虑两部分,第一部分就是它本身,它的表达情况是怎样的。第二个呢,就是它neighbor else,就是它周围细胞类型,它的一个基因表达情况是这样的,就是说要分成两部分同时考虑,这样考虑的结果呢,才是一个全更加全面的结果啊,更加全面的结果。其实大家也在,其实大家上了这几节课,也都慢慢发现了,其实关于空间转入组的方法,很多时候会比单细胞复杂得多。
35:03
他没有单细胞那么简单粗暴的一些好的分析内容,更多的是需要大家进入一个更深层次的一个思考啊,思考很多内容啊,大家不接触根本就不知道,嗯,像之前我做空间导组分析的时候呢,大多数客户呢,还是说诶我用单细胞思路做一遍。嗯,结果做出来的结果很多都不对啊,很多都不对,所以说呢,大家这个空间思维要慢慢转变啊,一旦涉及到空间位置,哎,这个空间位置的一个维度的一个分析就非常的重要,无论是空间临近通讯,空间直播定位,还有空间这个。呃,基因表达等等等等,这三部分呢,就是我们空间领域分析的一个三个三,大家可以把它称之为三个主要的一个方向三板斧啊。哎,接下来呢,这个软件就认为,诶,我们在分析细胞类型的时候,一方面要分析细胞类型本身,另一方面也要分析细胞类型的一个。
36:03
周围的细胞类型的基因表达特征,通过这种分析呢,大家可以看一下。区域B诶的微环境,区域A的微环境,通过这种微环境基因表达的一个分析,从而对这个空间区域有一个更深的认识,同时也表征了不同样本之间,它的这个微环境,它在基因表达上到底发生了怎样的一个差异。大家有没有发现这种三种差异,第一种是配错体水平,第二种是从这个细胞类型的水平,第三种就是从这个基因表达的水平,三个水平基本上都可都囊括到啊。然后他举了一些例子,不过他的例子主要s select的精度要比时辰高一点啊,但是我估计大家用的多很多啊,大家可以看一下这个帮。没有空间这个信息的时候,剧烈的结果就相对弥散,有了这个马克来考虑它每个细胞的微环境的一个基因表达的时候,它整体的剧烈表现就会好的多。
37:03
就会好得多。包括这些其他的一些例子啊,这些污染部分的一个地方,也会因为他们微环境的不同而逐渐的一个分开。呃,因为微环境其实区分细胞类型还挺明显的,就像上午,呃,就像今天下午讲到那个课一样,呃,不同细胞类型,它和其他的细胞类型之间的一个空间定位关系其实是不一样的,像成纤维分成了四个芽类啊,只有其中的一个亚类和MQ细胞存在很强的一个宫定位。那么这样的呃情况下呢,根据固定位之间的一个,一方面根据自身表达,另一方面根据它的一个周围的生态位的表达,两者之间相结合的时候,对他一个组织区分,尤其细胞类型的一个认识和区分啊,就会更为的精准啊。等等等等。这边我讲,我推荐大家回去好好看一看,不过今天呢,我们的给大家简单一些介绍一下它的原理,大家在用的时候啊,知道要怎么用啊,因为空间这个生态灰的基因模块嘛。
38:07
有的时候用的并不多啊,用的并不多,他只在特定的情况下会用啊,哪些啊,这篇文章有了一个很好的事例啊,我们待会再看一下啊。嗯,当然班我们聚类的时候呢,当然可以借助它的空间信息进行二次聚类,嗯,聚类呢,它如果说我们就和普通的那种外一样聚类,聚类的时候呢,只用这个kca或者harmony。哎,他不考虑空间信息,像这个他不是说和那个ST那个方法SME考虑空间像素问题,他是考虑这个空间的一个自身表达和周围细胞类型基因表达的两个问题,也就是说他考虑两个矩阵,一个是基因表达矩阵,另一个是离基因表达矩阵。呃,两个矩,两种矩阵相结合产生的这个聚类效果,当然要比这个本身的一个呃,聚类效果区分度会更高一点啊。
39:05
哎,通过这种表达,可以满满明显发现他的剧烈,结果会很好。啊,但是呢,我们这边用八克这个方法,其实并不是想让他帮我们更好的区类。而是让他帮助我们来识别这个真正的细胞亚基,他的基因模块就是基生态位的基因模块。呃,一旦有了这个生态位基因模块的时候呢,对我们后续的一个分析,生态位有一个很强很很好的一个作用。比如说这个,嗯,某个细胞亚型,呃,某个细胞类型分了三个亚型,它的既然能分型,它的周围的一个生态位的也也也会存在明显的变化,通过它周围明显的一个基因表达一个变化,来分析它的一个基因的一个特征,有非常的。哎,非常非常的贴切,呃,贴合我们空间转度分析的一个内容啊,包括我们这边的一个分析,大家可以看一下,大家可以搜一下这个方法。
40:09
呃,对这个方进行聚,它这里主要是运用了这个方进行聚类啊。呃,聚类的时候呢,当然了,聚类的结果会比这个。就类的结果会比这个普通的那种。嗯,我们只考虑分子聚类的情况,稍微好一点,稍微好一点。嗯,但是整体情况还差不多,嗯,只要污染不是很严重都差不多,但是污染一旦严重的话,就要配合操,肯定来进行一个下格分析了。然后就是。呃,然后就是内侧具体的转入程序,嗯,这个地方呢,就是前面提到的我们目标细胞类型,它周围的基因表达的一个情况,形成的这个转转program,诶,是我们空间上分析的三板斧的其中最后一版斧啊。就是说对这个空间转录组的一个口入管理,首先要分析这个病人单个的。
41:03
哎,就是它恶性细胞,恶性细胞它本身的这个。单个的这个周围的这个基因表达的一个模块,大家可以看一下F管D它这个地方呢,为什么要用这个呢?其实因为呃,很多时候啊,恶性细胞类型。恶性的这个细胞类型啊。啊,它可能细胞类型是相同的,但是因为生态位不同。而导致了它这个预后会有明显的差异啊,这个和之前讨论的这个细胞类型固定位很类似啊,因为肿瘤区域含有重纤维,它就是热性,不含有成纤维,它就是啊愈后嗯,向好的方向进行一个发展啊。然后呢,它会识别马,这里面就是我们的这个。Program。啊,对,每一个这个class,这个class的就是结合了空间生态为基因表达的一个结果。然后挑选出填多少个作为它的一个模块。
42:02
哎,这个模块的表现体征呢,就在这个地方。大家可以看一下肿瘤核心。血管浸润和这个气血,呃,整体的一个分布呢,大概是这样一个分布,通过它的生态位的一个进行表达分布,它会得到一个。啊,对它进行一个整体的一个表征,大家可以看一下它通过这种分析。通过分析这个周围的生态位,也就是周围的一个细胞类,呃,特定细胞类型周围的一个基因表达的情况之后呢。对他进行一个呃。嗯,对他进行一个显著的一个分析,分析得到啊,显著的这些基因呢。然后进行一个他负极分析,负极分析的结果呢,那他明显可以看出来很多基因啊,很多模块。他复集到了不同的一个通路里面,哎,摸到123等等,复集到不同的通路里面,这些不同的通路呢。
43:06
这就不同的通路呢,慢慢的它会过渡到就是我们真正实际应用的一种情况,前面分析得到的这种生态会的基因表达模块呢,它会去和临床相关的这些内容呢,进行一个关联。也就是说这些基因模块和这个临床预后好坏是否存在明显的一个关联性,呃,是他分析的一个,呃,甚至是他这里强调的一个重点,他在分析相关的模块的时候呢。啊,发现这个高模块的这个细胞。大概率会和这个。哎,这个等流诊断的一个。很会说,我看一下。进一步把这个肿瘤学家。唐是为了分析MODEL1,呃,标记这个肿瘤核心围着高的肿瘤细胞,大家可以看一下这个细胞,它分析得到这个生态为的这个基因表达信息呢,一旦得到这个MODEL1的这种基因表达的一个模块,他认为就是一些,他认为这是一个肿瘤核心,就是说富含肿瘤细胞的一个达。
44:11
区域的一个特点。哎,MODEL2档主要是血液的一个。哎,对于这个。临近这个肿瘤核心这个区域摸二是一个区域的一个,就是血管的一个功能。然后对其他模块也进行了一定的形态学的一个表征。嗯,对其他的模块也进行了一个表征,其实这里面就是对空间转录模块。空间总模块,哎。对这个整体的一个临床,包括肿瘤区域,包括这个预后的反应的一个影响。
45:00
这里面它同时还比较了这个线粒体基因的一个在这个这个这个逆,逆就是刚才提到的位基因表达观察同学显著的差异,但不是这种动态的变化,决定性的变化为。呃,这个为什么他一定要这个分析这个内容,其实他主要还是想和这个微环境和这个临床啊进行一个关联,临床的数据和这个。啊,临床的数据和这个。生态会的这个基因表达信息进行一个关联之后,看看能不能从这个微环境的方向寻求这个医学研究的一个突破啊,接下来呢,就是不同的不同的一个啊,细胞类型,它的一个生态会的一个。不同的细胞类型,它的一个生态位的一个基因表达的一个呃基因表达特征的一个呼吸。
46:01
简单看一下这个图就是它接下来就是每种细胞类型,它这个生态外基因转化特征的一个呼吸啊。简单看一下就是大家可以看一下啊。啊,包括对他这个,呃,当然这里面测NGS啊,其实相当的内容相当的多。通过这个分析它这个历史,这个周围细胞类型基因表达一个特征呢。哎,他会明显看得出来这种基因的明显的一个。这明显之间的一个变化,尤其是这个相同系统。先表达信息的一个特点啊。
47:04
嗯,这个地方呢,它如果大家读的比较深入的话,就会发现。嗯。读的时候就会发现呢,他对这个所有样本啊,进行一个进行了一个肿瘤的一个分析啊,分析的一个区域呢,就是刚才展示了的四个区域,呃,肿瘤核心区血管区啊,这个经急区和这个坏死区,缺血坏死区啊。呃,当然这个聚类的结果一定要和宾语学相结合啊,等会这个都聊过了。最关键的地方是后面的这些地方。最关键的就是它对于这个通过结算机目标细胞类型进行一个分析之后呢,通过通过分析每种细胞类型之间的一个逆识啊,就是它的一个周围的细胞类型基因表达的一个特征。
48:11
分析得到肿瘤清洗区各个区域之间的一个。呃,历史的一个基因,表达一个特征,从而对它进行一个详细的划分。嗯,其实归根结底啊,这还是研究微环境的一个,就是细胞类型特定微环境的一个内容啊,内容其实内容。并不是很多啊,并不是很多。这个方法呢,目前引用率不多,这里面只是给大家提醒一下啊,提醒一下知道有这么个方法啊,万一在后面的分析中遇到这样的问题,可以进行一个数据的一个探索啊。好了,我们休息五分钟,休息五分钟我来跑一下关于这个班级这个代码啊。大家有什么问题可以在这个聊天框里边发啊,聊天框里面发,待会儿聊一下啊。
53:08
它并不是说那个替代SP聚类的新的聚类方式,它只是计算了一个每个细胞类型周围微环境的基因表达矩阵,它其实是计算了两个矩阵。这两个矩阵它剧烈的时候呢。我这个当然这种剧烈方式还用的不是很多啊。呃,如果说本身用分子聚类,包括他自己也是用哈布聚类,它只是形成了两个矩阵,一个矩阵就是我们原始的分子矩阵啊分子矩阵。Port的基因矩阵啊,另一个矩阵就是port的它离域基因矩阵,这两个矩阵它同时要分析这两个矩阵的内容,并不是说它也是一种新的聚类方式,只不过它是形成了一个新的矩阵,这矩阵啊可以用下游个CC阿,这种聚类方法啊,一个区分,只不过内容不一样,一个是它的基因分子的一个具体信息,另一个是他的微环境具本信息啊。
54:06
微环境剧烈信息主用主要是用来识别它的一个。微环境的一个这些模块的啊,这些模块。这种方法呢,目前引用率还不是很多啊,但是确实很有价值啊,有空可以聊一聊,不过这种聚类啊,大样本才可以啊,小样本就别做了啊,比如就只有一两个样本就不做了,主要是大样本才可以用这种方法啊。因为就是微环境确实对这个细胞类型的影响非常大啊,所以在他研究微环境的基因表达的时候,确实能发现很多有意思的问题啊。好了,我们来跑一下这个办公室啊。
55:00
啊,这两个方法呢,其实相对都比较简单一点啊,简单一点。但是他这个数据结构理解起来比较费劲,他不是那种典型的我们这个。嗯,八达RD那种结构啊。我们来看一下。启动我们的R,然后加载我们的这个包。里面就用到这个B这个包了啊,包括都要用。大家用的时候呢,对这个大样本,嗯,具体的实际情况呢,就是前面提到的这个大样本量的一个问题,一个问题呢,就是。
56:06
呃,算法上的一个改进,就是说我们一定要分在空间上,既要分析细胞类型,也要分析它的微环境,这是两个很重要的信息啊,前面的时候呢,更多的强调是细胞类型本身这一篇教程呢,主要是强调微环境,微环境的一个内容。啊,当然环境影响人啊,环境也非常重要啊。大家不要把环境。啊,怎么说呢,就像今年一样,失业率这么高,大家也很很很难逃脱这个环境的影响,所以说很多时候,比如说我分析为什么我要我会失业呢?哎也会分析大环境,大环境可能环境不好,就像细胞类型一样,为什么肿瘤清斜的这么快呢?哎也要分析它到底处在一个什么样的环境,这环境到底表达什么样的基因,是不是主要表达一些。促进肿瘤生长因子的一些基因呢,包括刚才提到那个文献提到的。哎,它主要表达了一些什么血管区啊,侵袭区啊等等,它的模块基因在这表达就会促进肿瘤的一个生管延伸。
57:05
嗯,拿到这个某某MODEL3的个基因的一个内容,包括他对他的基因进行那个复集之后呢。就会发现,哎,肿瘤侵袭到底需要什么样的一个环境,这个环境是不是能破坏它呢?会好一点呢,对吧。这都是一些科学研究问题啊,我们目前单细胞空间拿到这个病理切片呢,更多的是要认清问题的一个本质。当我们认清他了之后呢?后续。啊,认识问题才能解决问题嘛,对吧。那接下来我们看一下整体的一个内容啊。嗯,万科解决方法需要两个内容,一个是基因表达举证,举证内容。啊,金炮啊。这个地方写多了。
58:05
一个是集体表达矩阵啊,这个矩阵呢,就从我们里面的原始矩阵抽出来就可以了,另一个是我们的位置信息。因为他要计算这个生态位基因表达信息,所以需要位置信息,通过计算这个该位置周围的位置的原因啊。然后就是过滤,这个过滤呢,其实它本质的过滤就是过滤那些没有生态的点,以及它这个。仅仅表达过低的一个点。没忘了。里面找了一行,写个漏。嗯,关于班开的教程呢,我已经搬到简验书上来了,大家有空可以看啊,我写脚本的时候写的要稍微注意一点啊。这行代码漏掉了。形成这样一个。啊,数据结构,那个数据结构和我们普通的那种rds数据不太一样,大家可以看一下,它很多内容都不太一样。
59:04
我的矩形都放在这了。而且到了是没法取。了,都是刀了,气的太刀了,艾特了,吃错了。大家可以看一下,他把我们的矩阵给读进来之后呢。线粒体这样读的还挺多。这是我们的原始铝的啊,原始。Account。这是我们的原始矩阵,哎,就在这放着。啊,这个元素矩阵还是我们的分子元素啊,分子元素。嗯,接着往下的话,就会进行一定的过滤,这个过滤呢,主要是过滤一些,首先是和他文章讲的那样过滤一些。啊,相率高的呀,等等等等,嗯,还有一些呢,是这个没有生态位的,就是边缘的,那也需要大家可以看到这些在可能去看。
60:22
嗯,大家可以发下这个函数看一下,那很多这个函数内容啊。啊,都是一些有一些默认,大家在处理的时候,其实不要过多的一个干预它,尤其是指控的时候,只有一些关键的参数进行别人干预啊。然后阈值就是对它进行预值这个处理,消除异常值啊,所以是异常一个消。嗯。这个地方呢,原则上讲我们要做这个clean啊clean,但是我建建议大家一开始就做,就是拿到时长这个结果,一旦发现自己的铺边很满,或者说是总样本。一开始就做,做完之后呢,再进行下游的调用具啊。
61:04
呃,交换之率之后呢,拿到这个rds之后呢,如果想分析生态问题表达,哎,我们再进行一个。八个的一个分析啊,八个分析包括K稍等稍等。标准一些关键之间计算这个因子。然后对它进行一个区域化。这这几步啊,前面都是一些常规的一个处理啊。这句话的内容呢,就放在这个。高啊,这个count是原子另外一个normal抗就是进行了一个化的一个过程。哎,整体来做后,均匀化,它的值开始发生了变化,哎,变成了小数啊。然后呢,就要进行一个包的一个分析了,这个分析呢,会有一些关键的参数给大家供大家一个筛选,这个地方呢,第一个参数就是要设定这个计算AGF计算这个领域啊。
62:11
计算邻域的这个平均值,并且计算它,诶这个这个值大家可以看一下。这是挺有意思的。方位这个过滤,呃,过滤过滤器,方位过滤器什么意思呢。就是说他计算领域的时候呢,要对这个方位进行一个矫正啊,矫正一个矫正。然后lambda等于零的时候呢,嗯,是没有空间的一个,就是说不会考虑生态位的一个具体信息。嗯,拉达等于0.2的时候,就考虑这个box,就是刚才考虑那个生态位的具体信息。这个地方我们把这个两种信息都选上啊。一个是不考虑空间,另外一个考虑考虑空间,也就是考虑生态外机这个地方是选择淋浴的数量,像我们十乘呢,就选择六就可以了,如果大家用的是LA这个或者华大数据这个数量要稍微多一点啊,因为空间的点一个点就是和周围六个点一,但是像华大那种合的并很少的话,适当要多一点啊,适当要多一点。
63:15
啊是X型的1000啊随机种子啊,设置机种的。然后是软板水。那又慢等等等等,这些都是一些简单的操作,这个操作都是在这个诶。啊,没有地方子computer。他妈的,漏掉他妈的。这个地方要计算啊。计算的时候呢,参数就按照我这个来设置啊设置。
64:02
计算的时候,大家可以看一下计算淋浴的一个空间,它的淋浴数量是六啊,我们计算六就可以了。计算和M等于零,M等于。这个地方呢,它会多两个矩阵,就是我们刚才提到的领域空间,领域基因表达信息的一个矩阵,它会放在这个地方。对。高冷。高会多两个,哎,一个是H0,一个是H,这个地方为什么会多两个呢?第一个它就是计算这个这个这个等于零的一个情况,大家可以说一下这个东西什么。
65:00
没有他的解释,那我们来看一下他这一步了啊。函数的一个解释啊。函数的一个解释,大家可以看一下啊,SE它是是它的数据结构S,这是指定包括坐标的内容。计算这个AF,一个逻辑的SC,呃,是否都计算这个AGF啊AGF就是我们通常都是要计算,包括空间模式啊,空间模式这个大家不要管啊。直接平均值就可以了。然后我们主要看的是这个。他们是哪个仓库?他们是这个啊,就说这个。就这个。也就是说它在本身这个计算的过程中啊,会进一步计算最高的这个空间方向的这个内容值啊内容值。
66:20
真的也就是说这个内精啊,其实它本身啊,就是在计算这个。周围六个细胞的一个被物质M等于零呢?M等于零的意思,大家可以看一下它这个基因值的一个基因值的一个特征。他把那个矩阵放在这儿。大家可以看一下它的值的一个什么,包括H1的。
67:01
整体的变化呢,就在于它整体的一个矫正的一个矫正的一个程度啊,矫正的一个程度,通常我们会去H,通常我们会去H1的一个结果啊。这个矫正呢,其实它基于这个。这个原理呢,大家呢,回头可以看一下它那个方开式这个方案,呃,他在这个矫正的时候啊,很多方法都很不太好理解啊,不太好理解。都不是太好理解啊,因为这个方法出来的时候确实比较新颖。他没有这个解释。不过从这个我读完文章之后呢,会发现它其实对本身的这个值啊,其实更多的计算领域的一个值,这个领域的值就是物理空间,呃,物理空间这个值呢。
68:12
回到我们的代码,就是物理空间值呢,它会计算这个。等于零和等于一的一个情况,通常情通常情况下,我通常情况下一般会选择等于一的这个情况。它这个基因值呢,整体的变化不大,但是会进行一定的过滤角度,比如说这个值。那0.59。但是在这个he的情况变成0.2米。嗯。我们来搞,我们来搞清楚他到底是要做什么。
69:18
就是这个值去啊,和这个值的一个关系,你看一下那个值到底是在说什么。就是这个M值,我们刚才那个零和一呢,都是M值在起作用。我的旺子又是准啊。前女友。这些词好多都是专业词汇,我们再翻译一下。指定要计算的最高方位角傅立叶斜波的整数标量啊,好专业的一个词汇啊。
70:06
好专业的一个词汇啊,对于我们非数学出身,真的好难啊。然后over the argument。这个方位词到底是什么意思呢?其实从文章的一个。嗯,从文章的一个数量来看,其实更多的还是指他的一个。就它的一个生态位的一个。嗯,方向作用啊。不过我们一般零六就可以了,不要选太多啊,不要选太多,选出来这个值啊,都是计算生态位的一个平均值就可以。通常我们会选择1HE啊he作为它生态位的一个新的一个基因矩阵。这个矩阵一旦拿到手之后呢,这个矩阵一旦拿到手之后呢。就表明我们获得了。各个port,它周围的生态为基表达这个信息啊,接下来干什么呢?接下来就要进行一个按照它官方的一个教程,或者说按照文献的一个主要思路来讲,他就开始进行降为聚类啊。
71:13
积累。但是这种教育积累并不是我们想要的这种教育积累啊,这种想要的。我们想要的这种还是想要这种生态位基因的一个差异,所以说这个地方,呃,细胞定义就显得非常重要了,比如说这个这个bar里面还有我们目标细胞类型。那他们这个基因表达集呢,就是我们目标细胞类型作为生态基因表达的一个特征啊。嗯,这个地方还是需要你用多样本表多样本的一个情况。就是说正常的细胞类型,它的生态危基因水,还有疾病类型,它的增量维持。两者之间基因生态位的一个基因差异就是我们刚才要提到的基因模块,这个基因模块体现的就是即使相同细胞类型,由于微环境的差异,也会导致整体的细胞形态发生明显的改变。
72:02
说白了,还是空间结构发生改变的一种衡量的标准。哎,接下来就是他们简单的一些交维聚类的一个沟通啊,其实呢,这个地方已经下下游的分析呢,都和那个文章的内容基本上是一致的。大家可以看一下,基本上都是用M1的一个结果啊,用M1的结果,我们将来分析生态会进行表达信息的时候,也是要用M1的啊。啊,接下来就是一些绘图了啊,绘图的时候绘出来的图呢,就和文章这个图差不多了。哎,这都是一些简单操作了,这个绘图也有个毛病,他没有底片。也就是说本身啊,它并不是为视频所设计,而是为这个。嗯,本身并不是为事生所,自己最终还是为这个。
73:01
嗯,最终还是为那个刚才的那个提到的那个。来的最远那种设计。整体的一个过程呢,就是这个样子啊,画出那个图呢,就是刚才文献的内容就是说。它的一个新的一个关于空间生态位的一个聚类的一个啊,这个地方它也是用生态位聚类这个啊。呃,往下分析的时候,就开始分析基因模块,这个基因模块其实更多的是差异经啊,然后差异经因进行一个集中度的一个体现,就是它的一个生态位基因模块。当然这个方法不是,诶,目前还没有什么很重点啊。好。嗯,因为这个方法我觉得比较难,我个人都觉得比较难,它的一个,呃,当然它原理很简单,就是计算一个点和周围的点的一个生态位的基因表达的一个特点,但是真正实施起来的时候,大家会发现很多时候啊。并不像大家想象的那么简单啊,所以说这个做好客服啊,还是一件非常难的事。
74:06
非常非常,我个人感觉非常非常。嗯,接下来往下就是画一些图了,这些图呢,大家回去画画就可以了,大家如果有感兴趣的话,把这个结果拿出来看啊。哎呀,这个定义的信息呢,大家就呃讲到这里吧,它聚类出来的图呢,其实就是刚才那种,呃,两种图都要看啊,都要看,一个是这个呃分子聚类图,另外一个是添加了这个增态位聚类的一种结果。虽然他们整体上呃,结果应该是差不多的,但是会有一定的偏差,偏差通过这种生态位的差异来矫正空间的一个距离结果啊。
75:00
啊,包括小姐姐大家可以看一下。M1拉姆零拉零就是没有空间,大家可以看一下这。啊,当他考虑空间生态位的时候,当然它大家可以发一下它划分的这个群啊,可能更更多一点,更多一点考虑生态位题,那就会引起细胞类型,它的一个呃边界啊等等,因为添加了信息,所以对它的划分的精度啊就会高一点啊高一点。当然这不是我们最主要的,最主要的还是拿到这样一个举证,拿到这个。就是刚才提到的那个矩阵C。拿到这个一,就是这个增态位基因平均表达值的一个矩阵,这是我们这是我们最重要的一个内容,拿到这个矩阵之后呢,很多下一步分析就开始朝着更加深入的方向进行。
76:01
比如说两个样本的这种生态位矩证,大家都拿到之后,嗯,某些port它的一个某些port它的一个生态位进行表达是这样。哎,里面富含了龙门目标细胞类型,呃,另一个门富含我们细胞类型,它的生态位表达是另外一种状态,两者之间取压易取交基因,大家就会明显感觉到这种基因排布,空间排布到底发生了怎样一种变化啊。嗯,这篇文章呢,确实也非常的讲究啊,空台的讲究这个空间这个基因模块的基因,呃,空间生态位基因模块的一个划分呢,也非常的这个想法很好啊,这个想法确实创新也很好,所以他。虽然只发到了这个C,但是这个想法设实非常好,也借鉴了一些上未发布的一些高端的方法啊,马拿到这个空间收代或者经营模块之后,对我们空间呃,空间形态学这个认知啊,确实起到了一个非常好的一个榜样啊。
77:03
好了,关于班我们的讲法和写法啊,这个方法目前就这篇文章在用啊,目前还没有其他更多用的方法,因为空间文章现在还少,所以这些方法呢,大家要知道啊,等到你用的时候,大家要用一下啊。漫画分析课程。呃,模块分析课程呢,那个就是那模,至于模块该怎么分析大家呃,拿到那个生态位的这个临呃生态位呃基于表达矩阵之后,至于这个模块该什么东西,大家借鉴,单写过就可以了,无论用NMF还是这个WGA都可以。大家回看就可以了啊,但直播的内容真的我就不讲了,这个空间的课就不讲了啊,关于NMF和这个WG行为,嗯,如何运用寻找这个特异性模块的内容,这个单细胞已经讲过了,大家可以看回。应该大多数课程都会讲啊,大多数其他的培训班关于原细胞这个模块的寻找应该都会讲到,大家回看一下就可以了,只不过大家要注意,如果用的是分子矩阵,就是原始矩阵找到的模块是它自身的一个差异,用这个生态位的基因矩阵找到了这个差异是它微环境的一个差异啊,这两种差异要区分开,这两种差异要区分开,然后通过这种两呃微环境的一个基因表达的一个差异,负极等等这样一种这样一种分析呢,其实等同于的分析它微环境的一个变化。
78:27
比如说微环境,它经过差异分析,分析到哪些基因高表达低表达,负极到哪些通过的情况下。啊,其实就是还预示着我们环境的改变啊。嗯,有的时候呢,可能大家这个这种情况一般,嗯,再给大家最后再给大家强调一句,为什么要分析这个生态位题表达呢?呃,其实在很多情况下是有这样一种现象,就是说我们对空间转路口进行分析啊,发现它的细胞类型本身变化差异并不大。
79:00
就像这个肿瘤细胞一样。种瘤细胞,它都表达那些基因,但是就愈合好愈合差的这样一种区别。从它本身上已经很难知道这个问题的所在了,这个时候就会转移到它,这个生态就是微环境基因表达的一个内容。这个时候呢,大家就可以明显感觉到,哎,它的这个差异主要是微环境带来,而不是自身的,虽然都有表现出一定的侵袭性,但是微环境的基因表达特征呢,抑制了它的侵袭性,或者微环境表达促进了它的侵袭性。就会导致完全相反的两种结果。这就是对基因生态位。啊,生态位经营模块分析的一个重点关注的啊,这个只有在特殊情况下大家才会用啊,一般大家分析的时候用这个空间邻居风序和空间生态位,嗯,空定位一般就可以,但是在某些特殊的情况下,确实需要分析它这个。空间生态外基因表达的一个特点。
80:04
尤其是在这个本身的这个细胞类型分析分析不出更多差异的情况下,那我们就要转移到它的空间位置上的一个差异了,这就是一个很好的方向,呃,因为从空间来讲,确实空间。既然有了空间信息,那么空间领域信息也属于空间信息啊,两方内容并不冲突啊,相辅相等,大家的分析的时候一定要相互结合来看啊,相互结合着来看。拿到这个矩阵呢,再往下走就是抽矩阵,差一负极了,这个内容我就不往下讲了啊,大家一定要把这个前面的入审结果相结合起来,比如说有些port含有我们目标细胞的一些人,就把这些port抽出来。来得到他空间领域基因表达的一个特点,两者之间无论做差异还是做负极,还是怎么样做比较,体现的都是生态位的一个差异,生态位的差异如何影响目标细胞类型,其实还是一个值得研究的课题啊,这些就和我们更加诶背后更加更多的一个生物学内容。
81:06
要结合了。啊,再往下走就非常难了啊,尤其是这种交叉学科分析的结果,如何和生物学进行联合解读,其实这个目前还是一个很真的课题啊。行了,大家有什么问题吗?没有什么问题,我们这节课就结束吧啊。
我来说两句