2024第10课：单细胞空间联合分析之MIA原创

2024-07-152024-07-15 21:33:24播放2.9K

点赞0 收藏 0

2024第10课：单细胞空间联合分析之MIA

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:02
哎，好了啊，时间到了，我们来讲我们的第10课啊。啊，随着我们课程的越来越深入啊，讲到的内容也会越来越个性化，这里面强调一点就是大家一定要把自己的基础给哎做好啊，前面所有的分，呃，这里面所有的个性化分析啊，都是前面的基础分析一点一点的演化而来的。哎，如果前面金属没做好，或者说做的有偏差，甚至说是错误的。哎，那后面的个性化分析就，哎，完全就没有做的价值了，即使做的再好也是错的。嗯，这也是为什么现在公司啊，对于个性化分析做的不多的一个原因，就在于前面基础分析。哎，要做的非常好，而且很多老师呢，把这个数据拿到之后呢，自己做了很多的基础分析要求哎公司做个性化分析。然后分析了半天，发现，诶，很多都是有问题的。哎，这个时候呢，就会引起很多的一个纠纷啊，所以说大家如果自己做项目啊，自己的数据，哎，一定要把自己的基础给弄好，给做好，哎单细胞分析这块一定要做好，定义一定要准确。
01:15
呃，包括其他的各种各样的个性化分析，一定要非常的准确。哎，空间就更不用说了，空间一定要在诶，因为空间自身啊，自带多组学的一个性质。哎，分析起来难度会稍微高一点。哎，这个时候也会要求精，呃，精准就是准确性啊。而且一环套一环，大家随着大家分析的越来越深入，哎，都是基于前面的一步或者两步而来啊。好了，接下来我们来讲我们的第10课。单细胞空间联合分析值。M是什么意思啊？M是model多主学的意思。I呢？Intersection就是说交叉的意思，A呢就是analysis，就是分析啊，这里面大家先看这个题目，单细胞空间联合分析，首先第一步要干嘛？
02:11
哎，先把单细胞分析好啊，先让我把它进行很好的注释，并且拿到它的差异经，那空间呢。哎，空间要画好分区，或者说用聚类的方法做好聚类。哎，这两两步做好之后才能做我们现在所提到的mia啊。关于mia啊，它的一个方法，哎，检测方法其实大家一直在用，哎，就是超级核大家做那个，呃，单细胞在负极的时候用的就是这个方法。就是大家用那个class profile那个R包进行这个单细胞，呃，生物学功能复制的时候，用的就是转简单的这个方法。只不过现在这个方法呀，被用在了这个单细胞空间联合上的一个，呃。
03:00
这个一个应用中。呃，其中呢，大家对于一些生物学常见的一个，呃，统计学的一个分布啊，要有一些基础的。哎，了解，比如说对于对向量进行分布的时候，要分析它的中位数，众数。平均值方差等等这些基础的指标，那对于数据的分布呢，啊，有一些比如说二项分布。呃，坡松分布。嗯，高斯分布还有一些，这个就像今天讲到的这个超几何分布一样，大家一定要有一个基础的概念理解。哎，方便我们后续的使用它。其中呢，我们在做这个mia的时候，它主要用的就是超几何分布，哎，超几何分布检验通常是来用来对这个文恩土，哎，文恩图是呃两个圈的overlap进行显著性的交呃进行检验。这个韦恩图啊，大家可以看一下，我放了一个韦恩图的例子。
04:02
2个圈代表2个group。哎，就是大家拿到的那个单细胞的茶叶基因和空间的茶叶基因，对吧，他们有交叉，比如说交叉了10个。哎，也有差异性，就是说每个组有独立的一些差异性。超几何分布呢，就是为了判断在这个差异性，哎，就是中间这个10。是随机存在，就是说随机的就可以拿到10呢，还是说是刻意安排的。如果说是刻意安排的，那说明这是。非，哎，不是那种随机的现象，而是具有一定的生物学倾向。哎，这个时候呢，它代表了生物学本身的一个选择。说明这不是随机现象，而是生物学，哎，固有的一个选择是有一哎外力来这个主导的。哎，这个时候呢，我们就会拿到一些关于哎，超级和分布带给我们的一些生物学意义的一个现象。好。
05:01
呃，下面这张图呢，呃，下面这段话呢，其实简单的就是一描述，对超几何分布检验进行一个描述啊，就是说给另一个超几何分布，哎，超几何分布是什么呢？就是说。简单的也用用一个抽球的例子来说，就是说。哎，抽球，比如说总共30个球，哎，10个白的，20个黄的。那我不放回的抽5个。哎，不放回的抽5个啊，不放回我要随机抽出5个出来。那么白球的分布概率，呃，分布分布的一个呃，这个曲线就叫超几何分布。啊，那么如果我想知道，哎，我每次去白球。诶，取出来3个。呃，我想要的颜色的球的概率是多大？哎，这就是超级和分布的检验。啊，大家可以回头把这个哎了解了解啊。给您一个超几何分布，哎，就是刚才提到的，哎，有30个球，10个白的，20个黄的，哎，我不放回的抽5个，哎，发现。
06:07
呃，算出某个比某个事件更极端的概率，比如说5个黄，呃，5个白球。我要计算一下这5个白，呃抽出来这5个球都是白球的概概率啊，正常来讲它呃白球和黄球是1:2的一个比率嘛，那抽5个大概有1~2个白球啊，呃3~4个这个黄球黄球。但是如果我。计算一下。抽出来5个球都是白球的概率它当然非常低了，对吧？哎，说明它不是一个随机现象，而是一个刻意安排的一个现象啊，已经知道答案了，把它抽出来啊，这个时候呢，就是超级和分布检验了啊，这个大家要有一个简单的理解啊。这个文案图简单的就是刚才和刚才那个比喻差不多啊。呃，就是为了计算这个overlap。呃，相互之间overlap之间的一个显著性，显著性的一个问题啊。
07:02
右边是一个简单的例子，哎，也是R代码能够实现超几何检验的一个。哎，一个函数。首先呢，呃，有10个患者是吧，抽出来11个人。11个患者，呃，有10个患者，抽出有10个患者，哎，13个正常人，16个患者等等等等，其中呢，大家要注意这一个，诶对他的参数啊，进行一个简单的了解。首先16个人，哎，是16个患者对吧。13个人，哎，原本有13个正常人啊，说明总共的样本量是多少呢？总共的样本量是29个人对吧，29个人中有16个患者，有13个正常人对吧？哎，随机抽出来11个人。哎，随机的抽一个抽，抽出来11个人。随机的抽出来11个人啊。抽出来，诶，大于10个的货，大于10个的这个。
08:01
抽出来10个，呃，抽出来11个人中。有至少10个患者的概率。哎，通过这个函数就可以检验出来，这个为什么是10-1呢？这个地方它是为了减，它是为了统计10。及10以上，也就是包含10，哎10以上的这样一个统计学的一个概率，所以说哎，要包含10，所以减易以9为起点，哎，9不包含啊。啊，下面呢，也是一个简单的例子啊，简单的例子哎，和刚才举到的那个黑球黄球差不多，也是一样的，诶2万个黑2万个球，哎，黑球白球有多少个，从中随机的抽多少个，哎，希望知道哎大于多少个黑球的概率是多大？哎，参数是一样的啊。这个呢，就是说我们要计算某个事件发生的一个概率，就是说从这里讲，就是说抽到二百五十，265个黑球的。一个概率，这里面包含265。
09:00
所以说264以下，哎都不考虑，主要考虑265及265以上的一个出现的一个概率情况。哎，黑球哎白球哎呀，对吧，抽的数量，哎，就是我们抽取的一个数量，随机的抽啊，抽出来有265个及以上及以上的一个。嗯，黑球的一个概率值，哎，通过这个函数就可以把它给计算出来，这个时候计算出来的就是P值。呃，通过我们简单的一个生物学概念来讲，P<0.05，我们就认为是显著了。哎，P<0.05，我们就认为是显著了。啊，这个大家要有一个简单的概念啊，呃，当然我这里讲的不是很深入啊，但是大家要会用它。真正的超几何分布检验，其实还有更多更多的内容啊。然后呢，这就是超几何检验，哎，前面提到的都是一些具体的例子，哎，等把这个超几何检验运用到，运用到我们这个单细胞空间联合分析之上啊。
10:03
哎，大家要想一想怎么把它运用过来，首先大家常用的那个单细胞差异基因负极啊，用的就是超级核检验的一个原理啊。其中呢，大家有一些呃，比较注意的地方啊，其实把它就是把这个刚才的例子啊，转换到我们的一个生物学，就是单细胞空间的研究中。这种分布呢，其实是用于检验一组基因啊，当然代谢物可能也有，不过大家对这个代谢啊应该啊，上这个课的应该没有研究代谢的啊，就是为了研究一组基因。在某个特定学生物和功能类别中的负极程度。哎，首先大家要理解这句话，用于检验一组基因在某个特定的生物学通路或功能类别类别中的负极程度。也就是说这里面是两组。一组呢，就是这组基因，比如说我们CLASS1的差异基因啊，另外一组呢，就是。哎，某个特定的生物学通路或功能类别的一个基因，基因，哎，形成了我们的所谓的韦恩图，有两个组group，就是类似于下面这个两个组。
11:08
哎，这两个组之间有一些交叉的地方，哎，比如说中间这个265就是它交叉的地方，也就是说我们的一主基因和特定的生物学通路，哎，有有共有的基因。哎，也有不一样的基因，现在呢，我想要统计这个共有基因出现的概率是否显著。啊，如果显著，说明不是随机分布的，而是生物学独有的一种生物学现象啊，如果它不显著，说明是倾向于随机分布，不是生物学带来的意义。哎，明白了吧，就是把前面的例子啊，运用到我们现在的一个，哎，无论是单细胞差异腹肌，还是空间差异腹肌，还是说今天讲到的这个mia的一个分析过程中啊。当然了，大家分析的时候做负极分析，当然主要是go或者KGGG的这样一个数据库啊。
12:01
嗯，这里面对负极分析啊，稍微多聊两句，就是说超几何分布的，超几何检验的这种负极分析啊，是一种比较。宽泛的负极分析。就是说它的准确性没有那么高。啊，有的时候呢，在做负极分析的时候，可能会发现。哎，它的上调基因负极到这个通路，诶下调基因也负极到这个通路了，哎有这种矛盾的现象，哎，这是超级核检验，因为它比较宽泛的一个原因，所以说现在做负极啊，更多的无论是单细胞还是空间吧，用GSSE或者GSV这种基因排序的方式，哎，更多一点啊，更多一点。嗯，当然了，对于公司来讲，呃，基础的一个负极分析，还有mi的分析，还是用这个超级核检验啊，因为它比较宽泛，所以拿到的信息是比较全面的，有利于我们从哪从一个比较全面的信息里面提取我们想要的一个。哎，生物学内容。
13:00
好了，前面简简单的介绍了一个超级核分布，哎，包括超级核检验等等一个原因，接下来我们就要回到我们的正题了，就是我们今天讲到的单细胞空间联合的一个m ma.首先呢，Mia呃，第一点呢，和其他的单细胞，诶和上节课。嗯，上上节课讲到的这个单细胞空间联合分析的一个。哎，要求差不多一样，就是说希望啊。单细胞和空间的样本尽量的匹配，哎，严格上是要匹配的。但实际情况呢，很多时候是达不到的，尤其是空间刚出来的时候啊。很多客户他只拿到了，只去测了这个空间转录组。哎，没有测单细胞，哎，于是又去这个公共数据库里面找到找单细胞数据，进行一个。来联合分析，拿到这个空间的注释结果。那么这个时候呢，用哪种方式更好呢？如果说用解卷积的方式结卷机是一种非常精确的学科精确的方法。
14:03
如果你这个时候有公共的单细胞数据来结卷机，你呃自己的空间样本啊，实际情况会产生非常多的偏差啊，偏差偏差比较大。嗯，但是呢，如果用MIA的话，因为MV是比较宽泛的一种统计学方法，所以说呢，在这种情况下，Mia对这个。呃，非匹配的样本啊。这个兼容性就会更好一点，这也是为什么有的文章会用这个方法的原因啊。第2个就是空间域，哎，空间域在刚开始就说到了，空间要做好这个聚类分析，或者说空间划分区域，嗯。第7节课的时候给大家讲过这个空间多样本进行哈姆尼整合的一个方式啊，这个就是大家哎要学会的一个基本功能，对空间的预估的划分，就是说对哈姆尼进行。剧烈之后，哎，整合剧烈之后。要回到形态学上看一看，哎，它的剧烈结果是否符合形态学分划分，如果大致符合的话，说明我们的分析方法是没有问题的。
15:08
哎。这个时候我们就拿到了一个相对准确的一个空间聚类的一个结果啊。前两个呀，是大家的基本功啊，前两个是大家的基本功啊，第三个就是今天要讲的mia，就像刚才提到的那个，哎，VN.啊，简单的大家了解一下，呃，了解一下就是空间聚类，其实就是匹配不同的呃组织区域啊，当然这个组织区域如果你是病理学家，你可以自己画一画啊，如果不是的话，像我一样都是生物信息这样方面的研究人员的话，主要是依靠数据的力量进行聚累啊。这里面提到一个多样本的问题，就是多个样本空间数据整合是需要去批次的。哎，无论是CC和harmony，哎，都要看到这个去PC的效果是怎么样的。
16:00
这里面大家要有一个敏感度，什么敏感度呢？第7节课看4个样本进行整合分析的时候，会发现有的群在某些样本中独有，哎，有些样本中没有，对吧？那么在单细胞的层面肯定认为是批次了，但是在空间层面，哎，因为形态学的不同，这是正常的啊，就是要主要和形态学结合，另一个方面呢，就是说在空间多样本整合之后呢，哎，多个样本一起联合分析。哎，联合单细胞，这个时候单细胞几乎也是多个样本的。也就是说mi的分析，哎，现在。不仅可以用到一对一或者多对一，哎，现在也可以多对多，就是多个单细胞的样本和多个空间样本进行这样一个联合分析，联合分析呢之后呢，我们就可以看到每个空间的聚类结果，每个class的被称为每个逆啊，这个大家要规范一下，以后说逆齿的时候就是指空间的classlu，这个时候呢，我们就可以拿到单细胞，哎，细胞类型。
17:07
主要富集在空间的哪些历史当中？这些例词啊，可能在空间的多样的分布上是有差异的。但是细胞类型。如果负极在某个历史当中。哎，说明了这也是样本之间的一个差异啊。哎，这里面就有一点这个逆齿分析的一个影子了啊。接下来是呢，是一些文章的一个事例啊，文章的事例啊，大家不知道看文章有没有看到过这类的方法，首先是第一篇文章，这个是比较早的一篇文章啊，它主要就是运用这个mia的方法对空间域。就是空间的region进行细胞类型负极的一个分析啊，整体的一个过程呢，就是说拿了样本之后，既做了单细胞，哎，又做了空间。这篇文章当时发的时候啊，单细胞空间还是一个匹配的一个状态。
18:02
哎，匹配的状态。等到大家等到他拿到这个单细胞数据，哎，又拿到这个空间数据。哎，单细胞干嘛？识别细胞类型，并且对细胞类型具体的差异基因形成它的一个固有的差异基因，基因就是基因基因set啊。这个地方啊，大家做项目一定要精准啊，当然公司如果用mia跑流程，用，比如说嗯，单细胞class的123，它也可以跑出来结果，但是这个时候并没有什么生物学意义。大家自己在分析自己的项目的时候，前面的基础分析一定要过关啊，一定要过关，一定要对细胞进行一个诶准确的注释，并且拿到每种细胞类型它的一个。哎，差异基因基。那么对于空间呢？哎，空间拿到这个样本之后呢，首先是区域识别，哎区域识别呢，可以是人工划分，哎，比如说依据形态学进行人工划分，也可以是借助数据的力量进行联合分析。
19:02
哎，就像它一样进行联合分析，哎通过数据聚类的结果，哎对空间域进行划分。还是那句话，如果大家他知道他是什么结果区域。比如说海马区。就把它定义成海马区就可以了，如果不知导哎规范也点写逆啊，生态V1，生态V2等等，最终呢，拿到2个差异基因基哎，当然空间聚烈之后，它也会计算差异基因，这样的话会拿到2个差异基因基因。然后差异基，差异基因集之后呢，哎，经过前面介绍的这个超几核的一个检验方法，来判断这个空间区域内是否富集了某种细胞类型。啊。这个地方呢，就是一个简单的示意图了啊。Ma啊，目前在文章中运用的呀，已经不算少了。有没有一个细胞mark的表格呢？知道注释自己注射的对不对？
20:03
目前还没有一个金标准啊，目前没有一个金标准说自己注射的对不对啊，但是呢，大部分单细胞注释还是依据这个经验，就是大家多看几篇高分文献，收集他的马克基因进行注释。空间注释呢，空间注释相对于这个单细胞注释可能还好一点，毕竟它是个混合物，按照形态学简单划分还能看出来啊，单细胞是完全看不出来了，你换一个参数，它可能聚成别的结果去了，那这个时候就不太清楚到底哪个结果是对，哪个结果是错了啊，这个需要这个就需要大家哎，多看一些高分文献积累经验了啊，不过这个单细胞啊，现在来讲大类应该是没有问题的。问题在于小类啊，小类这个划分确实还存在很大的问题啊，比如说大类免疫细胞和组织细胞划分，这个还是没有问题的啊。哎，这个示意图呢，基本上就是刚才提到的mia了，诶一个group分成两个group，一个group呢，是这个单细胞来源的每种细胞类型的差异基因，比如说这个成纤维的这个这个成纤维拿到这个茶叶基因，形成了一个茶叶基因基。
21:08
诶，Cancer region呢，就是空间聚类的这个region。空间距离的这个region准，就是说空间的这个不同的，呃，一个固定的区域，哎，它计算差异呢，也有一个差异基因集，两者呢，有58个基因是进行这个交叉的，这个时候呢，我就要计算了。哎，我就计算什么，计算在这个cancer region中。是否显著负极了这个成纤维基因。成纤维的这个差异基因基。如果显出负极了，那说明在这个region中，哎，它比其他的区域。哎，有显著比较多的一个成纤维的一个细胞。哎，明白吧，这是它的一个概念，通过这个计算呢，计算出它的一个显著性的一个值。当然他进了LOG10P的一个。转化啊，这个值越大越显著啊，10:14点4已经在显著的范围之内了，说明这个区域显著负极了，这个成纤维的细胞啊。
22:09
下面这张图呢，和上面的图也是一样的，对所有细胞类型所有区域进行了一个显著性的一个分析，看看每个区域到底复制了哪些细胞类型啊。呃，右边这张图呢，就是文章来源的图啊，文章来源的图大家可以看到负极呢分两类，一类是显著的富极到了啊，还有一类呢，显著的不富及，就是说相比于其他区域，我这个区域。哎呀，比其他区域含有这个细胞类型更少啊，更少。嗯，这个区域这个这个地方呢，也是一样的，也是进行了一定的数据转换，就是说显著性越差。就是说，比如说显著性的1，那说明这种细胞类型在这个区域内完全是一种随机分布的一种存在，并不是显著负极的一种状态。然后呢，这个图呢，是文章来源的图，它的一个简单的一个。
23:04
呃，简单的一个解读呢，其实就是。哎，比如说这个区，这是什么区，哎，导管区，哎，Cancer region准区，大家可以简单的看一下啊，不同的3这三个区啊。经过mia分析之后呢，它复集到了不同的三种细胞，呃，不同的细胞类型啊，而且复集的这个程度啊，有高有低，你像cancer，呃，Cancer region准区域呢，哎，显著复及了这个cancer细胞，哎，当然这个符合生物学认知，这是一种，哎比较好的一个验证。啊，你像导管区呢，主要富集了导管细胞，哎，这也是符合生物学认知的，你像这个区域。啊，INS institute啊，主要分配了这个上皮细胞啊，说明它是一个组织区等等等等。Fiber基因是指高表达基因，高低表达基因都放去，还是只放高，只放高基因啊？大家要注意啊，这个基因group只有高的啊，只有上调的啊。
24:01
他们这个这个微音图除了名字一样，方向需要一致吗？方向需要一致吗？嗯，需要一致啊，需要一致啊，这个depulation是降低的意思吗？影负极是高表达啊，不是啊，影负影reach是负极的意思，就是说它细胞类型啊，显著的，呃，相比于其他区域呢，本区域呃，显著的有这个细胞类型的负极。Deulation呢，其实就是说这个细胞类型啊，分布的比较散，哎，它并不是一种负极的状态，而是一种散在分布的状态啊，说明这个区域啊有这种细胞类型，但是不显著，说明其他区域也含有这种细胞类型。这种细胞类型的分布是一种散在的状态啊。但是这个图啊，大家要会解读，这还是大类啊，大类其实简简单单是为了判断方法的准确性，比如说这个勘L区域，诶，它就复极勘测细胞，这个当然是没有问题的，当然这还处于比较粗放的，就是宽泛的一个状态，大类的一个状态啊。这种大类的一个负极啊，就和单细胞空间联合分析一样，呃，包括共定位分析一样，大类的公定位啊，一般放在第一张图或者第二张第二张图。
25:08
哎，作为他分析方法的一个准确性的一个验证，但是对于生物学意义而言，这种还没有到达一个比较深的一个层次啊。不过这呢，这里面呢，也是大家要做的，哎，这是mia分析中的一个基本功，就是大家分析到不同的区域啊，对应的细胞类型应该是非常准确的，至少大类应该是非常准的啊。然后呢，这就是一个简单的事例了，并且哎，慢慢的慢慢的要过渡到这个多样跨样本或者小类的一个分析了，啊，大家可以看这个图，哎，首先看这个空间的两个图的一个差异性。哎，首先看啊看，首先这个深的区域呢，应该是这个肿瘤区了，对吧，肿瘤区，但是肿瘤区域呢，又分了两个部分，一个是在这个方面啊，应该是一种。红色，哎，红色区域叫cancerable and death borderness, 哎，这个区域的，哎这个内部的一个小区呢，也是这个，哎类似于也是一个肿瘤区域，Normal和T啊这个地方呢，它划分的是normal，就是正常区域。
26:14
就是说这些外围是正常区域吗？还有这个绿色的区域叫这个区啊，当然这些单词很多我都不认识啊，但是大家可以基本上可以看出来，它基本上是画了这几个区域啊，这几个区域哎，基本上人为可以看出来对吧。当然它是个癌症的细胞，下面这个图呢，大家也可以看出来啊，它是另外一个样本的，也可以根据形态学啊进行简单的一个划分，对吧？首先呢，我们要判断它样本之间的一个差异，呃，首先这种区域像这种比较白色，下图这个比较白的一个区域。和上头的这个区域啊，哎，几乎是一种比较哎，相似的一个状态，像这种颜色比较深的区域啊，它它这种颜色已经很深了啊，这种颜色还是比较浅的，说明它也是一个单独的区域，和上游的不太一样啊，通过这样的一个简单的人为划分区域之后啊。
27:07
对，划分区域之后呢，然后结合单细胞。哎，进行一个mia的联合分析了，对吧。哎，首先呢，它定义了一些区域，比如说这个是region准区域，你像这个地方，哎，它确实是region准区域，这个黑色啊，Region准区域，像这个红色呢，是导管区，哎导管区红色在这边上。对吧，导管区，然后是。然后是这个tissue啊，Tissue的话是这个最下面这个部分是tissue啊，最终这个这叫一线tissue啊，然后是监制区，呃，绿色是监制区域，就是这些区域，当然这个大家可以看到数据聚类的结果和这个形态学的识别不是完全匹配的，这个和大家的精度有关，就是说精度，比如大家调的0.3 0.2，精度过低的话，有些区域会进行合并。当然调的越高也不行啊，调的越高它精度过分过过细的划分，会有一种空放大的一个状态。
28:01
啊。然后呢，对它进行数据聚类或者形态就划分之后啊，呃，进行一个m ma mi之后呢，就可以拿到这个样本，哎，每个区域腹极得到的一个细胞类型了，当然这里面大家不要，呃这个虽然有这种单票，这种就不不显著负极的一个状态，但是我们更加关注的是显著负极的细胞类型在这个区域是什么，比如说region cancer region区域，这个灰色区域，哎，有这种，哎有这种cancerl class的1CLASS2，但是大家要注意啊，这个不是重点。就是说。肿瘤区域负极肿瘤细胞当然是一种正常的现象，但是大家要注意哎，要有一定敏感度啊，它这个cancer区域居然负极了这个成纤维。明白了吧？这个大家先，哎做一个，哎，先label一下，就是打个标签。哎，Label一下为这个地方的这个样本的这个肿瘤区域。诶，它的肿瘤细胞内，肿瘤细胞和这个fibber细胞是显著的富集在一个区域的。
29:06
对吧，然后导管型腹肌了，导管细胞其他的都不是很显著。等到来到下一个样本的时候，大家可以看一下下一个样本，诶，它的一个cancer区域，但你看它的cancer区是灰色的，灰色就是这些部分是cancer区，这个cancer区域大家可以看到，经过mi分析之后啊。它只显著腹肌了。这个开始细胞。诶，成纤维并没有显著腹肌到这儿。甚至都没有对吧。这就是两个样本之间进行这个mia分析比较的时候，对它I意志性的一个体现，当然这只是其中的一个例子，哎，大家要活学活用，运用到自己的分析过程当中。两个样本中，哎，依据形态学划分有不同，虽然有不同，虽然都是H区。形态学上首先有区别对吧？形态学上有区别，说明内部肯定有一些不一样的地方，哎，经过mia分析之后啊，发现这个样本，其实如果大家看过文章的话，应该知道这个是癌癌啊，哎，比较严重的一个样本。
30:04
说明这个癌不仅复及了cancer细胞，也复及了这个成纤维细胞，哎，说明成纤维细胞和cancer死细胞有一种促进癌扩展的一个作用啊。等到下面这个样本的时候，还不是很严重的一个状态的时候，成纤维并没有复极进来。哎，说明这是一个比较呃粗壮的状态，这个时候呢，成纤维就成成纤维的研究。哎，就成了是否出期I的一个关键了，哎，这是文章的一个核心啊，这也是大家对于文mia运用的一个，哎，比较经典的一个例子啊。哎，右边这张图呢，就是两个关键，哎，统计学差异和负极程度统计学差异呢，前面提到过了，单细胞差异基因集，哎，细胞类型差异基因集，空间结构域差异基因集，这个一定要准确啊，错了那可就是错了，后面的结果都是错的啊。当然了，也不要说太过于谨慎小心，如果确定它的区域就是这样。那就应该是对的，单细胞，我大类分析，大类划分啊应该是没有问题，小类划分大家需要注意一点啊，然后负极呢，就是mia超级核，哎，超级核分布检验了对吧，通过这样一个mia的分析，来分析各个区域内负极得到的一个细胞类型是怎么样的。
31:21
嗯，这个是大类，哎越往下哎，越往下分析的就更加的一个精细化了，明白吧，然后呢，Mi导管sub sub map.哎，这个时候呢，对空间区域进行了一个更加细小的划分了，对吧，刚来是大的划分，现在细小的划分，细小的划分之后啊，又会发现一些不一样的现象，比如说。哎，这些，哎不同的区域呢，它的一个基因特征。开始有个明显的改变，对吧，基因特征有个明显的改变。右边这张图呢，是另外一个样本的，哎，不同的区域呢，也有一些明显的基因的一个表达的一个改变。
32:03
这种改变通过两个样本之间的一个比较。就可以知道，哎，这个区域主要是有什么细胞类型，具体的。第二，这种区域细胞类型聚集之后，主要在行使什么样的生物学功能，以及两者之间生物学功能到底有多大的一个差异。哎，下面是文章中。哎，文章中给到的一个解读啊，这两个这个样本中，大多数的这个单细胞样本是大多数这个单细胞样本是由表达它的导管细胞组成。A洲所有的导管都富集在组织的导管区域。哎，只有低氧和末端细胞菌在癌区显著附极，哎，相比之下，B中的这个导管亚菌只复集在组织的导管区，也就是说细胞类型在空间的区域腹极上存在着明显的差异啊。大家要浓缩一下这个信息啊。接下来就是哎，还有一些多样本比较的一个状态了，就是刚才解读的是一样的啊，比如说cancer区域，它复制了什么样的细胞类型，不同的样本的不同cancer区，哎复集了这样一个状态，甚至大家可能会更加精细一点，比如剧烈之后cancer有复集了，哎复集有了有三个区域。
33:17
哎，三个区域富集了怎样的一些细胞类型，有哪些细胞类型的一个差异存在等等等等，就是大家在宏观上就是在区域的一个。层面来判断细胞类型的一个分布的一个差异啊，这是一个简单的例子，哎，解读上就和刚才解读是一样的啊，不同的区域腹肌了，这个。什么样的细胞类型？哎，不同样本相同区域，诶，负极的细胞类型有哪些差异，哪个显著复集了，哪个在某些样本中复集，在某些样本中复集啊。因reach为0，靠近0。为什么要搞2个legend？
34:03
呃，影瑞此为0是这个0，影瑞此为0是什么意思啊？你的意思说这个0吗？Legend的这个depulation啊，说明离散啊，很离散啊，这个说明是预负级啊，这是两个legend的，他们代表了不同的指标啊，为什么要搞两个，就是因为既要体现它负极的一个集中度啊，又要体现它的一个离散的程度，越离散。当然是这个相反的啊，你既然很离散，那说明绝对不会负极啊。这个单不是降低的意思啊，是离散的意思啊，就是说不显著负极啊。还有一篇文章呢，就是这个文章，这是去年发的啊，去年发的也是一篇高分文章啊，大家可以看一看，这个文章啊，就运用到了一个mi的分析，其中单细胞的数据啊，来源于公共数据库。哎，因为他自己没有测，所以用公共数据库来注释这个空间，前面提到了空间区域啊，是一个比较宽泛的，就是容，就是上限，就是说容就是容错率比较高的一个方法，所以说用公共数据啊，它也进行了一个mi的分析。
35:10
哎，分析方法呢，哎，也是这个mi的方法两组，哎交集基因是否显著的一个存在的一个内容，通过分析之后呢。也是对不同的样本，哎，不同的区域，它负极得到的细胞类型进行一个比较，哎，看看哪种细胞类型负极的高了哎，哪种细胞类型负极的低了，哎不同的区域复极的细胞类型到底有什么差异？哎，等等等等，大概就是这样一个思啊，但是大家要注意啊，我这里边只是简单的的讲到这个思啊，呃，真正的要赋予它生物学率还是要进行生物学研究的啊，比如说我现刚才这张图，我知道了它的一个复极的一个区域，负极细胞类型的一个状态，包括它的一个在这个基因层面上的一个特征，这个时候大家要一定要一定要。回到你的研究目的当中去啊，千万不要就是说解读了这个就完了，一定要复集到一定要这个回到你的研究目的当中去啊，和生物学相结合起来。
36:06
这就是做项目需要，哎，非常精细的地方啊，当然大家如果说只是跑个流程，Mi跑一下，跑出来这一张图了。哎，那都呃你玩儿，你就是说你自己拿着玩可以啊，但是真正要拿到发文章的时候，哎，方法学一定要和生物学结合啊。然后呢，接下来就是一样的道理了啊，不同的样本，哎，不同的区域，不同的一个腹极的一个状态等等等等，哎，对它进行复极的状态进行一个生物学解读啊。这篇文章呢，拿出来呢，主要是告诉大家mi的方法啊，呃，比较适合大家这个数据不匹配的一个现象，因为它是与差异基因做超级核分布的一个检验，这个时候呢。呃，因为。相同的，呃，相同组织，相同区域的细胞类型啊，可能个人有一些差异，但是大致就是说它的基因的大部分应该是差不多的，由T细胞它就应该差异比较大一些。
37:05
哎，免疫相关的基因对吧，当然个体有一些差异，如果说用几卷机比较精准的方法的话，确实是需要匹配的啊，如果说大家拿不到这个单细胞样本，用公共数据，哎，用mi的方法，因为不是很匹配，但是呃，大部分。比较接近的时候，哎，用mi的方法会更加好一点啊。这里面简单的一个总结啊，就是借助他人的单细胞数据的时候。一方面可以联合看细胞类型的空间分布，这个空间分布呢，主要主就是指mia的空间区域的一个分布。哎，另一个另外一个方法呢，就是细胞类型腹肌了，哎。当然了，这里面强调一个点就是。哎，这个点。哎，把它标红啊。如果你借助空间的，呃，公共数据啊，最好借助多样本啊，不要借助单样本。
38:01
啊，在这个在这个测量的过程中啊，大家都听说过什么，多次测量求平均值对吧。哎，Mia也是一样的，多个样本，你计算差异金可能更加的可靠一点啊。然后呢，这是一些简单的例子，这个就不多，不过多给大家解读了啊，大家一定要学会如何解读啊，学会如何解读。包括这样的一个区域啊。Mia的分析啊，其实也是多样本比较为主啊，包括miaa，它在正常区域复极的状态，疾病区域的复极状态等等等等，然后呢，把它赋予生物学E，哎，就可以拿到大家想要的文章的图片文可以放在文章里面的图片，以及在文章正文内容所写的一个内容啊。其中有一个问题啊，那其中有一个问题，大家需要注意，这种负极的时候，这种负极的一个状态。其实和前面提到的那个空间细胞排布是不是哎也有一定的关系呢，上节课讲这个固定位，哎，两种细胞类性之间一个固定位的一个状态，在不同的组的话，会有一定呃不同组，比如疾病组会有一定的破坏。
39:05
哎，那么在这个生态位的概念上，空间区域的概念上，哎，细胞类型排布的变化，哎，是不是和定工定位，呃，有一定的相似之处呢？固定位是两种细胞类型，而这个mia呢？哎，就看的是对细胞类型会多一点了，对吧，不只看两种，要看多种啊。好了。这就是mia的一个简单的一个介绍啊，总结一下就是。对空间区域进行细胞类型的一个负极，用的方法是超几何的方法，两组的基因基进行一个比较，它们的交叉基因是否是显著分布的一个状态，还是说随机分布的一个状态？越显著说明越负极干细胞类型，哎，它如果说是越不显著，就像就像刚才提到的那个蓝条一样。哎，说明这种细胞类型更多的呈现一种呃，随机分布的状态。
40:02
我们在研究目的的过程中啊，主要是来研究这个它区域内显著负极的一个状，呃，细胞类型的一个状态啊。然后呢，进行多样本比较，或者说亚区域比较，哎，看它这个细胞分布的一个差异性，这也是对空间抑制性的一个，哎，很好的一个体现啊，目前被高分文章已经引用了，大家如果哎感兴趣的话，可以把它放到自己的文章中看一看啊，做一个验证啊。好了，我们休息5分钟吧，休息5分钟，我们来看看代码部分，好吧，休息5分钟。
43:21
这里面什么通用的需要关注的点吗？就是得出那种结论比较好，比看得到了fiber说明是CF吗？这个你要验证啊，它这个刚才提到了，它是多样本的啊。比如说就展示的这个PPT，哎，这个样本既然复集到了这个fiber，对吧。啊，这个样本没有负极到，说明两者之间的癌症是有差异的，当然实际情况是研究这个癌症比较轻，更容易治疗。哎，这个癌症比较重，哎，不太容易治疗，产生了耐药，这个时候呢，对成纤维的研究就成了下游的一个分析重点了啊。不同的样本有不同的负极能，这能得到啥呢？不同的样本有不同的负极是什么意思啊？
44:08
不知道你在说什么啊？什么叫不同的样本有不同的负极？多样本来说是用来匹配空间的，单细胞数据集是多样本吧？啊，空间也是多样的啊，都一样的啊。那是极卷机啊，极卷机一个样本最好对应一个单细胞，那是极卷机啊，极卷机是非常精确的MMIS比较就是说宽泛一点啊，对啊，多样本在计算差异经的时候，哎，结果会更好一点啊。这是方法的不同啊，节卷机和MMIS两种不同的方法，它们用在不同的场景啊。哎，好了。差不多了啊，我们来看看我们的代码部分啊。代码呢，相对也比较简单，诶，刚才提到了，他提到了一个更为关键的什么。超几何分布检验啊，其中我们最主要的就是要用到这个超几何分布检验。
45:04
我们先来加载。嗯，稍等。这个地方啊，大家一定要注意啊，一定要注意。很多规范性的问题啊，大家一定要做到，不能分析的太随意了啊。比如说空间样本，比如说空间样本啊，我们读取我们的空间样本。哎，我们稍等一下读取我们的空间样本啊。结转就是1V1啊，结转机最好是1V1啊匹配的，但是如果结转机你那个单细胞样板质量比较差。啊，那也得多对接啊。得根据你的项目实际情况而定啊，并不是死的，就是说这个样本很差，你也要1V1，那可那不行，Mia n vn.呃，现在是NVN啊，公司一般都做NVN，首先单细胞你多个样本进行联合分析之后，无论是找差异还是细胞类型的识别，哎，都非常有，这个准确度会高一点。
46:08
比如说，某些稀有细胞类型，一个样本中只含有50个。但是你对单样本进行划分的时候，这50个很难能划出来，但是如果说多个样本联合分析之后，哎，这种稀有细胞类型你就可以找到了，对吧，并且结果还是比较准的。空间呢就更不必提了，空间现在是要联合分析的，不同的cluster在空间的分布是有差异的，以及不同的cluster，它的一个细胞类型、负极状态也是有差异的，这就是我们所要分析的一个重点。明白吧，不是说空间一单样本剧烈之后就开始来买，也不是啊。好了，我们来看我们的代码，首先呢，读取了这个空间数据，空间数据呢，大家要看一下它的一个基础的一个内容啊刀了啊，这个区域大家要注视。哎，去要大家要注视啊。
47:02
啊，标准啊，当然这个好像就直接写的区域是吗？我没有划分小区啊。然后呢，是这个sample sample是样本。大家可以看到。啊，就这一个样本啊，不过大家分析的时候可能是空间是多样的。然后是其他的一些区域啊，当然剧烈结果已经聚过了。不过大家啊，剧烈结果要有这个能力，就是说。我想要什么结果，就要把这个信息给附进来，比如说我认为这个剧烈结果不合理，比如说他101个剧类我认为不合理，对吧，这个时候大家要无论是人为划分，还是其他的一个分析方法，得到的新的聚类结果一定要给，哎，附到这个父亲来。给进来就和这个就和这个set location一样，哎，我的有我的threat的聚类结果要给到这个Python版本R也是一样的啊，反过来是一样啊。哎，然后呢，我们就进行一个题卷，哎分析了啊找差异，差异的时候呢，其实是要哎把这个内容设置好。
48:11
SP啊，把这个内容设置好，当然它和如果大家没有定义和是一样的。然后我们来找差异啊找差异。啊，找差异的时候，这个阈值0.1~0.2之间是合理的啊，是合理的。啊，一定要听清楚啊，这个值不能过高，也不能过低，因为空间是一个，每个区域是一种细胞混合状态，明白吧。当然了，我演示为了快一点，我就稍微大一点啊，0.5啊。这里面only positive多于处，诶看到了吧，只要上调的啊。啊，这里面我稍微快一点啊，我把这个值稍微调大一点，哎，大家不能用0.5啊。哎，然后呢，就是一些标准化的一些操作了啊。
49:03
公司就是0.1~0.2吧，对。因为大家看我的代码，或者说看这个分析项目的时候，呃，应该发现了很多过程都非常限速。用这个服务器跑都他都跑半天。啊，我不知道其他培训班是不是通通通一下就能跑完，反正真正做项目是不可能。大家在分析的时候，肯定很多要经历很多的一个调整啊，还有计算啊等等都比较好，算力啊，这个算力这个人为不能控制，它只能提供这么多算力的话。啊，你只能在现有算力上等对吧。你像我随便我现在找的数据，随便一个数据都，哎，分析起来都比较限速啊，没有办法。我不知道别的培训班是不是拿了一个很小的数据，很快就能跑完，但是如果大家知道的话，可以告诉我啊，我也可以借鉴一下，但是实际分析是没有这种情况出现啊。哎，有些预支啊，我还是故意调整的，让他快一点了，即使这样，其实还是分析的过程还是很有一些。
50:04
呃，有一些这个比较线速的啊。当然这个我都调到0.5了，如果调到0.1的话，我试过至少得跑10分钟啊。哎，然后这些基础操作了，我我前面提，呃，提醒过大家，如果大家不知道区域是什么。就把它命名成例齿，你像这个我就命名成例了，对吧。那面上你也吃了，哎，12356789对吧。哎，然后呢，就是找他的一个差异基因了，每个基因，每一个class的差异基因，作为它本身的一个差异基因及。哎，都是一些基础操作了啊，首先是他的身份，哎，有有这个10个逆齿对吧，然后呢，是他以经一级，就是每个逆次啊有一个基因列表，每一个逆次都有一个基因列表。
51:01
哎，逆16，哎，它的经营列表是它。哎，历8历9，反正每个基因都要有个基因列表，作为它一个身份的一个sign就是特征。哎，计算完之后呢，这是空间部分，哎，单细胞部分我们也要进行计算，哎，这个时候单细胞一定要定义好啊，至于这个地方要不要定义到亚类。诶，大家想一想，要不要定义到亚类。哎，要不要定义到亚来呢。其实啊，哎，定义到亚雷更好啊，就像刚才那个PPT展示的。哎，大家放大看一下，你看它的一个就分了两个嘛，CLASS1CLASS2，然后做mi负极嘛，对吧。1和2是怎么来的？那肯定是前面剧烈，无论是剧烈还是划区而来，它们本身就代表了不同的一个特征，对吧？当然我们做数据分析的时候，当然在准确度允许的情况下，越精细越好啊，无论是做单细胞分析还是空间分析都一样。
52:01
哎，然后就是一些。哎，也是一样的一个道理了啊，也是一样的一个道理了，然后呢，计算差异，计算差异呢，单细胞0.25就可以了啊，单细胞0.25就可以了，因为单细胞它是一个比较精度比较高的一个。呃，主学，所以对它进行计算差异基因啊，就可以稍微预值高一点啊，当然我这里演示还是0.5啊，其实是0.5，它计算的也是不快的啊。哎，也是不快的啊。尤其是我这还是小数据呢，啊，我这还是小数据呢，如果大家是多对多的一个状态，比如说多个单细胞样本VS多个。空间样本，哎，他们在计算差异的时候，前面还要处理好这个批次的问题，对吧，你批次处理不好，到时候定义也是出问题。哎，这个地方就有点限速了啊，找差异非常限速啊，这还是单个样本，如果大家都是多样本，比如说5个样本吧。
53:01
跑流程，就是投到后台都要跑半天了。跑的就比较慢了。不过这个慢啊，大家可以慢的过程中可以思考一下关于这些参数的一个设计，比如说这个奥positive，哎，单细胞也是这个只要阳性的一个结果啊，就是说阳性代表了这个细胞类型的一个西格，就是特征。哎，我们主要腹肌阳性结。啊，阴性结果呢，因为它处于一种非负极状态，不是那个就是不显著负极的一个状态，就它的研究啊，可能不是我们的重点啊，我们的重点主要是他主要集中了什么，哎，复及到什么。等等等的一个概念啊。当然这里面啊，大家看到没，我还是class的一二三啊，这个是为了演示啊，大家自己要定义好啊，可不敢用123啊，121是什么东西啊，根本不知道啊，对吧，大家不可以这样干啊，做项目一定要精细化啊，可不敢就是说。
54:00
啊，随便拿个书就跑了一遍。哦，感觉结果还可以，直接就用了，至于他什么生物学意义背后。解读不出来，那说明这分析就是失败的啊。干细胞的这个公司用多少啊，哪个啊0.25这个吗？这个吗，阈值吗？啊就是0.25啊。就是0.5啊。哎，都不是很快啊，凹不是很快。然后呢？哎，我这还是0.5啊，0.5已经上限调到很高了。大家知道大家对这个阈值有概念吗？LOG2FC=0.5大概是多少倍？知道吧，如果是两倍，Log个RFC是1是吧，00:50多啊，1.3倍啊，其实这个阈值也不算很高，但是对于单细胞这种。招的一种数据啊，这就算比较高，就是高你一倍，稳定的高你一倍，这种基因非常少啊。
55:10
哎，我们稍等一下，帮他计算一下啊。大家看到啊，用服务器都跑的这么慢啊，用自己电脑跑可能又把自己电脑跑废了啊。哎，稍等一下啊，那们计算一下我们每个细胞类型，当然这里是每个群的一个新了啊，特征值了。好，计算完了，计算完了之后呢，也是一样。哎，刚才空间命名的是niche对吧，NI123，这个时候我们如果class的还是123的话，哎，我们要把它命名成class的一二啊区分出来，要不然到时候class的和class的比较，不知道哪个是空间哪个是单细胞了啊。
56:01
那这个就了啊。啊，也是一样的，哎，把它进行一个提取。每个细胞类型它独有的一个基因基啊，每一种细胞类型都有一个基因基。哎，比如说这个克class斯9，它有个G代表了他一个身份的一个特征啊。哎，然后呢，首先创建一个空举证，这个空举证是什么。哎，就是它负极分数要放进来。就是说我们可拉区域一负极了，细胞类型1的一个显著性有多高，呃，区域一负极了，细胞二的显著性有多高等等等等，这样排下来的话，它会形成一个多少个区域乘以多少个细胞类型这样一个矩阵，哎，这个矩阵就是我们做的这个区域细胞类型负极的一个矩阵啊。哎，大家可以看一下，现在还是一个空矩阵的状态啊，都是0，哎，首先列的就是我们的空间域，哎，好像就是我们具体的细胞类型了，接下来我们就需要一个计算了啊，计算的时候大家还知道那个函数吗？刚才提到那个函数。
57:02
哎，R元就用这个函数，这个函数大家可以看一下。首先呢，干嘛？拿到所有的一个样本量。拿到所有的一个样本量啊，基因店这是所有基因的啊，3500正常的背景基因记啊，其中呢。又有一些其他的这个en n是什么？都是什么10对吧，10是哪来的。哎，空间域10个空间域M是什么。M是细胞类型，哎是这种细胞类型，我们在计算的时候把它循环起来，哎，把它循环起来。呃，每个空间域对应的每个细胞类型，它的负极到底是怎样一个状态啊？其中大家要理解这段代码，首先呢，基因1是什么？哎，特定的一个空间域是吧，金二是什么。
58:01
哎，各定细胞类型的，它的一个膜，它的一个具体的细分基础。然后呢？这个时候呢，就要结合到这个英瑞士上了，哎，英瑞士上了。就是刚才那个函数。哎，Philosophy哎，它计算一个值，当然这里边我和文章一样做了log负的log时的一个转化。文章里面也是一样的，做了这个log时的转换啊，转换出来成了这样的值了，就是正值了，值越大越显著啊。当然了，如果说它是一个非常不显著的一个状态，就一减去它啊，说明它是一种比较弥散的一个状态啊，这样的话，用两个指标来判断它是否显著负极啊。这是一个核心代码，这块是核心代码，大家如果拿到脚本的时候一定要好好研究一下啊。应该就是少一个大括号啊。好，我们来算一下哦，算的还挺快，超几何其实是非常快的一个方法，它只是一个简单的统计去分啊。
59:02
就和大家铺松分布我们二项分布高斯分布一样，很简单啊，我们来看看我们的结果。哎，大家可以看一下，很多都是-∞大是吧，生命值非常小，就是0啊。哎，正值的话就是它这个显著负极了啊，像这种负极，当然我这个地方啊，是所有了方面演示很多基因取得并不完整啊，刚才提到的都是0.55，所以值并不是完整。那要选择F呢啊，这个是默认的啊，你也可以选择出试试啊。哎，然后呢，进行一个简单的矩阵处理啊，简单的矩阵处理。这个矩阵干嘛的？哎，又创建了一个新的矩阵干嘛的？哎，干嘛的，哎标记它是否显著性的啊。标记这个细胞里经是不显著负极于这个状态下。
60:00
这个矩阵呢，就是这个啊，如果你是显著负极呢，就用星号表示，说明你显著负极到这个区域了啊，如果不显著就不标了。明白了吧？这是两个矩阵，呃，一个矩阵是它的打分矩阵，哎，类似于打分矩阵，其实就是负极分数矩阵，哎，另外一个呢，矩阵呢，就是今天哎提到的这个。哎，标记它是否显著的一个距离。哎，接下来呢，就是大家的简单画图了啊，把这个图画出来。当然了，这里面我再强调一遍啊，我是为了演示阈值偏高，明白吧，大家自己跑，可不敢用我演示的阈值啊，我的脚本给大家的阈值是比较合理的啊，大家可不可不要随意的改，如果大家已经了解的非常多了，哎，可以改动啊。哎，接下来这个代码就很简单了啊，大家画好就可以了啊。好，我们看一下啊。
61:07
看一下啊，哎，就复集到了对吧，我们主要关注这些显著负极的一个细胞类型啊。14123456789对吧。这个图拿到之后啊，大家真正拿到的结果应该是什么呢？这个是比如这个是什么区域，什么区域，当然逆是一二三也可以啊也可以，这个地方呢，就是细胞类型了，显著腹肌得到的细胞类型就是大家关注的一个重点，当然这里我只能用了一个空间样本，大家如果有另外一个空间样本进行联合分析之后啊，就会发现其中的差异了，比如说啊，比如说虽然不是，但是比如说我这个是空间多样本联合的一个结果。哎，空间多样本联合了，分了这么9，呃10个这个逆齿。诶，我发现，哎，我发现了啊，这个逆次5。主要集中在疾病区，哎，Normal区比较少。它显著腹肌了，这个class的7这种细胞类型。
62:00
对吧。啊，当然这个阈值选的不对，不可能只负极一种，比如说负极了7和8吧。哎，复习了7和8。呃，然后呢，逆四五主要集中在这个疾病区域。哎，我发现那次4呢。例14。哎，它显著负极了8，但是没有负极7。它主要集中在normal区域。哎，主要集中在normal区，哎，那么这种逆次就是不同空间域的一个样本的一个差异分布，以及细胞类型的一个显著负极的一个差异，就成为我们研究的一个重点了。比如这两个区域都是H区，就和样本中的例子一样，都是H区。哎，有一个样本有有一些样本的H呢，显著负极了7和8，而有一些样本的H呢，显著负极了这个8。那么说明7对癌的一个就是恶性程度啊，哎，起了一个关键的作用了啊，这个时候大家就把这个7要单独拿出来，看看它到底是怎么回事儿。
63:01
哎，他为什么附近在这个区域到底和8到底有什么什么是吧，发生了什么样的一个故事，进行了什么样的交流，呃，然后怎么影响了中国的一个微环境，导致它这样一个差异啊啊好，这就是mia了，大概就到这儿了。怎么判断是否显著呢？没有看到0.05啊。哎，这个做了log转换了啊，这个做了log转换了，这个做了log转换了。Log转换了，这个时候不再是0.05了，你自己算一下那个负的LOG10的0.05是多少啊，把它转换过来啊。这个地方呢，简简单单是比比较了一下啊，比较了一下，如果大于呃，如果小就认为是这个Lia，大就认为是ni，呃，用rich呃，很多脚本，大家在拿到之后啊，要根据自己的一个需求进行一个分析和判断，哎，分析和判断。
64:02
哎，如果说这个瑞驰啊，大家想要调高一点，比如0.01是极显柱对吧，极显柱的一个状态，当然它更加具有生物学意义，哎，这个时候是不是要调大一下，比如负的LOG10的0.01，它是多少，它是10对吧。哎，这个时候呢，我们就要看这个矩阵了，我们看这个打分矩阵有多大啊。我们看这个打分矩阵有没有极显著的一种状态呢？啊，当然最高是9啊，9已经接近极险组了啊。哎，我这里没有啊，大家分析的时候应该会遇到，哎这种极限中动状态和。不显著的一个状态。就是大家哎分析的一个重点了啊，Mi分析呢，其实在单细胞空间联合，呃，联合分析啊，是非常重要的一个章节。比较重要，非常重要，然后呢，很多文章都在用它，哎，很多文章都在用啊，我刚才PPT里面讲到的那两篇文章都是高分文章，但是不是说就那两篇，哎，很多文章都在用啊。
65:06
很多文章都在用，哎，这就是我们的mia分析了，至于关于它的一个生物学意义，哎，也是大家要私下里更多的一个研究的啊，不要轻易的放过它，因为很多人拿到这个单细胞样本。呃，比如说是公共数据来源的，或者说你自己测的那个单匹配的那个单细胞样本啊，比较差是吧，比如说细胞量不够3000稀有细胞类型在它那个坏的样本中就没有。哎，这个怎么办呢，对不对，就需要大家，哎借助MMA的力量，多样本多对多这样一种分析，哎，会更加的好一点啊。如果是多个样本，是外面还要套一层循环样本啊，不需要啊，我刚才提到了那个单细胞空间都是多样本联合之后聚类的结果啊，空间已经是逆齿了啊。哎，怎么删了。
66:08
哎，空间已经是逆齿了啊，听过第7课的应该知道啊，多样板联合剧烈结果就是逆齿啊。呃，多样本的代码嘛，多样本其实前面已经给过了啊，Python r都给过了啊，大家其实是在这个去批次的基础之上啊，进行的这个联合分析啊，去批次怎么去，第7节课空间怎么去，已经讲过了啊，单细胞多样本联合那是基础分析啊，大家自己要会啊，这基础过程，这基础一定要过关啊，错了那可后面分析都错了啊。MF联合之后只有一个矩阵啊，分子矩阵。啊，不是分子矩阵，是那个负极矩阵啊，没有其他矩阵了，对这就够了，够我们分析了。因为不同的例子，它在样本中分布是有差异性的啊。
67:00
刚才解了简单的解释了一个例子，比如逆4和逆5啊，它在normal和提区域，哎，是有差异的，对吧。啊，如果说逆是我，呃主要复制在这个T膜区，哎，显著负极了7和8，逆思是呢，也是这个T膜区，但是它只负极了7，哎缺了8啊这是大家关注的一个重点了，就是说不同的逆齿它在样本中的分布是有差异性的，那它们的细胞类型分布，诶自然也是有差异性，这种差异性带来的一个后果以及生物学意义，哎，背后的生物学意义就是大家下游分析一个重点了，哎也是研大家这个研究对这个研究的一个主要的一个。诶，核心来源。还得来个结卷机的结果，和mi配合一起用啊，不用啊不用啊。我我列的这两篇文章，人家只用了MMR啊，没有结算机，大家看到没有，没有放人家文章就没有用啊，只是为了看固定区域细胞类型复极的一个状态，但是大家要注意啊，这个需要功利了啊。
68:07
拿到一个样本，它属于什么区，你能看出来吗？比如说这个红色什么区。哎，大家回文章看看，那个形态学，你能分析出来这是什么区吗？哎，如果你能分析出来mi非常好啊。啊，如果你分析不出来，或者说不知道用逆123的这种方法，哎，这个时候就需要下游更多的一个用心了啊。哎，空间毕竟它空间域啊，其实很多时候都能识别出来啊，像这种比较简单的一个空间域，大家。是吧，他不画你也可以画出来是吧，这个月包括这是H我都能看出来。你看这地方也是H，只不过这个I和这个I它诶有差异，这个颜色比较深，这个颜色比较浅一点。那延迟浅的可能愈合好一点，或者对药敏感啊，延色深的说明产生了耐药，或者说治疗不好，或者免疫治疗无效等等等等，然后对这些癌区的细胞类型，腹肌呢，发现，哎这个严重的区域呢，复集到了成纤维细胞。
69:02
哎，愈合好的没有成纤维，哎，这个时候对成纤维细胞就需要一个下游的。哎，更多的一个研究和分析了啊，无论是数据上的分析，还是实验上的验证等等等等，哎，这就是大家研究的结果了，呃，进一步得出结论，成纤维对愈后是好还是坏对不对？哎，这就是大家研究的成果了，也是大家发文章的一个创新点了。呃，大家要注意啊，发文章更多的，现在发文章更多的还是认识问题，借助单细胞空间认识我们的生物学问题。哎，如何解决呢？需要临检，呃，需要这个药学等等方面的一个下游验证。哎，就是如何治疗这个癌症，哎，不仅要考虑形态学，还要考虑突变，还要考虑呃，这个前面提到过，结构生物学对药物的一个设计，以及哎，临床临床试验，药物靶点等等等等各一条龙全下来才能，哎，耗费大概10年20年时间才会真正的解决其中。
70:00
每个癌种中的一个亚肿，哎，这个周期非常的长啊，非常的长，但是现在为什么这个文闸文章比较重要呢？因为很多我们认识还不足啊，对这个癌的认识啊，还非常欠缺，我们首先得要认识它，如果你都不认识它。哎，或者说对不了解他，你就更别谈如何攻克它了啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

追风少年i

2024第10课：单细胞空间联合分析之MIA原创

我来说两句

作者

相关推荐

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐