00:01
好了,时间差不多了,我们来上这个关于空调的最后一课啊。啊,几乎我把所有的关于空转的一些上课所用到的脚本资料啊,都发给大家发到群里了,大家保存好。呃,用于积极的数据分析就可以了。啊,其中有一些细节的地方大家需要修改,但是大致内容不需要动它,等到大家将来。学习的更深了,对它内部的逻辑啊,包括算法应用的更深了,大家可以在这些基础上进行更有深度的一个挖掘啊。呃,我发给大家的一个资料呢啊,基本上都是我为了上课近两个月上课,诶,给大家精心准备的,自己写的啊。短期内是不会有任何盗版的。啊,但是长期来看,这个盗版是不可避免的,不可避免的上半年上这个单细胞课程的时候啊。
01:01
嗯,就没什么经验啊,就开始上,拉上一堆人开始上。啊,把这些资料啊,谁谁需要我就都发给谁了。然后很快就出现了这个盗版治疗啊,很快,然后自己就慢慢的开始抵制啊,但是这个东西很多时候是防不住的啊。嗯。其中最让我诧异的一个问题就是。自己很想知道谁在盗版,谁在谁在落井下石等等这些。我发现贩卖盗版资料的居然都是医生啊。这个很让我诧异啊,因为从小到大接受的教育都是哎经是一个非常让人啊,值得尊敬的职业,哎,救世扶伤,他们一般是不会做这些。我认为比较下三滥的事儿,但是后来发现盗版资料都是医学生。还有今年三月份的时候呢,今年三月份啊,当然遭遇了很大的不幸啊,很多人都出面资助我来帮我,当然自己也遭遇了很大的一个困境。
02:06
然后呢,我发现。哎,我发现这个大部分人啊,都是愿意,这让我希望能渡过难关的。但是总有几个落井下石的人,哎,攻击。辱骂。说什么骗子之类的,但好我我我一查。还要经过一些呃,熟人的告知。我发现又是医生。我真的觉得医生是不是?难道救死扶伤不够他们做的吗?然后前几天又有同学说,诶,你的你的这些东西好像又出现盗版了,我又问了一下,发现又是医生在干这个事儿。哎呀,我真是觉得。突然觉得,突然觉得医生这个行业是不是太闲了。啊,还有就是两年前有的同学啊,可能经历过变故什么的,他曾经说过,说值得尊敬啊,非常有医德的,值得尊敬的医生啊,没有多少。
03:06
哎,我当时觉得不可能,怎么可能呢,医生,哎,大部分经过这么长时间的教育。他们的无论是职业素养啊,什么都应该比我们这些从业工作者高才。嗯,但是现在来看我也有,我也觉得好像是这样。嗯,所以说大家资料要好好珍惜啊,好好珍惜,长期来看。出现盗版的可能性是非常的。非常的大。至于是不是医生,我不敢保证,但我觉得可能也是啊,好了,我们就来继续这个,我们的这个。空间转录组的最后一刻啊,我们来回顾一下啊。湖南转录组呢,拿到,呃,从这个最初拿到数据,哎,我们拿到数据做一些简单的一个数据比对,然后图像校准。
04:01
呃,进行降维聚类差异负极之后,这前面都是一些这个。基础分析,拿到这个基础分析之后呢,我们就要进行,诶,如果大家想要发文章的话,会进行大量的这种个性化,个性化呢基本上我都罗列在这儿了。哎,包括这些我们常见的threat r c tdcl这种单细胞空间联合。啊,或者大家要用这个mia进行。生态为供定位。呃,包括我们要做空间轨迹,做空间近距离通讯,做空间拷贝数变化,包括打分,包括工定位,包括供表达和细胞网络等等一系列的个性化,这些方法呢,当然,呃,很多人都会把这些方法一一都告诉大家。一一都告诉大家,然后大家,但是大家不要盲目的拿了这些方法就去套用,套用没有意义啊,没有意义,大家一定要做好这个课题设计之后,当你需要什么分析的时候。
05:01
把这些方法拿出来,做一个合理的内容的一个布置,然后运用到自己的课件中啊。其中大部分内容已经都讲完了啊,大部分内容都讲完了,我们来回顾一下啊,回顾一下啊。这些条目呢,都是一些啊,无论是公司吧,还是个人吧,这是我自己总结的啊,这是所有的一些条目啊,大家看了,大家应该有这个东西啊,大家都看过。啊,大家都看了啊。啊,看了之后呢,大家需要掌握的一些内容呢,重点内容我都已经全部讲完了,还有一些细节的内容呢,这边大家需要这个。大家注意一下,包括这个向量场的问题啊,向量场的问题啊,脚本也发群里了,大家这个用法很容易啊,因为脚本都是封装好的,而且是造纸,大家写代码应该很容易。嗯,一个是向量场,一个是这个供定位啊,这是待会儿我们要补充的两个内容。
06:02
至于其他的内容呢,我们都已经基本上都已经涵盖到了啊,剩下的就是要解读一些空间这个转录的文献了,然这个涉及到大家的一个思路的问题了。就是说我们会方法。啊,其实只是会了一个方法,真的信,只是会方法,离这个大家发文章还远的很。离大家这个发文章很远,大家从这个发文章呢,从一开始我们需要。啊,发文章的一个正确顺序啊,是第一步我们要做课题设计,就是我现在有什么样本,能取到什么样本,他们样本之间的生理特征是什么,哎,有什么差异等等等等,比如说肿瘤有治疗,有这个治疗预后好和预后差的这种差异,或者说肿瘤有癌防和H的一个前外学分布。等等等等,通过这样的一些呃内容比较呢,来开始设计我们的课题,哎,我们需要做什么分析啊,可能会拿到什么样的一个结果。
07:01
等等等等,如果出现这个可能性的结果呢,可能有两三个,而每个结果呢,对应的往下走都是什么样的,这是前期的一个课题设计,对于公司来讲呢,公司做这种工作的人一般是产品经理或者技术支持啊,但是这个工作呢,很多对于我们这些呃,读书的人来讲,接触不到我们,我们这个拿到的时候很多都是老师已经把数据给我们了,好,你分析。然后我们就开始用软件进行分析,这个时候呢,我们也需要啊,我们也需要把我们的背景搞得非常清楚啊,搞得非常清楚。嗯,一方面呢,我们要知道我们的数据,呃,数据类型是什么啊,包括它对应的一个,呃,如果是临床样本,对应的临床关系,如果是在学校啊,对应的一个小组,小组数据啊,包括它的养殖啊等等等等这些背景信息都要搞清楚。然后才开始我们进行往下的一个深入的一个分析,当然中间的过程呢,大部分时间大家都是一个要做一个特性分析的一个。
08:02
啊,这个升级分析呢,当然时间跨度啊,和大家的一个经验能力,包括这个升级能力有关。啊,有些非常快。哎,我知道有些博士他们申请基础就很好,有些非常可能两个月三个月。就能,呃。就能很快的选择出他适合他的一个分析方法,然后进行一个详尽的分析,中间包括中间的一些调整环节等等。诶很快就能拿到这些结果,然后再往下走,往下走呢,就会涉及到哎,写文章啊,包括写文章的期间呢,可能也会。返回头来调整它神性分析的一个内容。啊,这样的反复调整过程中呢,可能在需要几个月的时间。成为一个,诶把这个文章写好,然后进行投投递的话,又需要哎审稿,返返修等等,甚至巨稿。这样来回的拉扯很多回。嗯,这样的话就会,呃,又会浪费大概一年的时间吧,也就是说大家拿到数据。
09:05
一年之内能分析好,并且写成成稿。啊,已经算是合格的一种水平。等到第二年的话,大家就开始投投稿。投稿之后呢,如果大家投的那时候十分或者20分以上的那种杂志期刊等等,嗯,有的审稿长,有的审稿慢,但是很多时候会给一大把意见,几十上百条,大家要一一的回答对应等等等等,这个时候可能到他接收又要浪费一年的时间。也就是说大家拿到这个申请数据,如果想发一篇好的文章的话,两年时间是算比较快,算快啊健康的话。这才是一个正常的一个逻辑啊。啊,但是现在公司呢,很多不太愿意做个性化了,因为个性化确实比较麻烦。他要要求人,他要求人有很深的这个,首先对你的课题要非常的了解,你是做什么样本的,诶你的诉求是什么。
10:02
第二呢,对他自身的生性能力有有非常高的一个水平要求。不讲他生性的一个写代码能力有多高,至少要他,至少他要读很多的文献,知道你这个空间转录组或者单细胞都能分析些什么,才能给出这个。诶,我们研究着一些合理的建议,诶用这个分析怎么什么什么合理的建议,这个对生信的要求啊也非常高。啊,但是大家知道现在啊,大家送到公司的一个样本,做资讯分析的,很多都是刚毕业的,他们的经验可能还不如大家。啊,就是说很有经验的这种生信人啊,市面上是就是公司的内部是比较少的,一方面是。深信的人做的久了之后,他会慢慢的转到公司的,比如说管理岗,然后转岗,他不再接触这些一线的项目。啊,一线的项目都是一些老人写好脚本,封装好固定化格式,直接让新人跑,直接就交付了,所以很多公司都是格式化输出的。
11:01
导致了大家诶感觉公司的结果怎么,诶分析的没有达到预期啊等等。即使你再要求他做这个分析,做这个分析他也是好一个现成的脚本。这是其中的一个原因,第二个原因呢,就是现在公司都在追求这个量,就是。哎,我要达到多少多少这个。就是说我每年要一个亿两个亿的英雄策划的功能。啊,但是这公司的征信啊,一般也就几个啊,像这个大公司可能多一点十几个。但是大家想想,如果一年要达到一个亿的营收,现在单细胞仅仅是1万块钱一个呀。1万左右一个亿的话,那就是每年要做。诶,每年要做大概1万乘1万是1亿吧,你就说一年要做1万个就。1万个样本平均分到每个生性头上,比如说十个生信,一个人要做这个1000个样本的数据分析,1000个样本可能对应几百个课题,至少是几十个课题。
12:02
没有这个身心能有精力。能把所有的课题都负责好啊。啊,就算是其中有10%,还有这个十几20个课题来负责。啊,也没有这么大的精力能把这十几80都能负责,所以就会出现这种公司好像分析起来要下降的个,因为公司是独立的,真正深入到这种科研的非盈利的这种性质上,还是要靠我们研究生,靠我们博士生,靠我们的基础科研工作者。啊,靠公司可能。可能它周期很长啊,一方面周期很长,因为它每个征信的手上项目非常的多。可能做个项目,他要求一周两周的,也是你自己做可能。几分钟,十几分钟就能搞定啊。这就是区别。好了,我们回顾一下关于空间转录组分析的一个主体内容,诶前面的一个主体内容呢,是这个指控的部分啊,包括线粒体,指纹和u mi,这个大家看一看它的形态学分布就可以了。
13:01
呃,关于线粒体的分布和形态学的一个分布呢,它其实也是一种这个空间信息啊,大家不要顾虑啊,提到我大家不要过虑啊,第二个就是关于空间转录组的一个注释问题,大家剧烈之后呢,可以依据这个形态去录制。也可以预计这个空间进行剧烈之后进行一个重视啊,像一般大家啊,包括我在内啊,形态学习的知识并没有那么强。啊,但是我知道有人非常厉害,我认识一些人他非常厉害,他看不这主织块,他立马就能知道这是啥,他不需要你聚类,他就给你画好,也有这样的人啊,然后进行一个距离数据分析就可以了。然后是整合,整合的话是CC harmon,整合的效果的话,就看形态区的一个分布就可以了,肿瘤区域和肿瘤区域基本上能整合到一块儿,正常区域和正常区域,包括交界区域,他们的形态区分开,那我们拿到这个整合效果就是合理啊。然后是差异,包括一些绘图等等,呃,像这个这些mark基行打分的这种内容啊。
14:07
还有一些像啊这些负极分析,主要强调的是这个gsva的负极分析啊,目前文章中应用最多的也是gsva的负极分析啊,他对各个通路进行gsva来看,来看它空间通路的一个分路的一个空间特点。这些通路的一个内容啊,往往和它这个空间的形态是相相这个结合的,相互一致的。包括一些啊像这种形态学画区呢,大家可以了解了解,大家如果不是专门做那种病理专业的,其实这个专业其实这个方向还挺难。大家通常就是聚完类之后进行一个排水。包括绘图。啊,然后是联合啊,联合的话其实更多的是接触单细胞的一个数据。啊,匹配的单细胞数据进行联合之后,大家会拿到非常好的一个联合结果,啊,这个结果非常的好。
15:02
可以帮助大家知道每个class的它所在的一个空间分布特点,包括它的一个空间的一个趋势。像这种这里面推荐单细胞联或者pro。然后是还有一些其他的一些分析软件,大家可以看看。大家要选择软件的时候,尽量选择这个,呃,一方面它本身软件发就发了很高文章的,另一方面呢,选择一些诶引用率比较多的啊。还有这种空间热图啊,包括这种轨迹图啊,丙毒这种气泡图等等等等这些绘图的内容呢,也都在课程上都讲过了啊,本已经发给大家。还有这个mia的一个分析结果,M的分析结果主要是来主要是来分析各个这个形态学的一个区域啊,它细胞类型所复集的一个情况啊,这个地方呢,M可以运用公共数据,但是这个公共数据也尽量包含大家常见的那些细胞类型啊。
16:05
然后就是。啊,聚类了,聚类当然分为这个分子聚类和这个细胞聚类,聚类完之后啊,它每个群代表的是每个逆器,像这个就是分子逆器啊,分子力器啊,这个就是细胞逆器,因才课上都讲过了啊。然后就是空间通讯了,通讯的原因呢?嗯,空间上呢,我们要关注临近通讯啊,这个已经成了各个文章的共识了。工具的方向性,包括这个如果是红色是配体,诶蓝色是臭体,哎,它的方向性是怎样一个指向,然后就会形成我们现在所要研究的一个空间信号流的一个问题啊,有哪个区域到哪个区域,它的信号流是怎样的。然后是空间拷位数,空间拷位数的话,一方面它可以看这个肿瘤内部的一致性,另一方面我们要看这个肿瘤每个CV事件的一个空间分布啊,它体现的肿瘤内部一致性和后续的一个肿瘤诊断,包括预后隐患。
17:03
啊,所以说空间软弱组在这个,呃,临床应用上的前景可能比单细胞要强,可能比单细胞要好得多啊。然后就是固定位,固定位的情况主要体现在细胞类型的一个空间位置的一个临近情况啊。包括配受体供定位,配受体固定位是两结合之前的前面讲到的要呃空间临近通讯的一个内容。然后就是空间,呃,细胞网络,细胞网络体现的是细胞在空间上的聚集的一个程度。呃,每种聚集的程度代表了空间的一个组织结构的一个变化,当然正常和疾病它的细胞的空间网络是是不一样的。这个大家要回去看啊,这个也都讲过了啊,还有这个异形细胞网络,异形细胞网络主要的是体现的是特定的组织。边缘,比如说这个实体组织,它的一个内外组织,内外他们细胞类型之间的一个两种细胞类型之间的一个连接度的一个问题啊。
18:03
啊,这个也都讲过了。还有就是空间轨迹了,空间轨迹刚才提到过,空间轨迹并不是什么发育关系,它更多的是一种组织部位在不同的一个呃内部的一个切换问题,从肿瘤到正常,或者从正常到肿瘤之间,它基于变化的一个趋势,包括通路和细胞含量的一个变化。然后接下来就是今天我们要补充的这个。WC的东西。呃,WTC东西呢,其实它是一个。怎么说呢,它其实是一个供表达的一个分析,它和之前的NMF,或者说其他的一些用到program的一些方法其实是一致的,呃,他所用的一个方法就是说基因如果诶。呃,两个基因,如果它的它的这个表达趋势呢,存在着同高同低的这样一种状态,说明两个基因啊,存在这个基因表达上的一个协同基因,这样的话就会形成这样一种系统关联。
19:02
形成各个模块。就是这样的形成各个模块,这每个模块呢,都代表了一系列基因,一系列基因在内部呢,会有很强的一个表达的一个。共表达的一个情况来,他们同高同低。然后就是每个每个这个每个这个模块,它和我们的形态学其实关联度是非常高的,像这个class 0123是空间剧烈后的一个class。大家可以看,大家可以看每个这个形成的模块,它和这个形态学的一个空间聚类啊,其实关联度都会存在很明显的一个关联。呃,就是内部什么,其实它呃内部上也是反映出我们空间组织在这个呃空间结构上的一些特点。尤其是尤其是什么呢?尤其是这个空间的一个,尤其是大家拿到多个样本对它进行wgcna分析之后呢,对样多样本进行空间比较的时候,就会发现它这个空间空间模块啊,很多时候只是少部分基因发生了变化,导致了他这个疾病的发生。
20:05
才会显得这个。哎,空间上有一些组织紊乱,这是从这个空间模块的角度角度的一个分析。呃,真正的一个空间WGCV分析啊,它的一个核心内容是来找这个哈机。核心内容是来找这个哈B基因,这个哈B基因啊,其实就是各个模块之间的一个关键性的一个基因。就是这样一个,每个模块之间的关联度其实一般都不太高,因为他们之间,嗯,一般是一种内部协同性很高,外部之间其实没有什么协同性的。他们之间所需要的一个内容,比如说这个每个模块,他寻找的基因其实非常多,可能有几十个,但是通过这样一个HUB基因的一个分析啊,可能最终只会留下这意图的这几个。123456789啊,反正就这几个吧,这几个基因就会组成的,它这个模块的一个哈基因,这个哈B基因啊,就会投到我们的空间上。
21:10
投到我们的空间上的一个,呃,主要的一个看他主要表达的一个情况。尤其是多样本之后,看这个哈P基因之间表达的一个变化,哎,就会体现出他们之间大意的一个分布性,当然关于WTC啊,现在有这种两种方法,一个是就是普通的那种,另一边是加了HD,就是那个伪的。把一些把一些support表达的进行一个简单的合并。减少了数据的一个系数性,不过从目前的一个空间转录组的一个应用上来看。呃,空间转录组应用上来人,呃,应用的不是很多,WT应用的不是很多,这是其中一篇,还有别人强到的文章也应用了。在哪找一下啊。别发这高分的文章,也别用了。
22:15
他在这个WG分析的过程中呢,它主要是看每个模块它在时空的一个错位,像这种模块六用空间转入组数据wgna之后,模块六,模块六呢,它分析到模块六主要包含的这个细胞类型是什么,以及它的一个空间分布是怎样。包括接下来一些模块三等等等等,模块三主要包含了两两三种细胞类型,呃,这两三种滤胞类型呢,它在空间上的分布是如何的,通过这种打分的方式啊。把它给提取出来。这个地方它主要是体现这个空间,呃,空间这个有序性的一个问题,大家可以看一下它这个方法描述啊,方法描述其实也非常的简单。
23:14
就是这个模块识别,哎,他用到了这个wgna。简单的来讲,一个信号网络被重建,哎,估计这个软阈值啊,这个阈值呢,一般是分析过程中大家遇到的一个参数,遇到的一个参数。然后是其他的一些分析,包括计算一个团队的矩阵,来计算这个模块动态的一个混合,混合这个生成数。哎,进行进行一个分选之后呢,会形成多个模块,包括刚才那个。这个一样,哎。
24:00
经过程序等级之后呢,分成多个模块,那模块的网络呢,会和我们的形态学,包括包括这个生理功能有很强的一个关系。然后接下来呢,他会对这些模块进行一些功能的分析,包括每个模块所代表的一些生物学意义,进行空间的一个展示啊,目前呢,文章中只有这两篇运用到了这个W7析,当然单细胞运用的也很多啊,空间呢运用到了两片,这个是一个比较冷门的分析啊,但是因为空间模块的一个原因,它还是不会放放到。呃,空间模块的分析呢,也来一个发给大家好了,接下来我们补充一个关于轨迹的一个问题啊。前面提到了有一个轨迹向量场的一个问题啊,这个也发给大家了,轨迹向量场的一个问题呢,其实它类似于那种前面的那个提到的轨迹问题,它所体体现的一个意义啊,就是在这个两个区域之间。
25:11
细胞类型一个负极的一个程度,比如说区域一和区域二这啊在这期间呢,这种细胞类型就负极于区域一啊,这个也负极区域一,它其实所要表达的一个内容呢,就是看空间上这些细胞类型,或者说通入它的趋向性是趋向于组织的哪个部位。这是它的一个主要的一个主要的一个功能啊。然后大家可以看一下这个解释啊。呃,Surfacelo就是这种指向镜图呢,代表了空间转的一个例子,箭头呢代表了这个vect film啊,直接过来就是向量场数啊,啊代表了这个性,就是stream呢,就是流向。
26:02
从这个定义的一个转录组的,嗯。之前定义的一个转组的一个program,这个program可以使我们的基因,也可以使我们的一个通路啊,也可以使我们的细胞类型组成等等。然后呢,计算这个向量呢,代表了这个空间的一个等级转换,有的地方高,有的地方低,代表了这种等级转换在表达水平上的一种等级转换。哎,通过计算呢。这种等级转换其实更多的和我们之前提到那个空间轨迹是差不多一样的那种啊。这个也都发给大家了,这个运用的也不多啊,运用的也不多啊,在这个实际的分析过程中呢,我们如果想对某个区域细胞类型是否进行复集,或者说是连续复极的话,用那个查看那个空间轨迹就可以了啊,这个方法也是这种空间轨迹的一些方法,嵌套过来看看细胞类型轨迹的一个。向哪个部位进行集中的一个趋势的趋势的问题啊。
27:07
啊,这个就是我们今天要补充的一个两个比较冷门的一个内容,一个是wgcna目前运用的还不是很多,然后这个模块拿到之后,如何进行更有深度的一个生物学意义的一个挖掘,其实目前还是有难度的,而且对于我们单细胞空间来讲,有更多其他更重要的分析要做,所以说这个分析呢。嗯,一般会,嗯,一般会在就是说做了很多分析之后,需要补充的时候,把它补充一下,因为wa本身是为这个book数据服务的。就是普通转流组那种数据服务,它的内容呢,就是要寻找这个哈基因,就是大家做完差异之后,杀了很多差异基因,然后通过WGC呢。找到一些各个模块的哈B基因,哈B基因和差异基因取交集,哎,这些关键基因拿去做生物学验证,好啊,这是之前一个Bo的道路,对于我们这个空间转弱组合的单细胞而言,这个运用的不多啊,运用不多。
28:06
这是一个简单的内容补充啊,简单的内容补充。接下来我们就需要呃,看看我们的一些实际应用了啊,实际应用。嗯,像之前呢,大家用这个。啊,像很多人啊,有这个空间转入组数据。啊,空间导入组数据呢。很多人啊,那些空间转入的数据都是都是怎么来的呢?都是老师直接就给大家讲说,哎呀,我只有空间转入组数据这种客户比较多啊,空间转入组数据简单的可以分为两类,第一类就是说。有匹配的这个单细胞数据,我们可以叫它单细胞空间数据啊。这个是最理想的状态,最理想的状态。啊,甚至有的平台说我可以做到单细胞级,但实际上还是不行,包括华大的那个可以做到单细胞级,大家可能觉得哦,是不是直接测空转就可以,事实上不行啊。
29:06
啊,还有一种呢,是只有空转数据,比如说只有支撑和空转数据,或者只有华大的空转数据等等等等,这个呢可以分为两类。其中呢,如果大家只有空间转录组数据呢。这个问题难度啊,相对会呃,相对会高一点,当然也不是说没有问题,没有办法解决啊。这里面我给大家分享两篇只有空间软弱图数据的,这篇文章呢,之前多次引用过,它是应用这个。嗯,只有空间转录组数据发表的这个文章。但是这个地方呢,它的取样非常的好,取样非常的好,比如说它取样之后呢,它的各个形态需要划分的很清楚。所以说呢,如果大家只有空间转录组数据的话,第一步需要进行一个形态学的划分。这个对于那种不规则样本非常的难得去,得找一些专业的人,包括病理学家来画,嗯,还有一些呢,像这种规比较规则的,大家自己画就可,像那种主合药物,大家这么看出很好。像他讲自己画就。
30:08
包括用剧烈的一个方法进行辅助,你就可以拿到这样一个相应的一个结果。拿到这个,拿到这个呃,形态学划分的一个内容之后呢。哎,大家可以做一些简单的一些分析,比如说这个各个区域的一个功能分析。各个区域的一个通路数据分析,包括一些大家常说的,哎呀,我要用细胞mark打分,看细胞类型的空间分布当中,这都是可以做的,包括一些这个,呃,它的一个空间分布的一个趋势等等,但是这里面有一个呃,比较严峻的也不多,严峻吧,就是比较重要的一个内容问题,就是大家打分对这个基因级的选择要慎重一点啊。大家要选择的呃,更合理一点,尤其是选择细胞类型的一个marker之后呢。大家要尽量选择的那个稍微多一点,那马可更刻意一点啊,比如说大家如果经常用两个基因一个基因打分,这种分一般都是不准的啊。
31:07
有的时候细胞类型马克就一个,然后你拿这个来打分,其实没有意义啊。一般通常要四呃四到五个以上,像这篇文章的每个细胞类型其实都非常高,至少三个以上,大部分都在十个以上,所以打出来的分就会相对精准一点。大家可以看到每种细胞类型在空间上的一个分布状态是怎样的。哎,从而可以判断出组织类型之间的,比如说正常区域复集到什么样的细胞类型。诶,肿瘤区域又有什么样的细胞类型在分布?等等等等,这样的话,分布特点就会有明显的一个。哎,明显的一个明显的一个认知啊。接下来呢,就要对肿瘤的,就要对这些空间的一个内容呢,进行一个检啊,更近更深入的一个分析,比如说他的一个肿瘤区域的一个。呃,空间这个分析没有degree,就是说我们空间的一个一致性的一个问题。
32:03
啊,大家都知道空间肿瘤有这个抑制性啊,但是通过这种尾B就是PC的一个分析啊,可以分析出各个区域,比如说肿瘤区域和正常区域,它们之间的一个一致性的关系。呃,他们越集中在同一个区域,说明他们之间啊,密致性越高,右边这张图呢,其实就是这个细胞类型分布的问题啊,细胞类型分布大家可以看一下。主要也是看细胞类型的一个呃空呃细胞类型,马克基因的一个空间表达。啊,这个地方呢,是可以看细胞类型空间表达的一个A,它分布在的一个区域啊,这个地方虽然不能定量,但是可以看它的一个分布趋势啊,包括一些其他的,包括这些什么,各个区域等等。啊,然后是区域之间的一个空间轨迹,空间开关的一个问题啊,各个肿瘤区域呢,由于边界的一个,由于这个肿瘤边界的一个问题啊。内外环境,内外部环境差异巨大啊,所以会导致这种。
33:03
一开始通路第经过这个交界区域的时候,哎,它会明显的诶,对某些通路或者细胞类型进行一个开关作用,把它给开合或者关闭掉等等。呃,讲到这里呢,其实大家也应该明白,这个时候它所要体现的仍然和空间,仅仅和空间本身的数据组合,细胞类型呢,也是用marker来看细胞的一个空间的,诶,它到底在哪些地方分布,那并没有让它绝对定量。啊,还有一些呢,比如说像这种啊,像这种一旦定义到这种T细胞的亚类比较细的一个类,比较这个小类之后呢。这些马克基啊,可能会要选择的多一点,然后通过他的基因表达,就是各征基因的一些表达来看,他在各个class,就是各个各个这个形态学分布的一个高低问题。这里面主要讲一点,就是它这里面可以判断出,诶细胞类型它在哪个区域分布多一点,哪个区域分布少一点,这个是可以做到的,只要大家选择合理的mark,我可以判断出细胞类型主要分布在在哪个区域。
34:14
这个是可以做到的啊,所以说大家如果没有这个单细胞数据,用这种方法是可以的,并不是说不可以,只不过大家往往选择那个marker选择的都不太合适,所以就会导致后续的分析出现很大的一个问题。然后就是一些常见的了,像空间CV,空间近距离通讯等等的,这些和之前大家的想法是一样的,像空间CV的一个分析呢,选择正常的区域做一个refer,来判断肿瘤区域内部的一个一致性的一个问题。哎,这个也是可以。直接用空间数据就可以做到,像这个,呃,空间临近通讯也是一样的,我们选择这个近距离通讯也是可以的,这个通讯呢,是大家可以看一下它这个数据的一个特点,大家不要盲目的选择这种方法,用这个。
35:03
空间剧烈呢,剧烈之后呢,它并不分散,而是各个class的聚集在比较集中的区域,说明两个之间有明显的国际环境差异,这个时候呢,对两个群之间进行临近通讯的一种分析呢,可以判断出两者之间他们的信号交流是怎样的,也可以判定出他们为什么会产生内微环境的一种差异,这种差异的来源是什么。哎,大家要注意这点,如果大家分布的很乱,这种类似于不适合这种方法啊。然后接下来呢,就是一些,比如说这个。呃,旁边的一些分析,包括这些基因表达在各个区域的一个分布问题。大家可以看一下,它这个画了一个很明显的一个界限,就是对肿瘤和脑网进行了一个很明显的一个交界处啊,进行了一个很明显的划分,划分之后呢,对每个常见的一些特征呃,进行一个分布,就会发现某些特征主要集中在这个中轴区,诶,某些集中在这个正常区,有些呢,呃。
36:04
分布比较散,两组都有,其中呢,对这个特有的一些分布呢,大家需要一个。大家需要一些额外的关注,尤其是有些基因只表达在肿瘤,有些基因只表达在正常,像这个基因呢,就嗯,它就会。大家给给大家这个分布出来啊,看看这些进行表达,到底是存在一个怎么样的一个空间形态中。哎,他的一个低表达趋势啊。然后这里面还会涉及到一些空间等级分析的一个原因啊,等级分析呢,其实它主要分析class之间的一个相似度的一个问题。大家对空间转弱组做了一个整合之后呢,当然会发现有些卡拉是聚成一类的,虽然它属于不同的样物,但它聚一类说明它本质表达很相似,但有的时候呢,呃,剧烈效果却。啊,比较大一点,比如说这个样本主要是黄色,这个样本呢,就没有黄色这个class,这个时候呢,会涉及到一些空间肿瘤等级的一个问题,把它进行一个空间总流等级划分之后呢,来判断出他们之间的一个相关,就是的考,就是他们的一个相关性的一个问题。
37:15
呃,这个相关性的问题呢,主要是体现在肿瘤等级的一个进化上的一个问题。啊,肿瘤总结计划上的一个问题。哎,等等,还有一些空间轨迹的一个问题,这个轨迹呢,比如说第四层用的这个和我们之前讲到的那个SPA那个轨迹分析原理是一样的,大家指定好一个起点,画一条方向线,看它的基因表达,或者说一些马可基因的一个分数的一个变化。由此来判断肿瘤的一个,各个肿瘤之间的一个差异性。哎,这个也是可以做到,包括一些。包括一些划定的某些区域,它诶它的一个进行表达一个特点,包括它的一个肿瘤分布的一个内容等等等等,都是可以拿到一个相对合理的一个结果的啊,相对合理的结果大家可以看一下他对这个啊,无论是这个轨迹还是这个。
38:08
啊,包括一些附近区域的一个热点,他都用的是一些这个马克基。都用的是一些马克基因啊,包括一些什么CD8细胞类型,这些分布的一些差异性特点,它都是依据这个细胞类型的一个马可基因进行一个评判。通过打分的这种方式来判断他们之间分布的一个差异性。等等,大家可以看一下,其实很多时候啊,空间转录组是可以借助单独的一个空间数据进行一个详细的分析的啊,只不过对于这种马可机的选择,包括通路机的选择要求比较高一点。啊,这个时候呢,可能是我们的一个难点。这个时候就是我们的一个难点,很多人是做不到的啊,我发现很多人很少有人做到,简简单单依靠比如说T细胞的三个基因,就想知道T细胞所有的基极在空间上的所有信息,很多时候是做不到的,办不到的。
39:02
这是我们,呃,你看这篇文章,基本上全程都在用这种基因的信息,基因配合形态学的信息进行全篇的一个分析啊,它并没有用到单细胞数据,哎,但是分析出来的结果就非常的有效啊,对我们整体的一个肿瘤正常区域,包括交界区域的一个认知呢,有一个很明显的一个很明显的一个陈述。哎,这就是我们这个。如果没有空间数据的一个目的啊,没有空间数据的一个主要分析的一个流程,大家可以看一下。这篇文章发表的虽然比较早,但是他确实给大家提供了一个很好的案例,而且大部分都大家可以看,基本上是中国人创造的思路啊。还有一个问题呢,就是植入空间数据的问题呢,就是说大家一般。嗯,之前如果做这种FFP一样。很多时候呢,是没有这种,很多时候是没有这种匹配的单细胞数据的。
40:01
他的一个思路是什么呢?大家也可以看一下,其实这个思路大致都差不多。啊,第一步呢,进行这个平台去划分,大家可以看一下它划分的一个,嗯,像这种不规则样划分的难度就非常高了。啊,一般人我们普通人是看不出来的,是看不出来,但是一些病理学家可以看出,比如说他通过这个样本,他就可以看得出,哎,这个地方,这个地方。它是三级淋巴结构。像这个FIP呢,当然我们我们可能看不出来,但是需要请一些病理学家,他可以画什么,比如画了这个。它是这个三级淋巴结构区。嗯,这个关键区域一旦划分出来之后啊,就可以明显感觉到它这个差异,比如说这个。前面进行划分之后呢,诶发现有的样本存在三级淋巴结构,有的样本呢,却没有这个结构,这就是形态学的一个不同,呃,如果说大家做IP没有匹配的单细胞数据,人家就从这个形态学做一个突破口。
41:03
把样本进行分开,诶像有的有这种有三级淋巴结构和没有三级淋巴结构。他们之间背后的临床信息,把它调出来,来看看有3D淋巴结构,它的预后是怎样的。然后看了看他的基因表达的一个趋势。然后大家可以看一下啊,其实这里面关于各个细胞类型的一个分布,也是用的马可基因,大家可以看一下三星淋巴结构所在的一个区域呢,像这种呃,圆圈的区域呢,基本上是免疫细胞巴克基因表达的一些主要区域,这里面的地方,包括附近的地方,主要是免疫基因的一个高标。像B啊T啊,当然一些啊,像这个单核。像这个附近区域也有一些表达,附近力呢少一点,内皮呢没有。农纤威呢,相对多一点,但其他地方没有很明显负极的一个区域。但是如果说没有三级淋巴结构,它明显的细胞类型表达就没有一种集中的趋势,像B细胞呢,完全就是几乎都没有,T细胞呢,分布的一种散散,包括其他细胞类型分布也没有什么规律性,可能但是这种一旦有三级淋巴结构,大家可以看一下细胞类型的分布具有一种明显的集中趋势啊。
42:19
这个和大家之前的形态学分部,嗯,可能和大家形态学分部可能要要有一个很强的一个认知啊,这个地方呢,类似于什么呢?类似于我们之前第16课讲到的那个degree。热细胞等级。呃,如果我们用degree做这个分析的话,大家可以明显感觉到这些market这这个地方。而他的低保等级非常高。因为它存在特定的结构,如果我们不知道有这种特定的结构,我们想要degree分析也会发现这个地方,哎,它们之间的连接性非常高。这种地方连接费率非常高,这些高表达的地方连接性非常高啊,像这种没有三级淋巴结构,通过细胞等级的人,你会发现它的细胞等级相对非常低啊,相对非常低。
43:04
这个时候就可以明显把样本分成两到三组,诶,它们形态就上存在明显差异,细胞类型的分布上存在明显的一个。不同细胞等级有明显的一个分布差异。这个就是空调转动组最直观的效果。还有最直观的需要告诉我们的一个地址啊。呃,至于形态学的划分呢,这篇文章也都提到了这个地方的注释啊,需要这个。呃,有经验的一个病理学家啊,有经验的病理学家啊,大家如果没有经验的话,大家记住之前讲到的那个细胞等级分析,进行一个。那分析就可以了啊。呃,分析之后呢,其实如果大家把那个样本摆出来。哎,明显可以看出,明显可以看到这个样本之间分布的一个明显的变化啊。像这种大家可以,大家其实如果没有这个地地图和意图这样一个形态的的一个分布,大家只看这个马克基因的一个空间表达,大家也能看出来它的差异,那这个B呢集中在这儿啊,T呢也相对集中在这儿。
44:08
哎,这个样本呢,确实很散在。诶,分散态分布。也就是说从这个之前专业的一个细胞等级而言,上面的细胞等级高,而下面的细胞等级很很很分散,大家等级都低,诶,明显是一种形态差异啊,这也是可以做的,大家都没有单细胞数据,但是可以记录一些,诶,很好的分析手段。判断出我们定义去的一些常见的一个。嗯,大家可以看一看,包括这种划分了这个。当然它划分了这个,呃,三级联邦结构,大家其实没有这个结构也可以做这些分析,包括AOC分析啊,包括什么基因表达的一个空间分布分析啊,这些都可以做啊,大家一旦把这些很多时候呢,看单个样本看不出来什么。看这些基因表达,看单个样本也不知道说明什么,但是一旦把多个样本放进来之后,大家可以明显感觉到原来是有差异。
45:07
然后接下来呢,就是对他一些,当然空间VDG啊,这个分析离大家还相对比较遥远啊,相对比较遥远啊,不过呢,大家可以了解一下空间VDG呢,它也是想体现在空间的一个角度上,这些VDC的一个空间温度。大家可能单细胞做过这个单细胞VDC,分析过它的风度问题,包括一些什么相似度等等等一些问题吧,但是对于空间位空间这个VD值而言,它所体现的就是VDZ啊,在空间的一个分布特点,包括这些。分布特点当然也一样的道理,大家看同一个分布可能看不出来什么,但是一旦把多个样本的空间VDC分布放在一起,哎,明显感觉到明显的差异,大家都能看出来。然后接下来就是一些免疫荧光的实验验证啊,免疫荧光的实验验证了,找了一些蛋白market,看看这些空间细胞类型的一个空间分布的一些特点,诶发现呢,诶这个B细胞和中间微细胞之间好像存在一定的桥梁作用,空定位的一个作用等等。
46:14
大家看到没有,其实这篇文章的内容,分析的内容其实并没有多难啊,并没有多难。第一步他测的是FFP的样本,测的是FFP的样本,呃,但是呢。还有组织形态学的一个检查划分,哎,这个需要我们。积累一定的经验,知道这个部位是什么啊,当然这个我们当然这篇文章的样本呢,我们没有这个形态去划分,也可以得到一些有效信息,利用之前讲过的一些方法,也可以得到一些这样的分析结果。等等,当大家把这些呃,包括特定基因的一个空间分布放在一起比较,就会发现他们之间的一个差异。差异之后呢,可以把样这两组删除。
47:01
查看它背后的一个形态,进行一个分布分析就可以了,大家注意这里啊,这里面是形态区和market基因的一个结。他没有担心,多注意来辅助这个问题啊,包括天面也是一样,就是情态学家。把那个马克基因。当然空间VDG呢,这是一个很重要的一个点,目前各个公司应该没有公司能做这个啊。大家了解一下这个将来用到的时候可以跟公司商量一下,协商,然后接下来就是免疫染天了,对一些特定细胞类型的马可进行染天,看他的空间分布的一个特点等等。哎,这个就发了一篇免疫学的,你看。一米,大家看到了吗?其实对于这个没有单细胞数据,不是说我们的空间数据就不能往下走,可以往下走,只不过你既然舍弃了单细胞数据,那你就得把形态时的划分给诶提上来,对个人的要求会稍微高一点,当大家把这个形态学划分划好之后啊,往下分析其实也没有多难啊。
48:00
用一些简单的基因看各个区域的一个分布特征,包括他形态学的一个变化啊,包括之前讲到的空间CV,空间邻居通讯这都可以做啊,只不过很多时候呢,空间形态这个化本是我们那个薄弱。二分之后并不知道该怎么办。所以才会有一些什么,我一定要多单细胞,要缩空间的这样的浓缩。啊,就是没有单细胞数据啊,没有单细胞数据,当然有单细胞数据就是另当别论啊,我们休息五分钟吧,休息五分钟我们来看一看。两边你看的一个分析思路啊。
52:05
啊,有的同学问,说是我只有空间转录的数据,但是形态学确实划分不出来,我能不能用马机进行一个绝对定量的,这个好像是做不到,可能做不到的。啊,很多时候呢,对于我们这些,呃,刚接触的研究者啊,刚接触的一个研究者啊,尤其是大家的硕士博士刚一年级二年级的时候,对这个中性分析啊,对这个单细胞空间的研究进展啊,并不是太熟悉,看的文章,看的文章也比较好,所以拿到一个东西啊,诶不知道该怎么下手,所以会大家会报学习班,但是学习班也有一个很大的问题,就在于那个时效性很短啊,很短。大家如果学习这个生性技能,当然这些学习方案都是一个。哎,过个几年都可以,但是这个迭代的过程实在是太快了。
53:03
像一八年做单细胞跑个轮子就可以了,没有什么后续,顶多再做个复题。什么通讯啊,轨迹啊,都没有听过这些内容。哎,等到一九年的时候,大家会发现,哦,原来还要做通讯,做轨迹,做什么CV等等,当时我记得做CV的时候,因为CV的一个主要内容特点是细胞基因的一个拷贝数变化,所以在基因组的层面上是更准确的,所以说在开发这个软件的时候,大家都在质疑,说这到底能用吗?哎,等到后来也有大部分大幅的文件开始用的时候才发现哦,是不是这样。啊,等到2020,但是空间上来的时候啊,空间一开始就是一个高位选手啊,他的个性化分析从一开始上来就非常难,因为大家有了单细胞做基础之后呢,空间短路组一出来,大家就开始讨论空间怎么做,通讯怎么做,轨迹怎么做,这个呃,这个关于转录因子啊等等这些想法都有。
54:02
呃,当时我记得很多这个客户啊,直接把这个单细胞的内容套到空间上,说我要对空间剧烈之后每个class的做轨迹,做通讯做什么的,当时我告诉他说是我们要利用空间信息,每个点并不是单细胞,这些分析没有用啊,还是客户臭骂了一顿啊。不是,你到底懂不懂,还被客户臭骂了一顿。哎,等到过了大概三个月吧,客户要找回来了,说你说的对,好像是不能用,所以说呢,每种主题数据都有他一个分析特点,大家不能套,像单细胞数据大家可能都熟悉了,你都知道该怎么分析了,但是那些方法在空间上是没法用,很多是没法用。我们来继续继续看一到两篇文献的一个分析思路啊,大家看这篇文献发表在这个顶刊上,他这个从2020年11月30号,诶希味就是杂志,这大家可以看到是2020年,也就是说他做这个实验的时候,肯定要肯定是2019年开始做,至少要一年的时间,2019年空调转让组还没有进入国内呢。
55:10
还没有进入国内的呢,还是国外的,大家可以想想2020年,哎,那个时候大家还知道空间转换是这么回事。2020年这个接收到这个文件,等到真正接收的时候是2022年的时候是吧,就是说将近一年半啊,两年吧,将近两年的时间,也就是说光投稿到审稿到接收整个过程都经历了两年。哎,可见这个过程多么的漫长啊。大家投的杂志越高。他的这个审稿周期啊,等等越漫长越漫长。但是一旦你投到顶刊啊,他如果没有直接的refuse掉,就是没有直接的去掉,哎,基本上就进行大规模的修改之后,就是投不到这个顶刊了。也可以啊,也可以做一些。也可以投到一些相对高温的一些题卡啊。
56:03
大家可以看一下研究心梗的这样一个内容,首先从课题设计上来,这就非常的完美,从取样上诶,对这个心脏啊,进行这个形态学的一个划分,取样的时候呢,对各个区域进行一个取样啊,这个一般是做不到的啊,首先取样状他已经领先也是很多了,现在很多医生做这个样本啊,很多都是现成的样本,就FIP或者什么样本就是肿瘤块。然后他想做空间转告组,问我怎么做,到时候我问问他,诶预货信息有没有没有,Apple有没有没有,或者说有,他也不知道哪个地哪个块里面有,呃,整体的这个课题数据前面就落人家一大级嘛,导致整个的一个后续分析难度非常大。大家可以看一下,它取样之后呢,不仅做了。癌细胞啊,也做了这个a attack。嗯,单细胞和液态可呢?Ape这个数据啊,运用的目前来讲啊,运用的不多,呃,成人T发表文章也很少转录,但是转录组加apeag这样一个联合分析目前比较多,他对于认识这个组织开放区以及细胞类型的一个分布,确实嗯。
57:09
非常有,呃,有很有很重要的一个作用。哎,对单细胞的a tag进行一个分析之后呢,这里提一句,大家看一下这个特点。干细胞和AT是分开分析的啊。大家看文章有时候要看的要呃要有点敏感度啊,因为现在单细包和很多时候无论是公司还是个人啊,直接就把两个数据直接整合到一块去。啊,但是大家看看文献啊,文献看看他有没有整合的。大家就知道了,大家就明白该怎么做。然后就是对细胞类型,呃,联合之后看细胞类型的一个空间分布特点啊。还有通路打分儿等等。包括TF帮性,就TF帮活性啊,其实就是大家做了转因子分析之后,一些转入的一个调节子,把那个调节子进行个打分,看它的个空间分布是怎样的。
58:00
这是它最基础的一个,第一张图是最基础的一张图,从取样到单细胞定义,到这个空间分布特点等等。接下来呢,它会进入到一个非常超高个性化的一个分析内容,大家可以看它的一个发表时间是202。2020年那个时候他做这些分析啊,很多是非常超前的啊,非常超前,那个时候大家还不理解生态位,不理解空间聚类,不理解多样文整合的意义的时候,这篇文章已经运用到了如此多的方法。等到发出来的时候,已经是2022年,也就是我们至少落后别人两年了。但是这个方法一放在现在依旧非常经典,首先是这个细胞生态位的问题,每个点呢,还有多种细胞类型,我们对这些呃细挖呃细胞类型挖库的矩阵进行一个剧烈分析呢,分析每个这个生态位的一个分布的一个无论是空间特点,还是它的一个历史的一个细胞类型组成,其实都是对空间空间组织一个很详尽的一个数据分析啊,数据分析,然后通过分析这个细胞类型的空间控定位。
59:07
来了解无论是正常还是新总样本,他们之间的分布状态,也就是空间组织结构的一个结合性啊,局性,关于空间固定位啊,这个方法其实呃,这个方法其实也是我看了这篇文章之后才发现有这样一个新的分析内容,之前从来没有人提过这个空间共定位的一个内容,包括之前很早的时候spotlight。他有这个空间固定位的一个,呃,内容的展示,但它只是展示一个点。一个点内的一个空间功能,呃,直到这篇文章出现的时候,大家会发现它的空间利用信息会更高一点,他会考虑临近的点,甚至更远的地方。呃,离近这两个更远的点呢,分析出来这个生态位啊,主要体现细胞类型,它的一个清出远近关系。哎,尤其是这样,前面的例齿呢,它分析的是一个生态位,就是说这个地方呢,我们可以看到为两种细胞类型,它们之间的一个亲属远因关系,这几张图呢,主要是体现多种细胞类型它们之间的一个组成,比如说每个逆呢,它是由多个细胞类型组成的。
60:12
而且他们之间之间存在很大很强的一个定位关系,然后呢,通过每个历的一个空间分布特点,大家可以看一下,有的这个历呢,它的空间分布会依靠一点散带一点。啊,有的呢,像这个克class斯五,它在这个样本就会集中一点,也就是说克拉斯五这种。多种细胞类型的组成呢,诶,它在这个样本中更加的集中,也就说这些细胞类型它的集中趋势会更集中一点。而且他们在行驶工程上会有一些不同,这个地方主要是告诉我们什么呢?就是告诉我们无论是这个这个是康草区域,这个是这个其他的区域。这些区域之间的细胞类型的组成啊,其实都是一样的,就这几种细胞类型,但是他们在这个形成各个部位的时候呢,他们细胞类型之间的一个,呃,组合呢,学的不一样。
61:02
激光类型种类就这几种。哎,但是每个逆呢,就是挑选其啊,每个逆呢,含有的细胞类型的组成是不一样。体现在空间上,就是它们会形成不同的空间结构域。哎,这些结构又会形成特殊的功能。啊,接下来呢,会在这些特殊的结构功能进行一个调理的话,我们还包括他们之间的一个分布状态。大家可以看一下这高类型的分布状态,还有一些其他的,比如说这个。哎,特定细胞类型分布,哎,整体上从这个多个样本,呃,多个这个不同的细胞类型分布状态上来看,细胞类型的一个分布差异,以及包括他们组合的一个差异。这是细胞生态位啊,细胞生态,当然它后面还呃补充了这个分子生态位,分子生态位就是我们常见的这个分子矩阵,做这个降维聚类的皮子之口。的一个分析内容,分子生态位呢,也是一样的道理,每个分子生态位所包含的细胞类型也是不一样。
62:00
也是不一样,这里面它做分子生态位,主要是和前面的细胞生态位进行一个呼应,看看他们的一致性有多高,大家也可以看到这个每个空间上它的一个生态位的一个逆食呢,而它的分空间分布上具有很大的一个差异性,这个跟我们单细胞的认知是不一样的,那单细胞大家非要把它强行矫正到一起,但是空间上大家不能强行矫正。大家更多的是要依据形态去进行化。哎,像这种样本呢,红色的样本,红色的这个群呢,主要分布在这些地方。在这个。呃,集成相,呃,这个这个这个地方这个组织样本中分布的多一点啊,这个样本分布纤维化的又多一,它体现的是这种细胞类型分布,呃,细胞类型组合在空间上分布的这个差异性啊。还有分子力是在空间道分布的一个特点,那这个可以可以看一下这个特点。还要说明那个生物学的问题,就是空间组织结构变结构与变化的这些问题啊。
63:01
这篇文章发的很高,发的很高,所以它的内容分析也非常深啊。接下来呢,就是呃,它一方面呢,对每个细胞类型进行了一个亚群的分布,分了好几类,看看它们之间的一个空间分布的一个特点,包括通过的一个结合性。然后呢,大家可以看一下,一方面还会有这种轨迹分布的一个表达。维基丰富的表达,其中最关键的就是亚群,它和各个细胞联型之间共定位的一个状态。即使是同一种细胞类型,它的不同亚群在核细胞类型共定位的一个情况呢,也是存在很明显的一个差异。打开看一下。像CM3呃,CM3这种细胞类型呢,是CM细胞类进行第三类,但是它在不同的样本中呢,却合在却和不同的细胞类型存在共定位。哎,那说明他们之间的病变是由于这个细胞排列发生了变化导致的。等等等等,通过研究这种细胞类型的空间排布,甚至大家可以研究一下空间近距离距。
64:03
哎,以此来了解疾病的发生的一个定律啊。啊,这种空间轨迹的一个分析呢,其实更多的是一种了解它组织形态发生变化的,比如说像这图从这个方面呢,呃,左上角表达比较高。啊,到了电量越来越低,空间的图也是一样的啊,表达趋势的一个分动变化,其实也是空间转动度学,尤其是轨迹分析一个重要的内容啊。然后接下来呢,也是同样的一个内容啊,对某种细胞类型进行亚群分布,看它一个,看它和各个这个细胞类型之间共定位的一个情况是怎样不同的一个,呃,相同的细胞类型,其实不同的亚群,它供定位情况的一个不同,也会体现出它的一个生物学的一个变化。哎,组织形态是它们之间的一个变化。等等啊。下面呢,基本上都是同样的一种分析思路,只不过是把这个分析思路呢,用不同的细胞类型分类亚群啊,再做一遍,看看他们空间的排布问题,固定位问题,轨迹问题等等啊,这些都是讲过的,就现成方法都可以做,然后这篇文章就基本上结束了。
65:16
啊,大家可以看一下,其实他这个思路啊。啊,其实比较没有那么难,但是大家实际分析的时候呢,难度其实是非常高非常高的,包括他还做了一些精准的一个信息啊,其中大家要学习的地方就是第一个就是它的一个分子生态位。呃,细胞生态位一个问题,每个生态位呢,它是由不同的细胞类型组成,第二个呢,就是这个。细胞的一个固定位问题啊。这个细胞固定位呢,主要是多种细胞类型之间的一个固定位,其中呢,大类的固定位,以及小类的固定位,这个大家都在后续分析中都是要做的,都是要做的,有利于大家认识呃,更更深层次的认识这个公学问题。
66:02
然后分子生态位、细胞生态位空间排布。诶,等等,还有空间轨迹,就这几个方法,大家把它操作一下基本上就可以,呃,这篇文章的方法大家都基本上都学到了啊,关于空间的一个分布内容就基本上都学到了。当然我说的比较简单,大家实际操作这个非常难啊。呃,最后呢,我来我们来看一遍关于这个近距离啊,近距离通讯的一个问题,之前老师讲这个生态位的一个问题,呃,讲这个生态位细胞类型的一个问题,大家可以看一下。通过研究。这种。这种药。这个核心的一个细胞类型,他们之间在单细胞空间上的一个分布啊。嗯,单细胞数据分析之后呢,进行细胞定义啊。嗯,当然单细胞前面的差异剧烈降,呃呃,差异那个嗯。
67:00
嗯,降为剧烈差异负极这些基础问题呢,大家。我一般都会做啊,但是真的用到空间上,大家可以看一下,它首先考虑的就是细胞类型,它周围富含量的一些细胞类型的一个问题。嗯,这也是目前空间转动组的一个,呃,共识啊,一方面呢,它通过聚类来找每个聚类的一个特点。另一方面呢,他会看基,每个马克基因,每种细胞类型基因的一个空间分布的一个内容,这里面呢,它用到这个数据呢,它用到的是华大的数据。呃,华大的数据呢,大家通常都说他会做到单细胞级,做到单细胞,但实际情况是他做不到单细胞级啊,大家可以看到,即使拿到单细胞级这篇文章,其实用到单细胞级了,但是他在注释的时候还是注释了两类啊,大家可以看一下H这个注释。嗯。它其实合并的病是并20就是单细胞体,但是他在注释的时候发现每个点呢,其实并不是单个细胞的,还是有其他细胞,所以他在联合之后也和单细胞数据联合之后呢,注视成了两层,就是这个点呢,同时含含有这个细胞类型的,也含有另外一个细胞类型,所以说真正的做到单细胞及。
68:11
嗯,还有很长的路要走,包括现在推出了一种原味的一个数据。它那个单细胞集也是经过算法推断的,很多啊,实头的技术已经说过了,这种方法也是不准的,不准的。然后呢,就进行一个生态物的分析,这个图呢,大家已经见了很多了,点内点尖杂点。啊,包括我们分析通讯啊,也是分析这个临近通讯细胞类型呢,也是看这种周围包周围点的一个细胞类型的一个负极情况等等。拿到这样一个数据之后呢,基本上就可以找到大家把细胞类型的一个分布特点。像这个地方HSPMPB是目标细胞,也就是分布细胞类型的一个重点啊,分布细胞类型的一个重点,大家在之前就拿到了,呃,就定义好这些目标点,然后对目标点周围的一个基因表达,包括细胞类型分布进行一个详细的一个判判,详细的一个分析,就是我们之前讲课的时候,大家讲那个生态微矩成班方法。
69:15
那个方法可以直接帮助大家来识别目标,是目标区域的一个基因表达信息,包括细胞类型、组成信息。等等。诶拿到这个之后呢,基本上就可以对他进行空间离机通讯,接下来他做一些原位的一个验证。就是荧光的一个验证,验证之间的一个分析结果,包括他们之间定位的一个情况等等。诶,今天文章基本上就结束了,他所研究的内容呢,其实更多的是要找到。哎,目标细胞类型,它那个微环境是怎样。这就是空间转录组,它带给它的一个主要分析特点啊。啊,其实大家也都发现了,其实单细胞空间啊,更多的是。让我们认识问题,更清楚的认识问题啊。
70:02
啊,很多的方法呢,值得大家借鉴啊,包括我也讲了很多的方法,但是不是每种方法大家都要套用一遍,大家分析什么样的样本,分析什么样的数据,呃,用到什么方法,把它拿出来用一下就可以了啊。But'know about。好啦。文献部分呢,我们就这样呃过一下,大家其中要注意,其实这里面主要强调的是大家对方法的一个运用问题,包括我讲的很多方法,我也不可能把所有的空间转换的方法都能一一涵盖到,因为空间转漏组也在一个不停的发展过程中,还会有新的方法出现啊,还会有新的方法出现,大家要保持一个学习的习惯啊,在这个空间转动组了解了大部分特征的基础上,进行一个不断的迭代学习啊。而且我所讲的方法已经足够大家发文章了啊,足够大家发文章了。好啦。今天的课我们就到这里吧啊。
我来说两句