温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
不拆分成五个部分,然后我们来分步讲解,第一个部分就是要读这篇文献,所以我们在这个地方加上一个读文献,这个文献呢,我就不带领大家怎么样读文献,有两个问题,第一个问题是这个原文你肯定要去下载下来是吧?然后的话,我的解读你感兴趣也可以下一下,就是我自己当时解读过了,像这样的文献,我在征信技能术的文献俱乐部里面发过很多,然后大家也能够在拷给你们的预盘资料里面拿到,就是大概到我博士毕业可能会有200多篇生物信息学相关的,就是把NGS技术应用到各种cns文章里面的,这样的文献解读你们感兴趣的话就可以跟着一起读下来,这是一个长期的过程,大家都知道,一入科研深似海是吧?好,这篇文章我们就不读了,我们直接看他得到了什么结论,他的结论就是这几个基因集是他的这个化疗耐药相关的是吧?就是叫找到了化疗耐药相关的基因集,所以这是第一个任务,就是毒文献,那这个毒文献你们觉得需要耗费多久呢?至少是大于十个小时。
01:12
这是很复杂的一篇文献,所以我们不可能十个小时就带领大家读文献是吧?好,我们来看第二个,我们不是拿到了三个基因啊,六个基因集嘛,那么就要去数据库查询指定基因级的基因列表是吧?这个的话我其实在这里已经把它拆分过,就是。他文章里面描述过来自于哪些文献是吧,但是这样的话会有个问题,你每篇文献都要看这么多,是特别就是你可能又要耗费另外一个十个小时每篇文献,那我们就有一个简单的方法,就是这一个数据库,Broad的这个数据库,这个数据库里面就记录着。这里这个应该叫八个大类基因集,然后每个基因集下面还有小的类别。
02:02
我等一下会详细讲解哈,通过这样的数据库查询,就能够查询到它里面有多少个基因,然后有一些基因集是需要看文献的,就是文献可能还是需要看,但是大部分的都是通过数据库拿到的是吧?你有了基因集之后,那我们就需要去下载表达矩阵,因为我们是拿我们我们单细胞得到的基因级的下游来证,来在我们的公共数据库里面证明这个基因集是很有生物学和临床意义的,是吧?那这个表达举证怎么来呢?你就要熟悉。你就要熟悉这个数据库,这个的话就你做什么癌症就有什么癌症特有的,你做肝癌就有肝癌的,脑胶质瘤就有脑胶质瘤的,也都是两三千个样本,每个癌症都有别人做过Meta break,它是另外一个,反正就是一些指定癌症的联盟,比如说这个就是乳腺癌的一个二三十个单位,他们就做了2000多个病人。然后的话,这里需要注意的是需要去挑选。
03:00
挑选病人,这个挑选病人的话,就一定要去根据文章他来了,当然你自己就是你自己的挑选,你每个人做研究的时候都不会把人家的数据全盘给复用,一定要搞清楚你想探索什么,熟悉它。我们这时候基本上来说只需要下载表达矩阵就好了。有了Meta break,有了基因集,现在就是用G算法而已,这个算法就能够判断你的基因集。在这个表达矩阵里面的得分是吧,这个GSVV算法呢,我这里也是让大家去看这个代码,如果。把gotg课程给学完了,实际上是很容易找到对应的代码,我们最后带领大家找一遍。最后是生存分析,我们把它分成这五个步骤。就是这五个步骤,现在我们来一一重现一下。
我来说两句