前面整理了100多套R代码,因为时间跨度有点长,而且公众号写作后没办法修改,所以安排实习生进行代码审查,看看是不是确实复制粘贴就可以运行。
一定是对我们《生信技能树》爱得深沉,才会在这大过年的时间段收藏我们下面的目录,并且一个个点开,复制粘贴我的代码去自己的电脑里面的Rstudio运行并且理解吧!
果不其然发现了不少bugs
运行最后报错,前面的代码并没有pro,需要自己随意赋值即可
运行下面这句代码的时候遇到了报错,但是我把devtools包删除后重新装了一下,再运行就可以了,不知道是不是这个原因,也有可能是网络不稳定?代码本身没有问题,也有看到网上有人说遇到类似报错先运行options(timeout=300),增加timeout再进行install。
不同地区的小伙伴安装GitHub包会有不同的困难,目前无解
1、airway应该是一个S4对象,但是环境变量显示Object with null pionter,虽然不影响后面的运行,每运行一句都会warning,但是总觉得怪怪的,我还没有找到解决问题的办法,还是本身这个内置数据就是这样的?
2、拿到filter_count后,进行DESeq2分析前少了一句代码 ,所以出现报错
exprSet <- filter_count
3、这句代码在画圈圈的部分,因为第一步结束的时候并未存成R.data,在第一步结束时save一下就好了
4、这个问题可能并不是所有人都会遇到,出现这个报错的原因是我电脑上ggplot2是3.3.6版本,而这里要求3.3.5,我把3.3.6版本卸载后,重新指定版本安装就搞定啦~
附带个人想法:我觉得圈圈图比较美观,但是信息量不大,火山图的信息量相对大一些。
1、引入批次效应
代码想要实现的是"我们对b1批次的4个样品,随机抽取1000个基因干扰它的表达量,算是模拟了一个批次效应",但是这里好像是对b1组全部基因都加了100,而不是随机抽取1000
ct_with_batch = filter_count
x= sample(1:nrow(ct_with_batch))
y = which(batch=='b1')
ct_with_batch[x,y] = ct_with_batch[x,y]+100
dat=log2(edgeR::cpm(ct_with_batch)+1)
ht_for_RNAcounts(dat)
2、这篇文章里并没有做正常表达量矩阵的常规分析,这个应该是之前做好的.Rdata。这一步需要读者自己生成文件后再接着做后续分析,不过跑一下也很快的。
3、对人为引入的批次效应的表达量矩阵走常规差异部分,只做到了提取差异分析结果,缺失设置上下调基因等后续部分代码。
我按照方法依然装不上,已经解决了hcc的问题,关于boost,我这边显示已经安装上了,但R上面进行velocyto安装时依然报错,我还需要再努力研究看看。
尝试了一堆方法之后,开始报错如下,不知道是不是跟我电脑M1芯片有关,暂时放弃了
1、因为之前没有安装"psych"包,所以开始安装这个包,发现目前的R版本装不了最新版本的Psych包,所以去CRAN网上查看了一下,发现5月10日时作者更新了包到2.2.5,所以又去查了这个包的历史版本,指定安装了2.2.3版本的R包,安装之后报错少了"mnormt"包,又去装了mnormt,最后成功安装psych包,
2、corr.test 这个函数需要两个矩阵X与Y的行数完全一致,我将两个矩阵转置后,都是500行,就可以了
3、for循环部分,两个矩阵的名字与之前不一样
这里突然出现了pd,我去研究了一下,是临床信息里的title列,需要获取临床信息的title列才会与正常illumina芯片数据使用lumin包lumiR.batch函数读取的列明信息完全一致。
看到文章中提到的是Deseq的问题,但是我遇到的报错如下
随后,我将DESeq与IMvigor210CoreBiologies两个包下载到本地安装,又又出现了之前安装velocyto.R的报错。
画风险森林图时没有library(survminer)
画诺谟图时library(rms)位置在这句代码之后,没有library(rms)包
1、这个GPL17692目前已经有注释文件啦
2、注释没有标#
3、前面用的是ids,这里突然变成了deg,改一下就好
1、pheatmap(y)代码被注释
1、data(fluidigm)显示not found ,换成fluidigm <- ReprocessedFluidigmData()可以
2、没有library(monocle)
3、将raw.data改成counts,不然会报错,这可能跟版本有关吧
依稀记得小洁老师上课的时候说,目前这个图现在已经做不了了,不知道是不是这个包的原因
1、统计检验相关部分:需要先data(airway)
包安装时出问题,后检查发现hugene10sttranscriptcluster.db少了".db",所以报错
根据报错,改成dplyr::filter就可以啦
小洁老师的关于10题的答案,由于有些数据集需要下载和整理,我还没有做完。
目前这个网址已经无法下载,所以没有跑后续的流程