下面是优秀实习生的整理和分享
1安装Rstudio时出现这样的问题怎么办?
卸载,这3个都安装在 C盘,R、Rstudio、Rtools。
2老师,想问下为啥我照课件上这么输入他这里给我报错呢?我就是想把箱式图和点图叠加。
那个代码,aes后面的x是大写的,换成小写的x就好了。一般大小写都要注意的,代码很严格。
3
你可以直接搜函数,str_split就可以。不过你这不需要拆,因为会有同样内容的一列,只有冒号后半句。
4
数据里有负值导致的错误,要换数据了。
5想问这种通路名重叠的可以通过调整参数来解决吗?
调整比例,拉高,或者是保存时设置参数,见帮助文档。
6想请教一下, pData(eSet[[1]])这里面的“1”是默认的吗,是因为GEO下下来的表达矩阵格式都是固定的,所以这个“1”是不变的,可以这么理解么?
有时候一个gse号码背后有多个数据,你就需要去肉眼看一看,第几个数据才是你要的矩阵,你就需要去肉眼看一看,第几个数据才是你要的矩阵。
7尝试在网上寻找解决方案后,修改过分隔符、还有编码格式,都无法把数据读进来?
试试看高级函数fread。此外,读excel文件用rio::import比较推荐。列名不够多,有没有可能header=F就搞定。
8各位老师好,想请教一下在整合不同的单细胞队列的时候,需要考虑他们上游分析用的cellranger版本是否一样吗,因为现在的V7好像还计算了内含子区域,之前版本好像没有?
如果你计算资源足够,就需要考虑他们上游分析用的cellranger版本是否一样,如果不够就放过自己,丰俭由人。
9今晚用tinyarray简化常规芯片分析流程这个RMD里面的代码运行,最后提示下标越界,但是用之前的分步骤的pipeline处理又没有问题,这个咋办呢?
你的数据里面有NA,要先处理掉NA,有NA的行少,就na.omit,多,就换数据。
10有一个问题想问一下,单基因画km曲线的时候,我看我有同学用最佳截断值来分组,得出来p大于0.05,我们用的是中位数p小于0.05究竟谁是对的?
谁说我们只用中位数啦?谁说一定有一个对的一个错的啦?最佳截断值的方法代码在LUAD文件夹里面,这个视情况而定。
11请教一下,我通过一个数据集找到的5个关键差异基因,想要用另外一个数据集验证一下对照组和病例组相比,这5个基因的表达情况,我应该怎么做呢?有没有什么包或者什么软件可以实现吗?
验证数据集的表达矩阵整理好,按分组信息查看这几个基因的表达情况,画箱线图就可以了。