下面是优秀实习生的整理和分享
1老师你好,table是看重复频次的函数,我这边两个打的代码有什么区别吗?为什么下面的一个也可以运行,但是运行的结果我却看不懂?
下面那个是错误的,x=c(1,2);表(x);x=(1,2);table(x);下面代码缺一个c,c是一个函数,没有它,你括号就有问题,table(c(1,2)),每个括号给每个不同函数,各自配对。
那这个他为什么没有报错呢?
虽然没有报错 但是没有给你应有的结果 那也是出错了。
2关于作业想取列名为species中数值为a、c的行,为什么这两种得出的情况不一样啊?
==会循环补齐,是一对一的。
3各位老师我想请问一下,我的研究方向是关于乳腺癌miRNA,我看到老师写的各种数据标准化类型的区别,然后上xena网站上看到乳腺癌miRNAseq是经过rmp且log处理的,这种数据是被标准化的,所以可以直接用于后续的表达丰度的可视化以及构建模型嘛?那么我要进行差异分析是只能从gdc官网上下载原始count数据进行分析嘛?请问这边课程有讲解gdc官网数据下载和处理嘛?
mirna它这种东西比较奇怪,它的长度是固定的,所以它没有必要考虑rpkm等等,rpm即可,就是说k没有意义。
所以如果要进行差异分析,我只需要把经过log处理后的miRMA还原成rpm数据就可以了吧?
直接下载count即可,矩阵文件,ucsc xena。
4为啥我这个数据框用$取一列的时候要加 ' 才能取出来?我试了一下不加就会报错......
因为这一列单词比较长,中间拿了一个空格符分隔的原因,如果原始数据是Construct_Barcode 你再直接$ 应该就没问题了。
5小洁老师,这个order 排序为什么不是从1开始,为什么把2排到1前面。
这个函数并没有把这一串数值排序,他只是告诉你这一串数字的每一个值是排第几名,几个 match, merge, %in% 重难点,大家可以对它出题考核自己。
6老师,我有点晕了,duplicated返回的是T or F的逻辑值,那exprSet[ ,k]这个代码选择的是TRUE的列还是FALSE的列呢?
中括号是选择列的,这两者分开来看即可理解。
7各位老师和同学们,对于什么时候取不取log我有点不清楚了,芯片数据和count数据有不同吗?是只要不在0-20直接就要取log吗。TCGA数据库count在做WGCNA时要log吗?
只有芯片数据差异分析的时候需要log,其他的均不需要。WGCNA推荐用cpm或tpm,counts只用于差异分析。
8老师们,有个奇怪的问题,我赋值i=-3,然后运行下面的代码,每次输出结果都是---,然后i的值会自动变为4,这是为啥?
因为你有个赋值语句呀,<-是赋值语句。
9老师我跑森林图的时候,出现了这个报错,在网上查了一下也没整明白咋解决,您帮我看一下呗?
考虑是表达矩阵过滤的不太严格,相差的实际值比较小。可以考虑把这些基因去掉。
10为什么我的图出现在了左侧的控制台上?
rmd文件示例会在代码下发出现运行结果,设置只在网页输出即可。
11请问这个警告要去管他吗?
这样的基因确实是好奇怪,可以忽略它,这样的基因你跑出来后面实验也不好做。
12今天手贱把seurat更新到了5.0,原来的代码报错了,以为要重新下载4.0的重装,然后进官网时发现竟然只需要把“@”改“$”,给大家提个醒,以防有和我一样情况的人。
其实不同版本差异,没有想象中那么大,只不过对很多初学者来说比较懒,他们不想去摸索,只想用我们的制作好了的代码,所以给他们的建议是直接用跟我们同样版本的。
13这个包下载不下来,有别的办法吗?
github R包本地安装。