前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2023-10(数据挖掘马拉松)答疑汇编

2023-10(数据挖掘马拉松)答疑汇编

作者头像
生信技能树
发布2024-01-11 15:23:48
1230
发布2024-01-11 15:23:48
举报
文章被收录于专栏:生信技能树生信技能树

下面是优秀实习生的整理和分享

1老师你好,table是看重复频次的函数,我这边两个打的代码有什么区别吗?为什么下面的一个也可以运行,但是运行的结果我却看不懂?

下面那个是错误的,x=c(1,2);表(x);x=(1,2);table(x);下面代码缺一个c,c是一个函数,没有它,你括号就有问题,table(c(1,2)),每个括号给每个不同函数,各自配对。

那这个他为什么没有报错呢?

虽然没有报错 但是没有给你应有的结果 那也是出错了。

2关于作业想取列名为species中数值为a、c的行,为什么这两种得出的情况不一样啊?

==会循环补齐,是一对一的。

3各位老师我想请问一下,我的研究方向是关于乳腺癌miRNA,我看到老师写的各种数据标准化类型的区别,然后上xena网站上看到乳腺癌miRNAseq是经过rmp且log处理的,这种数据是被标准化的,所以可以直接用于后续的表达丰度的可视化以及构建模型嘛?那么我要进行差异分析是只能从gdc官网上下载原始count数据进行分析嘛?请问这边课程有讲解gdc官网数据下载和处理嘛?

mirna它这种东西比较奇怪,它的长度是固定的,所以它没有必要考虑rpkm等等,rpm即可,就是说k没有意义。

所以如果要进行差异分析,我只需要把经过log处理后的miRMA还原成rpm数据就可以了吧?

直接下载count即可,矩阵文件,ucsc xena。

4为啥我这个数据框用$取一列的时候要加 ' 才能取出来?我试了一下不加就会报错......

因为这一列单词比较长,中间拿了一个空格符分隔的原因,如果原始数据是Construct_Barcode 你再直接$ 应该就没问题了。

5小洁老师,这个order 排序为什么不是从1开始,为什么把2排到1前面。

这个函数并没有把这一串数值排序,他只是告诉你这一串数字的每一个值是排第几名,几个 match, merge, %in% 重难点,大家可以对它出题考核自己。

6老师,我有点晕了,duplicated返回的是T or F的逻辑值,那exprSet[ ,k]这个代码选择的是TRUE的列还是FALSE的列呢?

中括号是选择列的,这两者分开来看即可理解。

7各位老师和同学们,对于什么时候取不取log我有点不清楚了,芯片数据和count数据有不同吗?是只要不在0-20直接就要取log吗。TCGA数据库count在做WGCNA时要log吗?

只有芯片数据差异分析的时候需要log,其他的均不需要。WGCNA推荐用cpm或tpm,counts只用于差异分析。

8老师们,有个奇怪的问题,我赋值i=-3,然后运行下面的代码,每次输出结果都是---,然后i的值会自动变为4,这是为啥?

因为你有个赋值语句呀,<-是赋值语句。

9老师我跑森林图的时候,出现了这个报错,在网上查了一下也没整明白咋解决,您帮我看一下呗?

考虑是表达矩阵过滤的不太严格,相差的实际值比较小。可以考虑把这些基因去掉。

10为什么我的图出现在了左侧的控制台上?

rmd文件示例会在代码下发出现运行结果,设置只在网页输出即可。

11请问这个警告要去管他吗?

这样的基因确实是好奇怪,可以忽略它,这样的基因你跑出来后面实验也不好做。

12今天手贱把seurat更新到了5.0,原来的代码报错了,以为要重新下载4.0的重装,然后进官网时发现竟然只需要把“@”改“$”,给大家提个醒,以防有和我一样情况的人。

其实不同版本差异,没有想象中那么大,只不过对很多初学者来说比较懒,他们不想去摸索,只想用我们的制作好了的代码,所以给他们的建议是直接用跟我们同样版本的。

13这个包下载不下来,有别的办法吗?

github R包本地安装。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-01-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1老师你好,table是看重复频次的函数,我这边两个打的代码有什么区别吗?为什么下面的一个也可以运行,但是运行的结果我却看不懂?
    • 那这个他为什么没有报错呢?
    • 2关于作业想取列名为species中数值为a、c的行,为什么这两种得出的情况不一样啊?
    • 3各位老师我想请问一下,我的研究方向是关于乳腺癌miRNA,我看到老师写的各种数据标准化类型的区别,然后上xena网站上看到乳腺癌miRNAseq是经过rmp且log处理的,这种数据是被标准化的,所以可以直接用于后续的表达丰度的可视化以及构建模型嘛?那么我要进行差异分析是只能从gdc官网上下载原始count数据进行分析嘛?请问这边课程有讲解gdc官网数据下载和处理嘛?
      • 所以如果要进行差异分析,我只需要把经过log处理后的miRMA还原成rpm数据就可以了吧?
      • 4为啥我这个数据框用$取一列的时候要加 ' 才能取出来?我试了一下不加就会报错......
      • 5小洁老师,这个order 排序为什么不是从1开始,为什么把2排到1前面。
      • 6老师,我有点晕了,duplicated返回的是T or F的逻辑值,那exprSet[ ,k]这个代码选择的是TRUE的列还是FALSE的列呢?
      • 7各位老师和同学们,对于什么时候取不取log我有点不清楚了,芯片数据和count数据有不同吗?是只要不在0-20直接就要取log吗。TCGA数据库count在做WGCNA时要log吗?
      • 8老师们,有个奇怪的问题,我赋值i=-3,然后运行下面的代码,每次输出结果都是---,然后i的值会自动变为4,这是为啥?
      • 9老师我跑森林图的时候,出现了这个报错,在网上查了一下也没整明白咋解决,您帮我看一下呗?
      • 10为什么我的图出现在了左侧的控制台上?
      • 11请问这个警告要去管他吗?
      • 12今天手贱把seurat更新到了5.0,原来的代码报错了,以为要重新下载4.0的重装,然后进官网时发现竟然只需要把“@”改“$”,给大家提个醒,以防有和我一样情况的人。
      • 13这个包下载不下来,有别的办法吗?
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档