下面是休假期间的微信群答疑笔记
来源2022-生信入门年度交流
这样的代码即可
table(Idents(sce.all))
unique(sce.all$celltype)
length(unique(sce.all$celltype))
ord = c( "Endo" ,"Fibro" , 'Pericyte' ,'SMC',
'Tcells','Mac')
sce.all$celltype = factor(sce.all$celltype ,levels = ord)
table(sce.all$celltype)来源2022-生信入门年度交流
试试去官网重新下载校园版 https://www.netsarang.com/en/free-for-home-school/
可以去检索一下其他登陆软件,课程中为了教学统一了Xshell,实际上还有很多好用的软件比如MobaXterm


来源2022-生信入门年度交流
你绘图里面的y应该是有问题的

来源2022-生信入门年度交流
0.25。
来源2022-生信入门年度交流
有一个包叫ggvenn,可以画到下边

来源2022-生信入门年度交流
用IGV看,应该是转录本来源于正义链(+)或反义链(—)DNA
来源2022-生信入门年度交流
你得找中山大学的同学给你搞
来源2022-生信入门年度交流
CC没有富集到通路或阈值调大试试;
来源2022-生信入门年度交流
很多网页工具如LISA http://lisa.cistrome.org/
这个网页工具也可以,https://regnetworkweb.org/search.jsp

来源2022-生信入门年度交流
页边距没有设置好,使用par(mar = )这个参数来设置
来源2022-生信入门年度交流
这是两款不一样的芯片,或者是iPhone14和iPhone14Pro

来源2022-生信入门年度交流
ord=order(phe$icluster)
pheatmap(df[,ord])
我的理解是net$colors中的colors已经跟genes形成对应关系, 在上面的例子中,labels2colors 改变的也只是颜色,但模块的基因数量并没有改变。根据help文档描述,我理解是,没有赋予colors时可以使用 labels2colors 赋予,不知道有没有理解错了。
我查询了逐步分析法的代码,发现 labels2colors 用在dynamicColors的时候,目的应该就是赋予颜色。
来源2022-生信入门年度交流
代码遗留问题,你的理解是对的。


来源2022-生信入门年度交流
pca的每个pc以及其代表性基因区别
来源2022-生信入门年度交流
有一些 fastq 文件不完整,需要重新上传或者下载

来源2022-生信入门年度交流
Project大小写没写对,大小写是敏感的


来源2022-生信入门年度交流
你要聚类,他就给你真实的情况,比如你想把一堆人分成穷人和有钱人,难道穷人和有钱人是泾渭分明的吗?有一些穷人会假装有钱人的

来源2022-生信入门年度交流
写错了文件夹名

来源2022-生信入门年度交流
那你就先想办法把数据框行列搞一致哦
应该是先取列名取交集,然后把两个数据框的列名统一然后合并
来源2022-生信入门年度交流
有更好的,没必要这个,去查看菜鸟团公众号介绍
来源2022-08(生信入门,暑期,收官)
如果还不行,就pdf 3段式保存后再查看吧


来源2022-08(生信入门,暑期,收官)
没有

来源2022-08(生信入门,暑期,收官)
基本一致 除了直接wc会带上文件名,用cat和管道符不带文件名之外

来源2022-08(生信入门,暑期,收官)
Jobs只能看你当前这个窗口的后台运行的命令,如果你想看所有在运行的命令 可以用htop

来源2022-08(生信入门,暑期,收官)
只是为了连带操作,我们要对文件进行处理,先简单 cat 一下了解一下这个文件内容
来源2022-08(生信入门,暑期,收官)
gene和转录本的区别,一个基因可以有多个转录本

来源2022-08(生信入门,暑期,收官)
if后面的条件判断用小括号
来源2022-08(生信入门,暑期,收官)
file是log2TN 有正有负 ,这样就不行,建议重新定量,需要整数count


来源2022-08(生信入门,暑期,收官)
安装trim的时候依赖程序cutadapt没有安装成功,需要卸载trim-galore重新安装
来源2022-08(生信入门,暑期,收官)
是的,有差异,热图看得清楚

来源2022-08(生信入门,暑期,收官)
你前面的报错,就是文件不存在,路径给错了
来源2022-08(生信入门,暑期,收官)
/home 是服务器上的一个文件夹,一般保存用户的主目录,比如一个讲师的用户名是 t_rna 那么期主目录就是 /home/t_rna 。不过学员的主目录不在 /home 而在 /trainee ,这是我们处于方便管理才这样操作的。
HOME 是一个变量,记录用户的主目录,即上面 t_rna 用户的的 HOME 就是 /home/t_rna
主目录和家目录一般不做区分,这两者是同个意思

来源2022-08(生信入门,暑期,收官)
你的代码是一步一步运行,不需要叠加
来源2022-08(生信入门,暑期,收官)
如果不介意看英文的话 英文版更佳 而且不需要买 在线就有,喜欢看纸质书的话可以入一本纸质的

来源2022-08(生信入门,暑期,收官)
https://unix.stackexchange.com/questions/116955/where-is-cd-located
来源2022-08(生信入门,暑期,收官)
对于非模式物种,没有已知的就只能自己构建了
来源2022-08(生信入门,暑期,收官)
PDF保存设置长宽
来源2022-08(生信入门,暑期,收官)
把id倾斜45度显示会出现两边的id显示不全的情况,修改一个参数可以,但是参数太多了,你系统性学习ggplot可以解决

来源2022-08(生信入门,暑期,收官)
如果是小鼠的话 你的orgdb是不是用错了

来源2022-08(生信入门,暑期,收官)
前面一个,你把缺了的那个包安装一下就可以了,后面这个没有报错哦
来源2022-08(生信入门,暑期,收官)
正常,除非你矩阵两次log了
来源2022-08(生信入门,暑期,收官)
有可能,基因表达量并不是 公理,定理,主要是看排序,看表达量高低,是一个线索,并不是金标准
来源2022-08(生信入门,暑期,收官)
文章里面没有,那就是没有
来源2022-08(生信入门,暑期,收官)
你工作路径下有中文特殊字符
bmi1 <- ifelse(dat0$bmi<18.5,"1",
ifelse(18.5<=dat0$bmi<24,"2",
ifelse(dat0$bmi>=24,"3",NA)))来源2022-07(生信入门马拉松授课)
8.5<=dat0$bmi<24,就错在这里,不支持这种写法
来源2022-07(生信入门马拉松授课)
理论上可以的,公共号里也分享过很多次。但是不推荐做无重复差异分析,转录组很便宜,做重复好一点。

来源2022-07(生信入门马拉松授课)
这个符号不是报错,主要是管道符前面就报错了。检查一下前面命令、输入文件路径等

来源2022-07(生信入门马拉松授课)
这个挺好的


来源2022-07(生信入门马拉松授课)
没有error 即可
来源2022-07(生信入门马拉松授课)
小洁老师已经贴心的把一切整理好了,改成BRCA就可以直接下载乳腺癌的数据
来源2022-07(生信入门马拉松授课)
是的,准确来说不叫打开,叫读取


来源2022-07(生信入门马拉松授课)
那是两个报错,两个原因。第一个报错因为确实没富集到,source 是第二个报错,找不到对象/文件,你应该把对应的文件放到你的工作目录下,用 Rproj 管理工作目录。

来源2022-07(生信入门马拉松授课)
file--reopen with encoding -- utf-8
来源2022-07(生信入门马拉松授课)
不建议联合。
来源2022-07(生信入门马拉松授课)
软件与环境的关系,在讲 $PATH的时候有讲到,理解 PATH,就理解软件与环境的关系。
一般而言手动安装的软件加入到我们在家目录里设置的bin里之后在任何的conda的环境里都是能调用的,手动安装然后加入~/bin和conda是互不干扰的两种方法。当然,如果你非要把软件安装到conda的某个环境中的话,你可以先找到那个环境(比如rna环境)的bin文件夹,然后把你手动安装的软件软连接到那个文件夹里去。

来源2022-07(生信入门马拉松授课)
cytoacape

来源2022-07(生信入门马拉松授课)
-y 就是抢答yes

来源2022-07(生信入门马拉松授课)
依赖包的问题,都安装更新一下即可。
来源2022-07(生信入门马拉松授课)
看官方文档推荐什么

来源2022-07(生信入门马拉松授课)
更新 rlang 包,先卸载 rlang。

FeaturePlot(sce, features = c("TMSB4X", "COL3A1", "COL1A2", "TMSB10", "COX6A2", "TCAP", "MYOZ1",
"CKM","COX8H"),
reduction = "umap", pt.size = 1,cols = c("green", "red"))+theme(
axis.line = element_blank(),
axis.ticks = element_blank(),axis.text = element_blank()
)来源2022-07(生信入门马拉松授课)
genes_to_check=genes_to_check[genes_to_check %in% rownames(sce)]
library(Seurat)
library(ggplot2)
pl = lapply(genes_to_check, function(cg){ FeaturePlot(sce, cg,) + NoLegend() + NoAxes() })
ps <- cowplot::plot_grid(plotlist = pl)
ps
ggsave("FeaturePlot_umap.pdf",width = 16,height = 15)来源2022-07(生信入门马拉松授课)
不可以,芯片没有M这个概念。