1.warning不影响,error是报错。
2.一般不更新R包,容易报错。
3.cannot open the connection是网络问题。
4.安装R包的代码是install.packages("xxx")和BiocManager::install("GEOquery")。
5.Rstudio分为四个模块:脚本编辑框 环境历史 控制台 文件画板 包。
6.GEO中expression profiling 是转录组测序,high throughput sequencing是高通量测序(二代测序)。
7.?getGE是查看函数的指令。example可以参照。
8.GSE是整体数据集的编号 GSM是每个样本的编号 GPL是平台号 GDS是多个GSE
9.gset = getGEO(GEO='GSE12417', destdir=".",getGPL = F) destdir="."保存到当前路径用.
getwd()查看当前路径
setwd(" ")是设置工作路径 路径都是/这种斜杠
getGPL = F是不下载GPL信息。
10.每次打开Rstudio用R包 都要先加载。
11.ctrl+f是网页对应的搜索键。
12.转录组测序测的是mRNA。包括前体和成熟的rna。第一行样本名 第一列是基因。
0维是点 是元素
1维是线 是向量
2维是面 是数据框
13、向量vectors 矩阵,数组,数据框,列表
14.数据类型 数值型 字符型 逻辑型 因子型
15.使用c()来创建向量,向量具有有序性,单个向量数据类型相同。数值型转字符型
16.涉及字符要加引号
17.library一般不加引号
18.c可以创建向量或列表
数据框按照列的方式排列
19.a1=c[3,c(1,2)]提取第三行一二列 a1[3,] a 美元符号第二列名称
20.b[c(2,4)]在b向量里提取2和4元素。
21.构造数据框的函数a=data.frame()。
22.
第四行说明其是芯片数据。
at是探针 引物不特异导致了一个ID对应多个基因。
phenodata 中data临床数据和expr表达矩阵很重要。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。