展开

关键词

R 矩阵

R 语言矩阵可以使用 matrix() 函数来创建,语法格式如下: matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE,dimnames = NULL ) 参数说明: data 向量,矩阵数据 nrow 行数 ncol 列数 byrow 逻辑值,为 FALSE 按列排列,为 TRUE 按行排列 dimname 设置行和列名称 创建一个数字矩阵: 实例 col1 col2 col3 row1 3 4 5 row2 6 7 8 row3 9 10 11 row4 12 13 14 矩阵 例如有个 m 行 n 列矩阵,使用 t() 函数就能转换为 n 行 m 列矩阵。 ? ? ? [,3] [1,] 2 6 5 [2,] 1 10 4 # 转换为 3 行 2 列矩阵 print(t(M)) 执行以上代码输出结果为: [,1] [,2] [,3][1,] 2

17920

数据处理R包

),然后应用(Apply)某些处理函数,最后结果重新组合(Combine)成所需格式返回,简单描述为:Split - Apply - Combine。 tidyr包主要涉及:gather(宽数据转为数据),spread(数据转为宽数据),separate(多列合并为一列)和unite(一列分离为多列) (1)gather 使用gather()函数实现宽表表 日期需要转换为文本,才方便读取。 > # ymd字符串转换为日期类型 : 年(y)月(m)日(d) > ymd('2020-01-23') [1] "2020-01-23" > class(ymd('2020-01-23')) [1] "Date" > # ymd_hms字符串转换为日期时间类型:时(h)分钟(m)秒(s) > ymd_hms("2020-01-23 12:29:24") [1] "2020-01-23 12:29

24920
  • 广告
    关闭

    即时通信 IM 首购89.9元/月起

    丰富 UI 组件助您极速集成聊天、会话、群组、直播弹幕等完备IM功能,全球接入,全平台跨终端互通,安全可靠,IM 首购0.9折起,复购7.5折起

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言系列第一期(番外篇 ):R6种对象—向量、矩阵、数组、因子、列表、数据框

    前文我们讲到R处理数据面对6种对象:向量,矩阵,数组,因子,列表,数据框。 A. 那我们就得好好给大家介绍一下这位能者6个对象都什么样子了。 · 2.矩阵 · 矩阵是一个二维元素向量组,其实就是向量一个升维版,内部元素也必须一致。换句话说也可以分成三种类型矩阵。 ,byrow/bycol如果参数值为TRUE,那么就代表按照行/列填满数据(默认纵向优先),dimname代表每个行和列表头名(不是标题),dimname必须是list格式。 可以按列或者按行分别使用cbind和rbind函数向量‘粘’在一起。 到这里,我们R对象就介绍完了。这部分内容是一个基础部分,可以让你理解R是怎样工作。之后我们继续揭开R神秘面纱,敬请期待吧。

    79320

    R语言 常见函数知识点梳理与解析 | 精选分析

    15、字符串处理函数 character:字符型向量 nchar:字符数 substr:取子串 format,format C:把对象用格式换为字符串 paste,strsplit:连接或拆分 charmatch :把数值型对象分区间转换为因子 table:交叉频数表 split:按因子分组 aggregate:计算各数据子集概括统计量 tapply:对“不规则”数组应用函数 17、数学计算 +, -, *, data.matrix:把数据框转换为数值型矩阵 lower.tri:矩阵下三角部分 mat.or.vec:生成矩阵或向量 t:矩阵置 cbind:把列合并为矩阵 rbind:把行合并为矩阵 diag :矩阵对角元素向量或生成对角矩阵 aperm:数组置 nrow, ncol:计算数组行数和列数 dim:对象维向量 dimnames:对象维名 row/colnames:行名或列名 %*%:矩阵乘法 计算数组概括统计量 aggregate:计算数据子集概括统计量 scale:矩阵标准化 matplot:对矩阵各列绘图 cor:相关阵或协差阵 Contrast:对照矩阵 row:矩阵行下标集 col

    39121

    数据可视化|如何用wordcloud绘制词云图?

    $c.Text1..Text2. )#这里doc_id不可替换成别的词 创建数据框格式文本 #创建数据框格式文本,第一列是doc_id,第二列是文章内容 TEXT_ds<-DataframeSource (TEXT_title) 构建语料库 Corpus<-VCorpus(TEXT_ds) 针对语料库文本转换 思路:删除语料库中标点符号,字母转换为小写,删除数字,删除空白字符,过滤掉停止词库之后转换为纯文本 #计算频率 Term_matrix<-as.matrix(Term_matrix) #对词频权重矩阵表头进行命名 colnames(Term_matrix)<-c("Text1","Text2") # 把矩阵转为便于后续统计分析数据框 Data<-data.frame(Term_matrix) #导出两篇文章频率分析结果,文件名为Term_matrix write.csv(Data,'Term_matrix.csv 绘制星形图 Data数据计算频率Freq=n/sum(n),根据频率绘制星形图。 wordcloud2(Data1,size=0.4,shape='star') ?

    53331

    R&Python Data Science 系列:数据处理(4)长宽格式数据转换

    0 前言 在数据分析过程中,不同软件通常对数据格式有一定要求,例如R语言中希望导入数据最好是格式数据而不是宽格式数据,而SPSS软件经常使用宽格式数据。 特别说明:不要将长宽格数据转换为格式数据理解为数据透视表,宽只是数据存储形式发生变化,并不对操作对象进行计算,而数据透视表一般对操作对象进行某种操作计算(计数、求和、平均等)。 3 宽函数 Python实现 两种方法: 1 pandas库中pivot()和privot_table()函数; 2 dfply库中spread()函数; 方法一: ##构造数据 参数columns是格式数据中key键对应列名;参数values是格式数据中value对应列。 参数names_from对应格式数据key键对应列;values_from对应格式数据value值对应列。

    81711

    R语言快速入门主线知识点分享|文末有资源

    # 转换为matrix数据 is.data.frame(x) # 判断是否欸data.frame类型 array # 数组 list列表 list(x,df) ## 3、读存数据(read、save ) # 3.1设置工作目录【很重要】 setwd("E:/") #设置当前工作目录为"E:/" getwd() #读取当前工作空间工作目录(文件读取保存路径) read.table() #读取带分隔符文本 /数据文件 read.csv() #读取.csv格式数据,read.table一种特定应用 df <- read.csv("da.csv",header = T, stringsAsFactors= readxl) df <- read_excel("da.xlsx",sheet=1) 保存为.Rdata write.table() write.csv(df,"dfx.csv") # .csv格式导出 gather # 宽数据转为数据:(excel透视表反向操作) spread # 数据转为宽数据:(excel透视表功能) unit # 多列合并为一列: separat # 一列分离为多列

    11120

    Python 读取txt、csv、mat数据并载入到数组

    ,即动态二维数组 #然后双列表形式通过numpy转换为数组矩阵形式 def txt_strtonum_feed(filename): data = [] with open(filename strip()默认移除字符串首尾空格或换行符 datamat[row,:]=line[:] row+=1 return datamat #数值文本文件直接转换为矩阵数组形式方法三 ,最后在mian函数里使用np.arry()函数将其转换为数组形式,这里两种形式结果都输出): 2、调用numpy中loadtxt()函数快速实现。 首先这里csv文件编码格式必须为UTF-8,否则会报编码错误信息。(txtcsv文件流程:打开excel—>数据—>导入文本/csv—>编码格式选择UTF-8—>保存选择csv格式)。 scipy.io.loadmat(file_name, mdict=None, appendmat=True, **kwargs) #载入MATLAB文件 #保存一个带有名称和序列字典到.mat文件中

    13540

    44. R编程(六:向量类型详解1)

    ;如果需要避免factor 转型,则等向量一切处理完毕后,在转换为因子。 我们在向量转为因子时,可以使用默认顺序下levels 或手动设定,此时向量本身顺序并不会改变;但如果对已创建因子转换levels,则因子本身顺序也会按照levels 顺序改变。 最大区别在于,list 可以存储不同类型数据。 list 也可以有自己多维矩阵: 从输出结果来看,它与atomic 创建矩阵无二,但本质来说,其是不同。 atomic 矩阵如果元素修改与整体类型不同,则会强迫转型。 数据框 识别非法名称 image.png tibble 可以使用运算符号创建 为什么要窄ggplot 类型数据,不要长宽数据 转换rownames 方法: 数据框中定义列表方法 数据框中定义矩阵与数据框方法

    13240

    Day4:R语言课程(向量和因子取子集)

    我们使用R中函数取决于我们引入数据文件类型(例如文本,Stata,SPSS,SAS,Excel等)以及该文件中数据如何分开或分隔。下表列出了可用于从常见文件格式导入数据函数。 metadata <- read.csv(file="data/mouse_exp_design.csv") 注意:read.csv默认包含字符(即文本)列强制转换为factor数据类型。 前6行: head(metadata) 之前已经提到data.frame默认使用字符值转换为因子。 数据框或矩阵只是组合在一起向量集合。因此,从向量开始,学习如何访问不同元素,然后这些概念扩展到数据框。 使用关联索引[ ]以执行以下操作: 仅显示C,D和F. 显示除X外所有内容 以相反顺序显示字母(F,L,X,D,C) ---- 选择使用带有逻辑运算符索引 我们也可以使用带有逻辑运算符索引。

    49720

    R语言常用函数速查

    字符串处理 character:字符型向量 nchar:字符数 substr:取子串format,formatC:把对象用格式换为字符串paste,strsplit:连接或拆分charmatch,pmatch 因子 factor:因子 codes:因子编码 levels:因子各水平名字nlevels:因子水平个数 cut:把数值型对象分区间转换为因子table:交叉频数表 split:按因子分组aggregate 数组 array:建立数组 matrix:生成矩阵data.matrix:把数据框转换为数值型矩阵lower.tri:矩阵下三角部分 mat.or.vec:生成矩阵或向量t:矩阵置 cbind:把列合并为矩阵 rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组置 nrow, ncol:计算数组行数和列数dim:对象维向量 dimnames:对象维名row/colnames sweep:计算数组概括统计量aggregate:计算数据子集概括统计量 scale:矩阵标准化matplot:对矩阵各列绘图 cor:相关阵或协差阵Contrast:对照矩阵 row:矩阵行下标集

    81390

    R语言计算两组数据变量之间相关系数和P值简单小例子~应用于lncRNAtrans-act

    最近在看植物链非编码RNA内容,数据分析里有个一内容是预测lncRNA反式作用元件,通常做法是利用表达量数据计算皮尔逊相关系数,然后设置一定阈值进行筛选 比如 Horticulture Research 然后再筛选 这个函数要求输入数据是矩阵格式 Hmisc::rcorr(as.matrix(df1),as.matrix(df2)) ? 自定义函数这个结果转换成一个四列数据框格式 flattenCorrMatrix <- function(cormat, pmat) { ut <- upper.tri(cormat) data.frame 最后用变量名去匹配 lncRNA<-data.frame(gene_id=colnames(df1)) mRNA<-data.frame(gene_id=colnames(df2)) lncRNA mRNA 今天看B站视频 两个矩阵之间相关性热图这么容易画吗?

    3K20

    快速掌握R语言中类SQL数据库操作技巧

    初识R语言支持数据类型 1.1 向量 Vector : c() 1.2 矩阵 Matrix: matrix() 1.3 数据框 DataFrame: data.frame() 1.4 时间序列 XTS ("C.1", "C.2", "C.3")) 定义矩阵行名和列名 1.3 数据框 DataFrame: data.frame() #其中" <- "是赋值意思,向量c(11:15)赋值给对象x > x <- c(11:15) > y <- c(1:5) #向量x和y合并存储到数据框中,并重命名为xf和yf > data.frame(xf = x, yf = y) xf yf 1 置是一个数学名词,把行和列进行互换,一般用于对矩阵操作。 [2,] 2 5 8 11 14 [3,] 3 6 9 12 15 # 置后,变成5行3列矩阵 > t(m) [,1] [,2] [,

    78420

    数据处理 | R-tidyr包

    介绍tidyr包中五个基本函数简单用法:宽,宽,合并,分割,NA简单填充。 数据就是一个观测对象可由多行组成,而宽数据则是一个观测仅由一行组成。 #载入所需R包 library(dplyr) library(tidyr) #测试数据集 widedata <- data.frame(person=c('A','B','C'),grade=c(5,6,4 :需要被转换宽形表 key:原数据框中所有列赋给一个新变量key value:原数据框中所有值赋给一个新变量value ... :为需要转换长形表 key:需要将变量值拓展为字段变量 value:需要分散值 fill:对于缺失值,可将fill值赋值给被转型后缺失值 数据转成宽数据: wide <- spread(long , remove:是否删除被组合列 把widedata中person,grade, score三个变量合成一个变量information, 并变成"person-grade-score"格式 wideunite

    16910

    左手用R右手Python系列——数据塑型与长宽转换

    转换之后,数据结构保留了原始宽数据中Name、Conpany字段,同时剩余年度指标进行堆栈,转换为一个代表年度类别维度和对应年度指标。(即转换后,所有年度字段被降维化了)。 #选择将要被拉长字段组合 ) #(可以使用x:y格式选择连续列,也可以以-z格式排除主字段) ? 而相对于数据宽而言,数据宽就显得不是很常用,因为宽是数据透视,这种透视过程可以通过汇总函数或者类数据透视表函数来完成。 但是既然数据长宽转换是成对需求,自然有对应宽函数。 (宽)操作,甚至连内部参数都保持了一致风格。 还在Python中提供了非常便捷数据透视表操作函数,刚开始就已经说过是,数据宽数据就是数据透视过程(自然宽就可以被称为逆透视咯,PowerBI也是这么称呼)。

    69060

    一套完整基于随机森林机器学习流程(特征选择、交叉验证、模型评估))

    (https://file.biolab.si/biolab/supp/bi-cancer/projections/info/prostata.html) 数据格式和读入数据 输入数据为标准化之后表达矩阵 这样更方便提取每个变量,且易于把模型中x,y放到一个矩阵中。 样本表和表达表中样本顺序对齐一致也是需要确保一个操作。 如果group对应列为数字,转换为数值型 - 做回归 如果group对应列为分组,转换为因子型 - 做分类 # R4.0之后默认读入不是factor,需要做一个转换 # devtools::install_github # 如果group对应列为分组,转换为因子型 - 做分类 if(numCheck(metadata[[group]])){ if (! 分类效果评估矩阵Confusion matrix,显示normal组分类错误率为0.06,tumor组分类错误率为0.13。

    1.7K20

    R语言 基本统计分析

    图1 View(mtcars) > data(mtcars) > class(mtcars) # 数据类型[1] "data.frame" > dim(mtcars) # 数据(集)行列数[1] 32 ,doBy包和psych包提供了分组计算描述性统计量函数,doBy包中summaryBy()函数使用基本格式 summary()函数提供了最小值、最大值、四分位数、均值,另外还可以因子向量和逻辑型向量频数统计 ,doBy包和psych包提供了分组计算描述性统计量函数,doBy包中summaryBy()函数使用基本格式: # doBy()包中summaryBy()函数使用格式:# summaryBy( 推荐学习使用table、xtabs、gmodels::CrossTable ## 2.频数和列联表# 2.1 table #频数生成table(mtcars$vs)table(mtcars$gear) # 频数转换为比例 频数和列联表> # 2.1 table #频数生成> table(mtcars$vs) 0 1 18 14 > table(mtcars$gear) 3 4 5 15 12 5 > > # 频数转换为比例

    49430

    扫码关注腾讯云开发者

    领取腾讯云代金券