首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言入门系列之一

sinmin()返回最小,此外which.min()返回最小idmax()返回最大,此外which.max()返回最小idabs()返回数值对象绝对sum()返回对象元素prod()返回对象元素的乘积...mean()返回对象元素的均值var()返回对象元素的方差sd()返回对象元素的标准差median()返回对象元素的中位数nchar()返回标量或向量元素的字符长度(包含空格)paste()paste(...x) #判断对象是否为矩阵 具体示例如下: 矩阵通过行、列id或者行列name对元素进行索引,也可以使用向量,id前加负号“-”则表示删除改行、列的元素,索引可以引入逻辑判断,如下所示: 注意,...()[,c('Package','Version','LibPath')] 查看当前版本的R可以安装的软件包,可以使用如下命令: available.packages() 利用该命令,我们可以查询想要安装的软件包是否在...使用命令: (.packages()) 可以查看当前工作环境加载的R包,使用命令: detach("package:packagename") 可以当前工作环境移除R包。

3.8K30

R语言︱文本(字符串)处理与正则表达式

paste 字符向量连接 match 匹配元素位置组成的向量 R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。...nchar这个函数简单,统计向量中每个元素的字符个数,注意这个函数length函数的差别: nchar向量元素的字符个数,而length是向量长度向量元素的个数)。...这三个函数返回的结果包含了匹配的具体位置字符串长度信息,可以用于字符串的提取操作。...但它们的返回长度(个数)有差 别:substr返回的字串个数等于第一个参数的长度;而substring返回字串个数等于三个参数中最长向量长度,短向量循环使用。...来自:每R一点:R语言中的字符串处理函数 strtrim函数 用于将字符串修剪到特定的显示宽度,其用法为strtrim(x, width),返回字符串向量长度等于x的长度

4.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)

nchar(sentence) < 2] #`nchar`函数对字符计数,英文叹号为R语言里的“非”函数 代码解读:在进行二级清洗的过程中,需要先转化为向量形式,as.vector; 字符数过小的文本也需要清洗...stopword$term %in% posneg$term,]#函数`%in%`在posneg$term中查找stopword的元素,如果查到了就返回真值,没查到就返回假 #结果是一个stopword...等长的波尔向量,“非”函数将布尔反向 testterm <- testterm[!...形成一个与原序列的等长的波尔向量,“非”函数将布尔反向就可以去除停用词。 stopword[!...向量长度依存于A,会生成一个与A相同长度的布尔向量,通过A[布尔向量,]就可以直接使用。 回忆一下,缺失查找函数,A[na.is(x)],也是生成布尔向量。 详细见2.3的停用词删除的用法。

3.6K20

R语言 常见函数知识点梳理与解析 | 精选分析

) 5、complete.cases( ) 判断对象中是否数据完全 6、grep()找出所数据框中元素所在的列(仅数据框中) 7、assign()通过变量名的字符串来赋值 8、 split()根据因子变量拆分数据框.../向量 9、unique()返回 x 但是省去重复的数值 10、round(),floor()ceiling() 11、sign() 符号函数 12、%in% 检验x是否为集合y中的元素(x%in%y...row col [1,] 1 2 [2,] 2 2 [3,] 3 2 [4,] 4 2 [5,] 5 2 4、pmin( )/ pmax( ) 把多个等长度向量元素逐个对比...) [1] 2 5 3 4 5 5、complete.cases( ) 判断对象中是否数据完全 complete.case()可以判断对象中是否数据完全,然后返回TRUE, FALSE。...range:最大最小 sum,prod:向量元素积 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approxapprox fun:插 diff:差分

2.3K21

Matlab系列之文件操作

MATLAB将文件根据数据的形式分为了ASCII文件二进制文件这两种,ASCII文件也就是常称的文本文件,文件内容中的每一个字节放一个ASCII码,即代表一个字符。...否则,errmsg是一个空字符向量可以将此语法与前面语法中的任何输入参数结合使用。 fIDs=fopen('all') 返回包含所有打开文件的文件标识符的行向量。...向量元素的数量等于打开文件的数量。 filename=fopen(fileID)返回上一次调用fopen在打开fileID指定的文件时所使用的文件名。输出文件名将解析到完整路径。...可选输出count返回成功读入元素个数;fileID为文件标识符,由fopen函数得到;可选参数count确定读入多少的数据,如果不指定,则一直读到文件结束位置,其可选如下: 1)n,读取n个元素到一个列向量...2)inf,读到文件结束,返回一个与文件数据元素相同的列向量。 3)[m,n],读取元素填充一个m×n的矩阵,按列顺序填充。n可以为Inf,但m不能为该。如果文件读入数据不够,则填充0。

2.1K21

R语言基础教程——第9章:字符串操作

实际上R关于字符串处理的功能是非常强大的,因为它甚至可以直接使用Perl的正则表达式,这也是R的一个理念,作为语言就把向量计算做到极致,作为环境,就在各领域都集成最好的。...对于grep函数,结果只有匹配或者不匹配,因此匹配时输出向量中该元素的下标,如果是单个字符就输出1,对于grepl,grep其实一样,不过输出的是逻辑,匹配就是T,不匹配就是F。...参数“value”默认为F,输出的就是刚才说的元素下标或者逻辑,如果改成T,就会输出查找的字符串。还有一个参数“ignore.case”,默认是F,表示大小写敏感,可以改为T,表示大小写不敏感。...以上就是grep系列函数的一些用法,根据例子可以很方便地使用,个人建议使用参数“pattern”“x”就行(subgsub当然还有replacement),其他的都用默认的。...grep()函数 首先,grep函数可以像数据库查询一样对向量中的具有特定条件的元素进行查询!

2.5K10

R 数据整理(八: stringr 处理字符串数据)

1 > str_length(x) [1] 42 length 只会返回出x 中的元素数(长度为1 的字符串类型的向量)。...str_length 才会返回字符串长度。(其实R 也提供了nchar 的方法) 拆分与组合 拆分 需要注意的是,提取拆分后的元素需要使用 [[]] 双括号选择。...str_c(x2,collapse = " ") collapse 参数设定分离的元素结合成一个字符串分离的符号。 还可以将两个向量中的元素,或向量另外一个字符串进行合并。...str_c(x2,1234,sep = "+") sep 参数设定某两个分隔的元素连接,使用某符号。...高级用法 字符检测 对字符串分隔后的向量与待检测的字符进行比较,生成等长的逻辑向量。detect 检测全字符,starts 检测首字母,ends 检测末字母。

1.1K30

一起来学matlab-matlab学习笔记5 低级文件输入输出函数

如果输入流是字节,而且fread到达了文件结尾,但是一个元素需要的字节数才读了一半,这不足一个元素的部分数据将被忽略。然而,如果输入流是位,则不足一个元素的部分数据将被返回作为最后的。 ?...如何知道文件指针是否在文件的结束(EOF)?如何将指针移动到指定位置?怎样得知当前文件指针在什么地方?怎样重置指针在文件开头(BOF)?...origin为指针移动的参照点,以及对应的有效,'bof',一1表示文件的开始;'cof',0表示文件的当前位置;'eof,1表示文件的结束。...其调用格式如下:position:ftell(fileID):ftell函数返回由fileID指定的文件上指针的当前位置,其是相对于BOF的字节数,即position是从0开始的非负整数。...如果返回给position的为一1,则说明这次ftell函数的操作不成功,使用ferror函数可以确定错误的性质。 ? 查询文件输入输出时的错误 ?

1.4K30

R中字段抽取、字段合并、字段匹配

1、字段抽取 字段抽取,是根据已知列数据的开始结束位置,抽取出新的列 字段截取函数:substr(x,start,stop) tel <- '18922254812'; #运营商 band <- substr...#一、字符串长度 nchar(x) #[1] 6 5 1 length(x) #[1] 3 #二、字符串替换 chartr("HW", "ZX", x) #[1] "Zellow" "Xorld"...CK5" "CK6" x <- list(a="aaa", b="bbb", c="ccc") y <- list(d=1, e=2) paste(x, y, sep="-") #较短的向量被循环使用...#前者返回匹配项目的下标;后者返回逻辑,x长度有多少,就返回多少个逻辑。 #如果添加一个value参数,赋值为T,则返回匹配项的。...#前者只替换向量中每个元素的第一个匹配,后者替换所有匹配。 #注意以下两个例子中"o"的替换方式。

5.3K90

R语言的常用函数速查

:求长度 subset:求子集seq,from:to,sequence:等差序列rep:重复 NA:缺失 NULL:空对象sort,order,unique,rev:排序unlist:展平列表attr...字符串处理 character:字符型向量 nchar:字符数 substr:取子串format,formatC:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch...:最大最小sum,prod:向量元素,积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approxapprox fun:插diff:差分sign:符号函数...rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组转置 nrow, ncol:计算数组的行数列数dim:对象的维向量 dimnames:对象的维名row/colnames...,&,&&,|,||,xor():逻辑运算符logical:生成逻辑向量 all,any:逻辑向量都为真或存在真ifelse():二者择一 match,%in%:查找unique:找出互不相同的元素 which

2.5K90

varchar2varchar2(char)_datetime数据类型

速度快是因为其在物理上是按定长存储的,这样,就可以根据偏移址一次取出固定长度的字符。 varchar变长存储,所以效率不如char。...这一个字节用于保存实际使用了多大的长度。 从空间上考虑,用varchar合适;从效率上考虑,用char合适,关键是根据实际情况找到权衡点。 3、TEXT。...可以看出使用nchar、nvarchar数据类型时不用担心输入的字符是英文还是汉字,较为方便,但在存储英文时数量上有些损失。...6、O/R Mapping中对应实体的属性类型一般是以string居多,用char[]的非常少,所以如果按mapping的合理性来说,可变长度的类型更加吻合 7、一般基础资料表中的name在实际查询中基本上全部是使用...,这时候,你可以使用特殊标识来存放,如:’NV’ 11、同上,所以对于这种NULL查询,索引是无法生效的,假如你使用了NULL标识替代的话,那么恭喜你,你可以利用到索引了 12、charvarchar

70530

R-learn)Day1+Day2

sum(x) #总和# 重要的函数 length(x) #长度向量元素的个数unique(x) #去重复 重复的元素去掉,第二次第多次出现的去掉duplicated(x) #对应元素是否重复返回逻辑...y中存在吗,返回的逻辑长度与x长度一致y %in% x #y的每个元素在x中存在吗,返回的逻辑长度与y长度一致#x==yx%in%y的区别x==y #x与对应位置的y相等吗x%in%y #x的每个元素在...x <- 8:12#根据逻辑取子集x[x == 10] #[]外面是需要筛选的向量,里面是逻辑,返回与x长度相同,且一一对应的逻辑向量,取逻辑为TRUE的x[x < 12] x[x %in%..."a","b","c","d"),each = 3);k2plot(k1)小知识#编程语言里,空格减号-都是特殊字符,不要随意使用,建议使用下划线_#向量的组成部分是元素长度(length)是数元素的个数...# g[seq(2,100,2)] #根据下标筛选# 3.向量g中有多少个元素向量s中存在(要求用函数计算出具体个数)?

6210

R语言函数的含义与用法,实现过程解读

表达式中较短的向量根据它的长度被重复使用若干次(不一定是整数次),直到与长度最长的向量相匹配。而常数很明显的将被不断重复。...pmaxpmin将返回一个与最长的向量长度相等的向量向量中的元素由参数中所有向量在相应位置的最大(最小)组成; 如果要使用复数,需要直接给出一个复数部分。...逻辑向量是由条件给出的,如下列语句令temp成为一个与x长度相同,相应位置根据是否与条件相符而由TRUE或FALSE组成的向量: > temp 13 逻辑操作符包括, >=...is.na(x)返回一个与x等长的逻辑向量,并且由相应位置的元素是否是NA来决定这个逻辑向量相应位置的元素是TRUE还是FALSE。     ...根据这个原则函数返回一个由a,b中相应元素组成的向量向量长度与其最长的参数等长。

5.6K30

R语言函数的含义与用法,实现过程解读

表达式中较短的向量根据它的长度被重复使用若干次(不一定是整数次),直到与长度最长的向量相匹配。而常数很明显的将被不断重复。...pmaxpmin将返回一个与最长的向量长度相等的向量向量中的元素由参数中所有向量在相应位置的最大(最小)组成; 如果要使用复数,需要直接给出一个复数部分。...逻辑向量是由条件给出的,如下列语句令temp成为一个与x长度相同,相应位置根据是否与条件相符而由TRUE或FALSE组成的向量: > temp 13 逻辑操作符包括, >=...is.na(x)返回一个与x等长的逻辑向量,并且由相应位置的元素是否是NA来决定这个逻辑向量相应位置的元素是TRUE还是FALSE。     ...根据这个原则函数返回一个由a,b中相应元素组成的向量向量长度与其最长的参数等长。

4.6K120

R语言经典实例5】如何比较两个向量

这些运算符也能将向量中所有元素与一个常数进行比较。返回结果是每两个元素间比较结果的逻辑向量。 讨论 R软件包含两个逻辑,TRUEFALSE。...比较运算符通过比较两个,并根据比较结果返回TRUE或FALSE: > a <- 3 > a == pi # 检验两者是否相等 [1] FALSE > a !...你可以使用R软件一次性地对两个向量进行比较,它会将两个向量中每两个对应的元素进行比较,并以逻辑向量方式返回比较结果: > v <- c( 3, pi, 4) > w <- c(pi, pi, pi...,R软件会将常数扩充为一组长度与所比较向量长度相等,并由常数值重复组成的向量,再将新向量与它需要比较向量的对应元素进行比较。...比较两个向量后,你通常会想知道比较结果中是否存在TRUE,或者比较结果是否全为TRUE。可以应用函数anyall来检验上述问题。

6.7K40

R语言学习笔记

"two", "three") > y %in% x # 判断向量y中的元素是否向量x中 [1] TRUE TRUE TRUE > x %in% y # 判断向量x中的元素是否向量y中 [1] TRUE...向量是一维的,而矩阵是二维的,需要有行列。 在R软件中,矩阵是有维数的向量,这里的矩阵元素可以是数值型,字符型或者逻辑型,但是每个元素必须都拥有相同的模式,这个向量一致。...不同的行业对于数据集的行列叫法不同。 数据框实际上是一个列表。列表中的元素向量,这些向量构成数据框的列,每一列必须具有相同的长度,所以数据框是矩形结构,而且数据框的列必须命名。...1/0) [1] TRUE 字符串 nchar()——字符串长度 > nchar("Hello, world.") # 统计字符串中字符数(字符串的长度),包含标点符号空格 [1] 13 > month.name...) # 返回字符串向量长度(即内部元素个数) [1] 12 > length("Hello, world.") # 返回元素个数 [1] 1 > nchar(1:10) # 对数值型向量使用,会默认将每一个数值转化为字符串

2.3K100
领券