sinmin()返回最小值,此外which.min()返回最小值idmax()返回最大值,此外which.max()返回最小值idabs()返回数值对象绝对值sum()返回对象元素的和prod()返回对象元素的乘积...mean()返回对象元素的均值var()返回对象元素的方差sd()返回对象元素的标准差median()返回对象元素的中位数nchar()返回标量或向量元素的字符长度(包含空格)paste()paste(...x) #判断对象是否为矩阵 具体示例如下: 矩阵通过行、列id或者行列name对元素进行索引,也可以使用向量,id前加负号“-”则表示删除改行、列的元素,索引值也可以引入逻辑判断,如下所示: 注意,...()[,c('Package','Version','LibPath')] 查看当前版本的R可以安装的软件包,可以使用如下命令: available.packages() 利用该命令,我们可以查询想要安装的软件包是否在...使用命令: (.packages()) 可以查看当前工作环境加载的R包,使用命令: detach("package:packagename") 可以从当前工作环境移除R包。
paste 字符向量连接 match 匹配元素位置组成的向量 R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。...nchar这个函数简单,统计向量中每个元素的字符个数,注意这个函数和length函数的差别: nchar是向量元素的字符个数,而length是向量长度(向量元素的个数)。...这三个函数返回的结果包含了匹配的具体位置和字符串长度信息,可以用于字符串的提取操作。...但它们的返回值的长度(个数)有差 别:substr返回的字串个数等于第一个参数的长度;而substring返回字串个数等于三个参数中最长向量长度,短向量循环使用。...来自:每R一点:R语言中的字符串处理函数 strtrim函数 用于将字符串修剪到特定的显示宽度,其用法为strtrim(x, width),返回字符串向量的长度等于x的长度。
nchar(sentence) < 2] #`nchar`函数对字符计数,英文叹号为R语言里的“非”函数 代码解读:在进行二级清洗的过程中,需要先转化为向量形式,as.vector; 字符数过小的文本也需要清洗...stopword$term %in% posneg$term,]#函数`%in%`在posneg$term中查找stopword的元素,如果查到了就返回真值,没查到就返回假 #结果是一个和stopword...等长的波尔值向量,“非”函数将布尔值反向 testterm <- testterm[!...形成一个与原序列的等长的波尔值向量,“非”函数将布尔值反向就可以去除停用词。 stopword[!...向量长度依存于A,会生成一个与A相同长度的布尔向量,通过A[布尔向量,]就可以直接使用。 回忆一下,缺失值查找函数,A[na.is(x)],也是生成布尔向量。 详细见2.3的停用词删除的用法。
3.1.1 数值型向量 x<-(1,2,3,4,5) x[1]#取向量x当中第1个元素 x[-1]#取向量x当中除了第1个以外的其它元素 x[c(1,3,5)]#取第1,3,5个元素 x[c(T,F)...t中的最大值所在位置 >6 which.min(t) which(t==7)# 元素7所在位置 which(t>5) t[which (t>5)]#返回具体值 3.1.4 将向量x赋予维度 x<-1:20...NaN(不存在的值,如0/0) Inf(无穷大或无穷小,不可能的值,如1/0) a <- c(NA,1:49) is.na(a)#测试向量a里面含元素NA吗 sum(a,na.rm = TRUE)...NA,NA) d <- na.omit(c)#将NA值移除 十.字符串 10.1 统计字符串长度 > length(c(1,23,456)) [1] 3 > nchar(c(1,23,456)) [1]...1 2 3 > nchar("hello world") [1] 11#空格也计算在内
8. str_dup 重复和连接字符串向量 str_dup(string, times) ?...默认值为FALSE perl:逻辑值,默认值为FALSE,取TRUE时,分割符使用正则表达式 useBytes:逻辑值,默认值为FALSE, ?...x的元素的索引 ignore.case:逻辑值,默认值FALSE,区分大小写; perl:逻辑值,默认值FALSE,不使用正则表达式; value:逻辑值,设置结果返回匹配元素的值还是索引,默认值为FALSE...:返回索引; fixed:逻辑值,默认值为FALSE,取值为TRUE时使用精确匹配; useBytes:逻辑值,默认取值FALSE; invert:逻辑值,默认取值FALSE,设置结果返回匹配还是非匹配的元素...,不匹配的元素返回的位置和长度都是-1。
) 5、complete.cases( ) 判断对象中是否数据完全 6、grep()找出所数据框中元素所在的列值(仅数据框中) 7、assign()通过变量名的字符串来赋值 8、 split()根据因子变量拆分数据框.../向量 9、unique()返回 x 但是省去重复的数值 10、round(),floor()和ceiling() 11、sign() 符号函数 12、%in% 检验x是否为集合y中的元素(x%in%y...row col [1,] 1 2 [2,] 2 2 [3,] 3 2 [4,] 4 2 [5,] 5 2 4、pmin( )/ pmax( ) 把多个等长度的向量按元素逐个对比...) [1] 2 5 3 4 5 5、complete.cases( ) 判断对象中是否数据完全 complete.case()可以判断对象中是否数据完全,然后返回TRUE, FALSE。...range:最大值和最小值 sum,prod:向量元素和积 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approx和approx fun:插值 diff:差分
MATLAB将文件根据数据的形式分为了ASCII文件和二进制文件这两种,ASCII文件也就是常称的文本文件,文件内容中的每一个字节放一个ASCII码,即代表一个字符。...否则,errmsg是一个空字符向量。可以将此语法与前面语法中的任何输入参数结合使用。 fIDs=fopen('all') 返回包含所有打开文件的文件标识符的行向量。...向量中元素的数量等于打开文件的数量。 filename=fopen(fileID)返回上一次调用fopen在打开fileID指定的文件时所使用的文件名。输出文件名将解析到完整路径。...可选输出count返回成功读入元素个数;fileID为文件标识符,由fopen函数得到;可选参数count确定读入多少的数据,如果不指定,则一直读到文件结束位置,其可选值如下: 1)n,读取n个元素到一个列向量...2)inf,读到文件结束,返回一个与文件数据元素相同的列向量。 3)[m,n],读取元素填充一个m×n的矩阵,按列顺序填充。n可以为Inf,但m不能为该值。如果文件读入数据不够,则填充0。
尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要。从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高。...§ 字符串分割函数:strsplit( ) § 字符串连接函数:paste( ) § 计算字符串长度:nchar( ) § 字符串截取函数:substr( )及substring( ) § 字符串替换函数...计算字符串长度:nchar( ) nchar( )返回字符串的长度。 ?...substring( )函数:可以只设置first参数,last参数若不设置,则默认为1000000L,通常是指字符串的最大长度。 例子如下: ? ?...casefold( )函数:根据参数转换大小写。 ?
实际上R关于字符串处理的功能是非常强大的,因为它甚至可以直接使用Perl的正则表达式,这也是R的一个理念,作为语言就把向量计算做到极致,作为环境,就在各领域都集成最好的。...对于grep函数,结果只有匹配或者不匹配,因此匹配时输出向量中该元素的下标,如果是单个字符就输出1,对于grepl,和grep其实一样,不过输出的是逻辑值,匹配就是T,不匹配就是F。...参数“value”默认为F,输出的值就是刚才说的元素下标或者逻辑值,如果改成T,就会输出查找的字符串。还有一个参数“ignore.case”,默认是F,表示大小写敏感,可以改为T,表示大小写不敏感。...以上就是grep系列函数的一些用法,根据例子可以很方便地使用,个人建议使用参数“pattern”和“x”就行(sub和gsub当然还有replacement),其他的都用默认的。...grep()函数 首先,grep函数可以像数据库查询一样对向量中的具有特定条件的元素进行查询!
1 > str_length(x) [1] 42 length 只会返回出x 中的元素数(长度为1 的字符串类型的向量)。...str_length 才会返回字符串长度。(其实R 也提供了nchar 的方法) 拆分与组合 拆分 需要注意的是,提取拆分后的元素需要使用 [[]] 双括号选择。...str_c(x2,collapse = " ") collapse 参数设定分离的元素结合成一个字符串分离的符号。 还可以将两个向量中的元素,或向量和另外一个字符串进行合并。...str_c(x2,1234,sep = "+") sep 参数设定某两个分隔的元素连接,使用某符号。...高级用法 字符检测 对字符串分隔后的向量与待检测的字符进行比较,生成等长的逻辑值向量。detect 检测全字符,starts 检测首字母,ends 检测末字母。
如果输入流是字节,而且fread到达了文件结尾,但是一个元素需要的字节数才读了一半,这不足一个元素的部分数据将被忽略。然而,如果输入流是位,则不足一个元素的部分数据将被返回作为最后的值。 ?...如何知道文件指针是否在文件的结束(EOF)?如何将指针移动到指定位置?怎样得知当前文件指针在什么地方?怎样重置指针在文件开头(BOF)?...origin为指针移动的参照点,以及对应的有效值,'bof',一1表示文件的开始;'cof',0表示文件的当前位置;'eof,1表示文件的结束。...其调用格式如下:position:ftell(fileID):ftell函数返回由fileID指定的文件上指针的当前位置,其值是相对于BOF的字节数,即position是从0开始的非负整数。...如果返回给position的值为一1,则说明这次ftell函数的操作不成功,使用ferror函数可以确定错误的性质。 ? 查询文件输入和输出时的错误 ?
1、字段抽取 字段抽取,是根据已知列数据的开始和结束位置,抽取出新的列 字段截取函数:substr(x,start,stop) tel <- '18922254812'; #运营商 band <- substr...#一、字符串长度 nchar(x) #[1] 6 5 1 length(x) #[1] 3 #二、字符串替换 chartr("HW", "ZX", x) #[1] "Zellow" "Xorld"...CK5" "CK6" x <- list(a="aaa", b="bbb", c="ccc") y <- list(d=1, e=2) paste(x, y, sep="-") #较短的向量被循环使用...#前者返回匹配项目的下标;后者返回逻辑值,x长度有多少,就返回多少个逻辑值。 #如果添加一个value参数,赋值为T,则返回匹配项的值。...#前者只替换向量中每个元素的第一个匹配值,后者替换所有匹配值。 #注意以下两个例子中"o"的替换方式。
:求长度 subset:求子集seq,from:to,sequence:等差序列rep:重复 NA:缺失值 NULL:空对象sort,order,unique,rev:排序unlist:展平列表attr...字符串处理 character:字符型向量 nchar:字符数 substr:取子串format,formatC:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch...:最大值和最小值sum,prod:向量元素和,积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approx和approx fun:插值diff:差分sign:符号函数...rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组转置 nrow, ncol:计算数组的行数和列数dim:对象的维向量 dimnames:对象的维名row/colnames...,&,&&,|,||,xor():逻辑运算符logical:生成逻辑向量 all,any:逻辑向量都为真或存在真ifelse():二者择一 match,%in%:查找unique:找出互不相同的元素 which
在 zfill 函数前, 构建一个辅助函数 nChar, 生成一个长度为 n 的 0 字符串 // 3. 算出需要填充的 0 的个数并使用 nChar 生成 // 4....计算需要用 fillchar 生成的字符串长度 // 2. 使用作业 1 中的辅助函数 nChar, 修改它以便符合本题的使用 // 3....把作业 2 最后一步的字符串拼接的两个元素调换位置 string r = s; int l = len(s); if (l < width) { r += fill_char...width, char fillchar=' ') { // 如果 s 长度小于 width, 则在两边用 fillchar 填充并返回 // 如果 s 长度和 width 互为奇偶,...使用作业 5 的 isSpace 函数来判断 s 是否只包含空格, // 如果 s 只包含空格,返回空字符串 // 2. 遍历字符串找到不是空格的字符的下标 // 3.
速度快是因为其在物理上是按定长存储的,这样,就可以根据偏移址一次取出固定长度的字符。 varchar变长存储,所以效率不如char。...这一个字节用于保存实际使用了多大的长度。 从空间上考虑,用varchar合适;从效率上考虑,用char合适,关键是根据实际情况找到权衡点。 3、TEXT。...可以看出使用nchar、nvarchar数据类型时不用担心输入的字符是英文还是汉字,较为方便,但在存储英文时数量上有些损失。...6、O/R Mapping中对应实体的属性类型一般是以string居多,用char[]的非常少,所以如果按mapping的合理性来说,可变长度的类型更加吻合 7、一般基础资料表中的name在实际查询中基本上全部是使用...,这时候,你可以使用特殊标识来存放,如:’NV’ 11、同上,所以对于这种NULL查询,索引是无法生效的,假如你使用了NULL标识替代的话,那么恭喜你,你可以利用到索引了 12、char和varchar
sum(x) #总和# 重要的函数 length(x) #长度 数向量里元素的个数unique(x) #去重复 重复的元素去掉,第二次第多次出现的去掉duplicated(x) #对应元素是否重复返回逻辑值...y中存在吗,返回的逻辑值长度与x长度一致y %in% x #y的每个元素在x中存在吗,返回的逻辑值长度与y长度一致#x==y和x%in%y的区别x==y #x与对应位置的y相等吗x%in%y #x的每个元素在...x <- 8:12#根据逻辑值取子集x[x == 10] #[]外面是需要筛选的向量,里面是逻辑值,返回与x长度相同,且一一对应的逻辑值向量,取逻辑值为TRUE的值x[x < 12] x[x %in%..."a","b","c","d"),each = 3);k2plot(k1)小知识#编程语言里,空格和减号-都是特殊字符,不要随意使用,建议使用下划线_#向量的组成部分是元素,长度(length)是数元素的个数...# g[seq(2,100,2)] #根据下标筛选# 3.向量g中有多少个元素在向量s中存在(要求用函数计算出具体个数)?
表达式中较短的向量会根据它的长度被重复使用若干次(不一定是整数次),直到与长度最长的向量相匹配。而常数很明显的将被不断重复。...pmax和pmin将返回一个与最长的向量长度相等的向量,向量中的元素由参数中所有向量在相应位置的最大值(最小值)组成; 如果要使用复数,需要直接给出一个复数部分。...逻辑向量是由条件给出的,如下列语句令temp成为一个与x长度相同,相应位置根据是否与条件相符而由TRUE或FALSE组成的向量: > temp 13 逻辑操作符包括, >=...is.na(x)返回一个与x等长的逻辑向量,并且由相应位置的元素是否是NA来决定这个逻辑向量相应位置的元素是TRUE还是FALSE。 ...根据这个原则函数返回一个由a,b中相应元素组成的向量,向量长度与其最长的参数等长。
这些运算符也能将向量中所有元素与一个常数进行比较。返回结果是每两个元素间比较结果的逻辑值向量。 讨论 R软件包含两个逻辑值,TRUE和FALSE。...比较运算符通过比较两个值,并根据比较结果返回TRUE或FALSE: > a <- 3 > a == pi # 检验两者是否相等 [1] FALSE > a !...你可以使用R软件一次性地对两个向量进行比较,它会将两个向量中每两个对应的元素进行比较,并以逻辑值向量方式返回比较结果: > v <- c( 3, pi, 4) > w <- c(pi, pi, pi...,R软件会将常数扩充为一组长度与所比较向量的长度相等,并由常数值重复组成的向量,再将新向量与它需要比较向量的对应元素进行比较。...比较两个向量后,你通常会想知道比较结果中是否存在TRUE,或者比较结果是否全为TRUE。可以应用函数any和all来检验上述问题。
"two", "three") > y %in% x # 判断向量y中的元素是否在向量x中 [1] TRUE TRUE TRUE > x %in% y # 判断向量x中的元素是否在向量y中 [1] TRUE...向量是一维的,而矩阵是二维的,需要有行和列。 在R软件中,矩阵是有维数的向量,这里的矩阵元素可以是数值型,字符型或者逻辑型,但是每个元素必须都拥有相同的模式,这个和向量一致。...不同的行业对于数据集的行和列叫法不同。 数据框实际上是一个列表。列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同的长度,所以数据框是矩形结构,而且数据框的列必须命名。...1/0) [1] TRUE 字符串 nchar()——字符串长度 > nchar("Hello, world.") # 统计字符串中字符数(字符串的长度),包含标点符号和空格 [1] 13 > month.name...) # 返回字符串向量的长度(即内部元素个数) [1] 12 > length("Hello, world.") # 返回元素个数 [1] 1 > nchar(1:10) # 对数值型向量使用,会默认将每一个数值转化为字符串
领取专属 10元无门槛券
手把手带您无忧上云