首页
学习
活动
专区
圈层
工具
发布

R包之tm:文本挖掘包

://mirror.bjtu.edu.cn/cran/web/packages/tm/tm.pdf 简介 tm 即text mining,是用来做文本挖掘的一个R包,是一个进行自然语言处理的基础包。...安装 该包的安装方法是install.packages("tm") 数据输入—文集(corpus) 文集代表一个文档集,通常一个文件就是一个文档。多个文档构成一个文集。...下面是简单的处理流程 source --> elements ---> reader ---> document 其中,tm包中有几种reader,比如readPlain(),readPDF(),readDOC...language 指明文本的语言 因此,对于包tm目录下的texts/txt目录下的文本文件可以这样做成一个文集 library(tm)#> Loading required package: NLPtxt...有了矩阵以后,可以有很多R函数可以作用于它,但是tm包提供了一些常用的函数,比如你想找到那些至少 出现了10次的单词,使用findFreqTerms()函数 findFreqTerms(dtm,10)

2.3K80

关于R安装中文分词包安装不上的问题install.packages(tm)

使用默认方法安装相关R中文文本挖掘包(tmcn、Rwordseg、Rweibo)时,会出现安装失败。合适的方法是:通过源代码安装相关包的程序:手工下载源代码及其依赖,然后编译安装。...首先是基础性的tm包。tm包是R文本挖掘的通用包。直接使用install.package即可安装。...install.packages("tm") tmcn、Rwordseg、Rweibo是李舰等人开发的中文文本挖掘包。三个网页(官网)中提供了包说明与安装方法。但经测试,其中的安装方法不可用。...正确的安装方法为: 先下载tmcn、[Rwordseg]、Rweibo 的源码。 tmcn无依赖关系,直接使用。...该包需要预先安装Java环境。如果未曾安装Java,请先安装Java,安装Java(及PATH的配置)过程不再赘述。

1.4K70
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    关于R安装中文分词包安装不上的问题install.packages(tm)

    使用默认方法安装相关R中文文本挖掘包(tmcn、Rwordseg、Rweibo)时,会出现安装失败。合适的方法是:通过源代码安装相关包的程序:手工下载源代码及其依赖,然后编译安装。...首先是基础性的tm包。tm包是R文本挖掘的通用包。直接使用install.package即可安装。...本帖隐藏的内容 1 install.packages("tm")tmcn、Rwordseg、Rweibo是李舰等人开发的中文文本挖掘包。三个网页(官网)中提供了包说明与安装方法。...但经测试,其中的安装方法不可用。正确的安装方法为:先下载tmcn、[Rwordseg]、Rweibo的源码。tmcn无依赖关系,直接使用。...该包需要预先安装Java环境。如果未曾安装Java,请先安装Java,安装Java(及PATH的配置)过程不再赘述。

    99320

    R语言︱文本挖掘套餐包之——XML+SnowballC+tm包

    ︱文本挖掘套餐包之——XML+tm+SnowballC包 笔者寄语:文本挖掘、情感分析是目前非结构数据非常好用、有效的分析方式。...包)、格式转化 tm包可以实现:建立语料库、创建文档-词频矩阵、去噪(还有Rwordseg包是中文分词包) SnowballC包可以实现:提取词干 本篇暂时不介绍XML包的数据爬取,先来看后面两个包的实现...本文以一个案例介绍SnowballC包+tm包,使用的数据是R语言中自带的数据集,案例部分来源于参考西门吹风博客。...一、函数调用、数据导入、生成语料库 library(SnowballC) library(tm) #vignette("tm") #调用函数包文件 ##1.Data Import 导入自带的路透社的...,tm包调用SnowballC可以词干化,函数名字叫:stemDocument; 记号化在tm包中叫做getTokenizers函数。

    1.5K40

    R案例操作:RQDA和tm包结合进行文本挖掘

    应用定性数据分析包RQDA(Qualitative Data Analysis)和文挖掘框架包tm结合进行文本挖掘。...好在黄荣贵开发的RQDA包可以进行文档管理和内容编码及提取,大大方便了利用tm包进行文本挖掘,既提高了效率又提高了准确性,下面举一个小例子: 1、安装RQDA包、tm包和中文分词软件(分词软件见下面链接...); http://www.pinggu.org/bbs/thread-853290-1-1.html 注:现在中文分词软件已经直接放到RQDAtm程序包中(https://r-forge.r-project.org.../R/?...4问题 6 一、出现5次以上的词条 —————————————————————————- 1、根据编码“网友”分析: gg tm("网友" ,mf = TRUE) > findFreqTerms

    1.4K130

    R问题|如何本地安装R包

    简介 平常在各种R语言群里,总会遇到关于安装R包的问题,例如:搭载在github上的R包,由于网速(外网)原因而无法下载该怎么办?...这里小编分享下平常逼不得已才使用的“下三滥”方法——直接下载包,通过本地安装。 网上好多解决方案都是基于R gui的,但现实中使用Rstudio这个IDE会更多些。...接下来以gmm包在Rstudio下安装为例: 教程 使用bing搜索该包,找到相应网站[1]。 关键词:R包名称+R,或者可以再加上CRAN。 ?...搜索技巧:R包名称+R 找到Downloads板块,下载对应的压缩包 这里以mac为例 ?...这个方法对一些有很多依赖包的包可能会很头疼,就怕安装完成,他还说你有其他包没安装,那你只能“将错就错”了!

    2.8K50

    R包的安装

    2、作用:实现特定的功能,你需要什么功能,安装相应的R包就行。说人话就是使用智能手机,需要使用微信与人聊天,你就按照微信APP,需要上腾讯视频看电视剧,你就安装腾讯视频APP。...R包,使用 “BiocManager::install()来安装 (3)github网站,是R包作者写的,没有经过审核,使用”devtools::install_github...几乎不使用,使用时需要写明R包的作者,就是指明选择谁写的R包。...5、如何实现快速下载 如果官网速度慢,请使用镜像网站 图片 图片 官方网站CRAN网站的镜像使用方法1,Bioconductor网站的镜像使用方法2,方法2也适用CRAN 三、安装R包会遇到问题...,要学会解决问题 图片 以上图片均引用生信技能树数据挖掘课程小洁老师的课件。

    1.2K20

    R包的深入解析

    当我们在使用很多R包的时候总会有些包里面的函数引发我们的好奇心,总想去看看他们具体怎么实现的,今天我们就来讲下如何去解析一个别人写好的R包。 1....我们先知道我们想去解析的R包的名字,比如“InformationValue”。 2. 打开R语言的官网R包的列表,然后利用浏览器的检索检索下我们找的包的位置,然后进入R包的详细介绍页面。 ? 3....在R包详细页面我们可以看到图中标出的位置,那就是R包的源代码文件,下载源代码问价,解压后文件的结构如下图: ? 4. 接下来就是激动人心的时刻了,进入R/目录,迎面而来是R语言代码文件了。 ? 5....我们首先打开主函数文件“Main.R”,然后就可以在R文件中检索我们想要的主函数名称。 ? ? 6. 当然,我们有时候并不满足于看看主函数,更想深入看其子函数程序,那也是没问题的,如图: ?...至此,我们便可以在R/目录下随心所欲查看R包的所有源程序。

    1.2K20

    R语言windows环境下R包的构建与.gz包的导入

    大家应该很熟悉windows下的R语言,并且也知道如何安装R包。但是呢,如果对于我们这种Linux小白很好奇那些只有在Linux下才能用的包怎么能让我们在windows下体验下呢。...那么,作为神一样的R语言简直无所不能,他们开发了Rtool,这个工具不仅是为创建R包用的,同时也可以让那些以gz结尾的R包可以安装在windows环境下。...今天我们就来介绍下R语言与Rtool结合后是如何玩转R包的。...接下来将是见证奇迹的时刻了,填充好title后再次运行编译程序: ? 那么我们的R包建好了,当然R包也是gz结尾的,意味着只有Linux下是好用的。...既然这样,那么我们正好可以来试验下我们R结合Rtool的强大。直接在window是下导入我们建好的R包,不过提前声明的是如果导入Linux下的R包最好是本地导入,而不是直接在线下载,那样是不会成功的。

    2.7K40

    R语言入门之R包的安装

    R语言是一个强大的数据分析工具,其强大之处在于有各种各样的R包帮助其实现各种各样的功能。...通常来说,R包的安装主要有四种方法,包括:1)从R语言官网上直接下载相关R包并安装;2)从Bioconductor上下载R包并安装;3)从Github上下载R包并安装;4)手动安装R包。...接下来我将和大家分享R包的具体安装: 1)首先获取下载的R包的名字,比如下载metafor这个R包,可以先在官网(https://www.r-project.org/)上找到这个包,了解一下这个包的详细内容和使用说明...,github中的R包需要在其前面加上该包所在的库名,否则无法进行下载安装。...4)关于手动安装R包,也是使用install.packages()函数,但是一般情况下使用较少,这里暂不叙述,如有问题,可以留言提问。

    4.4K30

    什么是好的R包

    本文是本学期第一篇,聊一聊什么是好的R包。这个问题源于年前一个同学,她在学习R语言,然后拿着一张总结的一些R包的图片问我:还有没有更好的包?当时就把我问蒙了,问她什么是更好的包?...有关真正辣鸡的R包及抄袭别人R包发SCI文章毕业的事情,可以围观Y叔(公众号biobabble)的一系列文章。...那么什么是好的R包呢,对于我们这些只需要用R来做生信分析的人来说,如果功力没有那么深厚,看不懂R包的源代码,确实需要找到一些普遍都在使用且坚持更新的包,不仅仅不容易出错,而且网上这些包的学习资料也更多。...其实每个月生信类的杂志都会出很多新的R包的文章,但是大部分都没什么人用。能在网上留下痕迹的都是经过大家检验的。...对于R包在文献中的使用 6万多篇论文总共用到了2400个R程序包,其中也只有31个引用超过了100次。以这个标准来看,98.7%的炮灰率啊。。。

    1.7K31

    R语言包的安装

    r语言的包中,集成了众多函数,大大扩展了r的功能且降低了使用难度。本篇文章就来介绍r语言中包的两种安装方式:install.packages和从github安装包。...install.packages() install.packages()是从镜像安装包,在括号中输入包的名称字符串就可以完成包的安装。...这里提醒一个小问题,有时候使用这个语句,会显示can't open the URL... 相关信息,导致包安装失败,这是因为镜像地址无法打开,此时我们可以使用repos参数修改为国内的镜像地址。...方法一:通过devtools包中的install_github函数。...本方法的缺点在于,因为要进行搜索,所以运行耗时较长。 除上述方法,通过本地安装包也是常用的方法之一。

    3K20
    领券