腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6180)
视频
沙龙
1
回答
使用
R
中
的
'
tm
‘
库
向
VectorSource
语料库
添
加元
数据
nlp
、
text-mining
、
tm
、
corpus
我有一个csv文件,我正在尝试将它转换为
语料库
,以便稍后
使用
tm
_map并应用一些聚类。我看了文件 data <- read.csv("data.csv", header = TRUE, sep = ",",stringsAsFactors = FALSE) 把我需要
的
东西变成
语料库
corp<- Corpus(
VectorSource
(data$text)) 这是元
数据
的
结果 > meta(
浏览 40
提问于2019-09-21
得票数 0
回答已采纳
1
回答
在
tm
0.7.3
中
合并
语料库
r
、
version
、
text-mining
、
backwards-compatibility
使用
针对
R
的
文本挖掘包
tm
,在版本0.6.2,RVersion3.4.3
中
工作如下:a = "This is the first document."Error in UseMethod("inspect", x) : no applicable method for
浏览 4
提问于2018-01-12
得票数 0
回答已采纳
1
回答
在
R
中
使用
tm
包创建TermDocumentMatrix时出错
r
、
text-mining
、
tm
我无法
使用
R
中
的
tm
包创建一个术语文档矩阵,当我试图从预处理
的
语料库
中
创建一个时,这会引发以下错误。: "character" 下面是我正在
使用
的
脚本我
使用
Rv3.4.1和
tm
软件包v
浏览 5
提问于2017-10-26
得票数 0
回答已采纳
1
回答
tm
包版本0.7不能在DocumentTermMatrix中保留单词内连字符
r
在版本0.6-2和0.7-x之间,
tm
包
的
行为发生了变化。在新版本
中
,DocumentTermMatrix不保留单词内破折号,这是一个错误还是有一个新
的
选项来强制执行?下面是一个示例,
使用
安装了不同路径
的
两个
tm
版本。我运行
的
是
R
3.3.3。", lib.loc="~/
R
/x86_64-pc-linux-gnu-library/3.3/
tm</em
浏览 1
提问于2018-01-02
得票数 0
1
回答
R
-情感分析-如何删除某些单词
r
、
twitter
、
gsub
、
sentiment-analysis
我有下面的代码来为我
的
Twitter情感分析创建干净
的
文本。我想要添加另一行,以删除某些我不想在这个分析
中
包括
的
单词,如“废话”,“病”,等等。有人能建议如何做到这一点吗?
浏览 2
提问于2016-04-09
得票数 2
1
回答
语料库
对象缺少文本
r
、
text-mining
、
tm
、
corpus
在
R
中
使用
'
tm
‘
库
。在应用此代码时: abstract <-
VectorSource
(data$Abstract) 它是有效
的
,并给出了如下结果: [1] Accurate text... [2] Accurate text然后,我将其转换为一个
语料库
对象,这样我就可以对其进行进一步
的
聚类分析。abstract <-
tm
::Corpus(
tm
::
VectorSource
(
浏览 17
提问于2019-09-10
得票数 0
回答已采纳
2
回答
将文档列表转换为
语料库
r
、
text-mining
、
tm
我正在做以下关于文本挖掘
的
教程:在某个时刻,文档列表被转换为
语料库
:doc.corpus<- Corpus(doc.vec) 有没有人能用简单
的
英语给我解释一下(举个例子更好)这里到底发生了什么?
浏览 6
提问于2015-08-07
得票数 1
1
回答
tm
在应用
tm
_map时丢失元
数据
r
、
metadata
、
tm
我对
tm
r
库
有一个(小)问题。说我有一个
语料库
:bcorp <- c("one","two","three","four","five")# this does not work myCorpus <- Corpu
浏览 2
提问于2014-09-03
得票数 3
回答已采纳
1
回答
如何将文本文件上传到
R
中
的
命令"wordcloud“
r
、
word-cloud
我想在
R
-Studio中
使用
文本文件
中
的
数据
绘制一个单词云,但遇到了一些问题。如何
使用
“
语料库
”命令上传此文本文件使其可读?下面的" text“是一个包含名为"Twitter_text”
的
文本文件
的
文件夹。这是我
的
R
代码:>inspect(FA) >FA <-
tm
_m
浏览 1
提问于2016-05-16
得票数 1
2
回答
将
语料库
从quanteda转换为
tm
r
、
tm
、
corpus
、
quanteda
我
的
数据
mycorpus是在一个quanteda
语料库
(corpus-function从quanteda)
中
,我需要将它转换为
tm
包下
的
语料库
。我知道quanteda
的
convert-function。不过,这只会将文档功能矩阵转换为
tm
。我错过了什么快速
的
解决办法吗?
tm
的
VCorpus(mycorpus)抛出错误消息“缺少源”
浏览 8
提问于2021-07-21
得票数 1
回答已采纳
1
回答
R
-从更大
的
语料库
中
删除
语料库
词集,以找到唯一
的
单词
r
、
corpus
、
text-analysis
、
word-cloud
我有两个
语料库
(我把它们转换成DocumentTermMatrices,
数据
帧,然后是词云),其中一个是另一个
的
子集。准确地说,一个是关于一所大学
的
文本
语料库
,另一个是关于该会议中所有大学
的
文本
语料库
。> SECDraft = read.
浏览 2
提问于2015-05-29
得票数 2
1
回答
DocumentTermMatrix
使用
字典时计数错误
r
、
twitter
、
tm
、
corpus
实际上,我正在尝试
使用
朴素贝叶斯算法基于twitter
数据
进行情感分析。myCorpus.test <- Corpus(
VectorSource
(myCorpus.test$content)) 因此,我得到了NB算法
的
训练和测试
语料库
。在这样做之后,我想创建两个基于术语
的
DTM,这些术语在火车
语料库
中
至少出现了50次。DTM基于上面选择
的
项,但是矩阵本身
浏览 0
提问于2017-04-10
得票数 2
1
回答
文本挖掘.如何构建术语文档矩阵
r
、
tm
我要做
的
是加载一个csv文件,并转换成一个术语文档矩阵。下面是我代码
的
一部分:TermDocumentMatrix(myCorpuslist(wordLengths=c(1,Inf))) 但是得到一条错误消息:Error in UseMethod("TermDocumentMatrix",x):没有适用于"data.frame"类对象
的
“
浏览 2
提问于2013-12-12
得票数 2
回答已采纳
2
回答
tm
_map是
R
中
的
误差
r
、
tm
is.na(TweetList)])TweetCorpus <- iconv(TweetCorpus,<-
tm
_map(TweetCorpus, removeNumbers)我在UseMethod("
tm
_map",x)
中
得到了这个错误:在我
的
最后3行<em
浏览 4
提问于2017-05-25
得票数 0
回答已采纳
6
回答
R
包vcorpus:将
语料库
转换为
数据
帧时出错
r
、
tm
、
corpus
我
使用
tm
包来
使用
以下代码清理一些
数据
:mycorpus <-
tm
_map(mycorpus, removePunctuation)dataframe <- as.data.frame(
浏览 7
提问于2014-07-11
得票数 17
回答已采纳
1
回答
在
R
包
中
包含术语文档矩阵
中
的
所有标记
r
、
tm
、
term-document-matrix
我试图用
R
中
TermDocumentMatrix包
的
tm
函数构造一个术语文档矩阵,发现有些词不包括在内。> library(
tm
)>如果
语料库
只包含已删除
的
单词,则会给出以下消息。,以及如何将所有的标记都包含在
语料库
<e
浏览 1
提问于2014-01-31
得票数 0
回答已采纳
1
回答
tm
包
中
语料库
中
的
子串
r
、
substring
、
tm
我已经
使用
以下命令创建了一个
语料库
:corpus_map <-
tm
_map(corpus_map, removeNumbers) 上面的命令从
语料库
中
删除数字。有没有什么命令可以让我对
语料库
中
的
所有单词进行子串?例如:"Travelling“应转换为#为3个字母
的</e
浏览 2
提问于2016-11-10
得票数 0
3
回答
tm
语料库
联合列表
r
、
list
、
tm
我有一个URL列表,其中我获取了and内容,并将其包含在
tm
语料库
中
:library(XML) "http://www.
r
-statistics.commeta(cc,"link")=url.name} cc <- lapply(link, create.corpus) 这给了我一个“大清单”
的
语料库
wi
浏览 4
提问于2014-01-07
得票数 6
回答已采纳
2
回答
R
-比较两个
语料库
,
使用
语料库
#1
中
出现频率较高
的
单词创建新
语料库
r
、
corpus
、
text-analysis
、
word-cloud
、
term-document-matrix
我有两个包含相似单词
的
语料库
。与此相似的是,
使用
setdiff对我
的
事业没有真正
的
帮助。因此,我转向了寻找一种方法来提取更频繁
的
单词
的
列表或
语料库
(最终形成一个单词云)(假设这样
的
事情会有一个阈值-所以可能会增加50%
的
频率?)在
语料库
1
中
,与
语料库
2相比。RColorBrewer) > UKDraft = read.csv("UKDraftSc
浏览 10
提问于2015-05-30
得票数 2
2
回答
文本挖掘
中
TDM CSV文件转换为
语料库
格式
r
、
text
、
text-mining
我在
R
中
使用
tm
包进行文本挖掘,我执行了以下步骤:dataorg <- read.csv("Report_2014.csv")cleanset <-
tm
_map(cleanset, tolower) cle
浏览 1
提问于2014-01-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言自然语言处理3:中文语料库构建
还在用tm?你OUT啦!
NLP文本聚类分析R实现,以及几个简单实用的小工具
商标还在申请注册中就使用?小心被反告侵权!
未注册商标可以使用吗?“”与“TM”有什么区别
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券