腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(388)
视频
沙龙
1
回答
Tm_map
问题
(
removeWords
,停
用词
(“
英语
”))
我正在努力使用
removeWords
停
用词
source("Project_Functions.R")# ==== # pdf.loc <-Corpus(URISource(myFiles), readerControl=list(reader=readPlain))#Docs.corpus <-
tm_map
(Docs.corpus, tolower) Docs.corpus <-
tm_map<
浏览 53
提问于2020-04-14
得票数 0
1
回答
tm_map
:可以将删除词函数与我自己注册为txt文件的停止词一起使用吗?
、
、
我使用R tm包对facebook的一个群组进行文本分析,发现
removewords
功能对我不起作用。我试着把法语停
用词
和我自己的停
用词
结合起来,但它们仍然在出现。readLines(groupe_fb_ief, encoding="UTF-8")```inspect(docs) docs <-
tm_map
(docs, tolower) docs <-
tm
浏览 25
提问于2019-10-29
得票数 1
回答已采纳
1
回答
删除除"you“、"your's”、"me“、”me“之外的所有停
用词
、
、
我正在尝试删除所有的英文停
用词
,除了"you/your's",“me/ my”,因为这些词对我的分析很重要。有人能帮我解决这个
问题
吗?我对R非常陌生,所以我知道我会用下面的代码删除停
用词
: corpus <-
tm_map
(corpus,
removeWords
, stopwords("english")) ..。
浏览 34
提问于2020-07-29
得票数 0
回答已采纳
2
回答
tm_map
到删除包含我的停止词的单词?
、
我正在应用
removeWords
来过滤这样的语料库:corpus <-
tm_map
(corpus, content_transformer(tolower))corpus <-
tm_map
(corpus,
removeWords
, c(stopwords
浏览 5
提问于2016-11-04
得票数 1
回答已采纳
1
回答
R中的文本挖掘:计算2-3个单词短语
、
我在Stackoverflow - (credit @patrick perry)中发现了一段非常有用的代码,可以显示语料库中2个和3个单词短语的频率:corpus <- gutenberg_corpus(55) # Project Gutenberg #55, _The Wizard of Oz_term_stats(corpus, ngrams = 2:3) ## term count sup
浏览 33
提问于2020-06-06
得票数 0
回答已采纳
1
回答
计算r中的词共现矩阵
、
我想在R中计算一个单词共现矩阵。我有以下句子的数据框架-dat[2,1] <- c("The girl is short.")这给了我The girl is short. The tall boy and the sho
浏览 6
提问于2016-11-07
得票数 2
3
回答
有没有一种方法可以从r中的语料库中删除前导空格?
删除停
用词
后,我发现许多条目的开头都有一个空格。是否可以从VCorpus中删除有前导空格的前导空格?VCorpus(VectorSource(frasi)) corpus <-
tm_map
(corpus,
removeWords
, st
浏览 28
提问于2020-05-03
得票数 0
回答已采纳
4
回答
R's tm字数统计软件包
、
、
、
、
我想得到每个文件在运行预处理后的每个单独的字数(转到较低,删除停
用词
等)。我对单个文本文件的字数统计一无所获。任何帮助都将不胜感激。library(tm)revs<-
tm_map
(revs,tolower) revs<-
tm_map
(revs,remove
浏览 0
提问于2014-10-22
得票数 2
1
回答
修正R's TM软件包中的停止词
、
、
、
我有一个
问题
,从R的TM包修改english.dat停止字文件。我给它加的任何东西都是不被认可的。我试着在文件的开头添加,中间的,结尾的,仍然没有效果。只识别文件的原始文本。
浏览 3
提问于2014-06-02
得票数 1
回答已采纳
1
回答
R
removewords
tm将停止字文件视为正则表达式而不是逐字
、
、
如何从library(tm)强制
removeWords
逐字(逐字)获取停
用词
列表中的每个单词,而不是作为正则表达式?stopwordlist.txt", header = FALSE, sep = "\n", quote = "", fill = TRUE, comment.char = "")corpus =
tm_map
(corpus,
removeWords
, custom_stopwords$V1) 我希望
removeWords
浏览 8
提问于2019-07-10
得票数 0
1
回答
寻找傻瓜式和文本消息风格的停
用词
、
、
、
我使用R来挖掘tweet,我得到了tweet中使用频率最高的单词。然而,最常见的单词是这样的: [7] "que" "thats" "watching" "wish" "youre" 我正在寻找文本中的趋势和名称和事件。我想知道是否有一种方法可以删除这
浏览 0
提问于2012-11-26
得票数 3
回答已采纳
1
回答
为什么没有过滤掉“term”合并后的术语文档矩阵中的停
用词
?
、
、
encoding="ASCII"), crp <-
tm_map
(crp,
removeWords
, stopwords("english")) crp <- <
浏览 13
提问于2015-08-20
得票数 0
1
回答
根据长长的列表删除停
用词
、
我有一个60000行/短语的数据帧,我想将其用作停
用词
并从文本中删除。我使用tm package,并在读取带有停
用词
列表的csv文件后使用下面这一行: PCRE pattern compilation error at '' 这个列表太大了,有什
浏览 0
提问于2017-11-07
得票数 1
3
回答
创建源代码语料库中的拆分标识符和方法名
、
、
我遵循本文中的预处理步骤--
Tm_map
已经完成的单词词干(dsc,stemDocumentfinally","long","vol
浏览 5
提问于2014-09-20
得票数 1
回答已采纳
6
回答
tm_map
在Mac上的R 3.0.1中存在parallel::mclapply错误
、
、
、
我在平台上使用的是R 3.0.1 : x86_64-apple-darwin10.8.0 (64位)library(tm)
tm_map
(crude, stemDocument)Warning message: all scheduled cores encountered errors in user code 有没有人知道解决这个
问题
浏览 203
提问于2013-08-17
得票数 17
回答已采纳
1
回答
语料库中如何检测外来词?
、
假设我使用tm包解析一个
英语
语料库,并且执行通常的清理步骤。library(tm)corpus <- Corpus(crude) corpus <-
tm_map
(corpus, content_transformer(
removeWords
)) stopwords("english")) corpus <-
t
浏览 0
提问于2016-04-29
得票数 0
回答已采纳
1
回答
和R一起从twitter上获取数据?
、
、
、
(tweets_corpus,removePunctuation,lazy= T)tweets_clean=
tm_map
(tweets_clean,
removeWords
,stopwords("english"),lazy = T)tweets_
浏览 1
提问于2016-06-03
得票数 2
回答已采纳
2
回答
R tm
removeWords
函数不删除单词
、
、
、
、
(paperCorp, removePunctuation) paperCorp <-
tm_map
(paperCorp,
removeW
浏览 0
提问于2015-08-26
得票数 9
回答已采纳
2
回答
removeWords
不工作
、
JEOPARDY_CSV.csv', stringsAsFactors = FALSE) jeopCorpus <-
tm_map
(jeopCorpus, PlainTextDocument)jeopCorpus <-
tm_map
(jeopCorpus,
removeWords
,
浏览 6
提问于2015-09-04
得票数 4
回答已采纳
1
回答
清理后停
用词
仍保留在语料库中
我正在尝试从我的语料库中删除停
用词
" the“,但是并不是所有的实例都被删除。(shakespeare, stripWhitespace)shakespeare <-
tm_map
tm documentation shakespeare <-
tm_map
(shakespeare,
removeWords
, c(stopwords("english"),&qu
浏览 17
提问于2020-02-19
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券