腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
R
:
文本
挖掘
,
创建
每个
文档
的
单词
列表
r
、
tidyverse
、
text-mining
、
tidytext
我正在从一个目录中
的
多个PDF文件中读取
文本
。然后,我使用tidytext::unnest_tokens()-function将这些
文本
拆分为单个
单词
(标记)。有没有人可以告诉我,如何在test-tibble中添加一个额外
的
列,其中包含
每个
单词
所来自
的
文件
的
名称?
浏览 27
提问于2021-08-05
得票数 1
回答已采纳
2
回答
文本
分类问题
的
特征选择
classification
、
nlp
、
text-mining
、
random-forest
假设我们正在经营一个销售产品
的
网站。该网站有一个表单,用户可以在那里写任何投诉或问题。为了解决用户问题,我们考虑将问题分类为预定义类,以便了解用户面临
的
问题类型。任何建议都会有很大帮助
的
谢谢
浏览 0
提问于2018-07-19
得票数 0
回答已采纳
3
回答
如何在
R
中找出语料库中
的
所有大写
单词
r
、
text-mining
所以,我有一个
文档
语料库,我需要在
R
中
的
所有
文档
中找到所有都是大写
的
单词
(即,
单词
中
的
每个
字符都是大写
的
)。我不确定如何找到它。我看过
R
中
的
文本
挖掘
'tm‘包,没有这样
的
函数可以找到它。
浏览 3
提问于2016-09-14
得票数 1
6
回答
R
文本
文件和用于加载数据
的
文本
mining...how
r
、
load
、
text-mining
、
tm
我正在使用
R
包tm,我想做一些
文本
挖掘
。这是一个
文档
,并被视为一袋
单词
。假设这是我
的
文档
"this is a test for
R
load“ 如何加载用于
文本
浏览 0
提问于2011-10-28
得票数 16
3
回答
文本
挖掘
:获取句子-术语矩阵
r
、
text-mining
我目前在寻找任何与使用
文本
挖掘
在
R
中
创建
句子术语矩阵相关
的
内容时遇到了麻烦。我只使用了一个excel文件,其中我只对
文本
挖掘
感兴趣。我想
创建
一个行(句子)-术语矩阵。我想
创建
一个矩阵,告诉我每行(句子)中
单词
的
频率。 我想
创建
一个由1和0组成
的
矩阵,以便稍后对其运行PCA分析。在我<e
浏览 0
提问于2017-10-24
得票数 0
1
回答
文本
挖掘
如何将
文档
分割成短语而不是术语
r
、
text-mining
、
n-gram
、
term-document-matrix
、
quanteda
在使用
R
进行
文本
挖掘
时,在对
文本
数据进行再处理后,需要
创建
一个
文档
项矩阵,以供进一步探索。但与汉语类似,英语也有一定
的
阶段,如“语义距离”、“机器学习”,如果把它们分割成词,就会有完全不同
的
意思,我想知道如何将
文档
分割成阶段,而不是
单词
(术语)。
浏览 2
提问于2016-04-18
得票数 3
1
回答
计算
文档
中
单词
模式
的
频率
nlp
、
text-mining
我正在尝试计算
文档
中
单词
模式
的
频率。例如,
单词
模式“自然语言处理”在
文档
中出现了多少次。我尝试使用TF-IDF和Bag of words。然而,它给了我
每个
单词
单独
的
频率。有没有办法使用NLP,
文本
挖掘
来解决这个问题? 提前感谢
浏览 0
提问于2021-04-21
得票数 0
2
回答
.txt文件中
的
问题
r
、
text
、
error-handling
、
package
、
edgar
预先感谢您
的
投入。 我
的
问题是edgar包
的
getSentimentCount(word.frq, words.list)函数。函数应该读取作为word.list文件
的
.txt,并比较另一个现有
列表
(word.frq) (也是.txt文件)
的
内容。对于一个
单词
之间没有空格
的
.txt文件来说,这很好,但是
R
仍然可以像读取文件一样读取文件(计数> 1)。如果在
每个
单词
后面有一个新行,则可以读取另一
浏览 1
提问于2017-08-31
得票数 0
回答已采纳
2
回答
为
R
中
的
行名
创建
(数字)前缀
r
、
matrix
我正在尝试为
R
中
的
行名
创建
数字前缀。请参阅png 我需要
的
格式使用程序"wordfish“(
文本
挖掘
)。我能够
创建
矩阵,可以在下面的链接中看到,但无法在
每个
单词
前面添加数字计数,以及在数字和
单词
本身周围分配引号。不幸
的
是, write.tabl
浏览 2
提问于2017-04-20
得票数 0
1
回答
如何在使用python
文本
挖掘
模块构建
文本
文档
矩阵时保留连字符?
python
、
text-mining
我有下面的代码,它将一段
文本
与一个停用词集合进行比较,并返回
文本
中不在停用词集中
的
单词
列表
。然后,我将
单词
列表
更改为字符串,以便可以在
文本
挖掘
模块中使用它来
创建
术语
文档
矩阵。我在代码中进行了检查,这些检查显示在
列表
和字符串中保留了连字符
的
单词
,但是一旦我通过代码
的
TDM部分传递它们,连字符
的
单词</em
浏览 3
提问于2015-05-03
得票数 0
1
回答
删除
R
中
列表
列表
中
的
空字符串
r
、
list
我目前正在做一个
R
语言
的
文本
挖掘
项目,有一个
列表
列表
。我想删除
列表
列表
中
的
所有空字符串和NA值,但我还没有找到方法。我
的
数据如下所示: x <- list(c("", "alteryx", "confirme", "", "", "", "ans", ""
浏览 47
提问于2019-11-21
得票数 3
回答已采纳
3
回答
如何从句子中分离出
单词
和平均值?使用
R
进行
文本
挖掘
r
、
text
、
machine-learning
、
text-mining
、
text-analysis
我有数百个电子邮件主题行
的
列表
。对于
每个
主题行,我都有电子邮件打开率(打开
的
电子邮件/已发送
的
电子邮件)值。例如:如果我正确理解了逻辑步骤,我需要建立电子邮件主题行中
的
所有
单词
的
列表
,并为
每个
单词
在所有主题行之间做平均。例如: 有没有人能
浏览 4
提问于2016-05-17
得票数 0
3
回答
使用tm进行
文本
挖掘
,删除
列表
中不存在
的
单词
r
、
tm
使用tm包进行
文本
挖掘
,使用removeWords()。我列出了几千个相关
单词
中
的
大约500个。我是否可以使用removeWords()来反转逻辑,并从语料库中删除不在
列表
中
的
单词
?s/$wordlist//g); #not testedtext <- tm_map(text, removeWords, wo
浏览 0
提问于2015-01-21
得票数 1
1
回答
如何在Java代码中使用RapidMiner
的
“从文件中处理
文档
”操作符
rapidminer
我刚刚开始使用快速
挖掘
器进行
文本
分类。我已经
创建
了一个进程,其中我使用"Process Document from Files“操作符进行tf-idf转换。我在互联网上搜索,但所有都在使用已经
创建
的
过程或从
文档
生成
的
单词
列表
?我想从头开始。1)处理文件中
的
文档
1.2)过滤1.4) N-Gram2.1)训练(K-NN) 2.2)应用模型
浏览 0
提问于2014-02-11
得票数 1
2
回答
合并
R
数据帧和字数统计(长度不等)-
文本
挖掘
r
、
merge
、
text-mining
、
word-count
对于我
的
文本
挖掘
任务,我正在尝试
创建
一个矩阵,其中包含三个单独
文本
的
单词
计数(我已经过滤和标记化了)。我知道
每个
文本
都有这个数据帧: word countcamera 18action5 character 2 我还
创建
了一个
列表
,将三个
文本
中<
浏览 17
提问于2020-09-17
得票数 0
3
回答
为预先定义
的
单词
列表
在
R
中突出显示
文本
r
、
text
、
highlight
、
word
假设我有一组
文档
,如: "suppose i want wordslike words to be red and words like text to be blue") 我想知道是否可以用
R
为预先定义
的
单词
列表
突出显示
文档
(特别是大型语料库)
的
颜色。
列表
中
的
浏览 0
提问于2018-11-22
得票数 3
回答已采纳
2
回答
将
文档
列表
转换为语料库
r
、
text-mining
、
tm
我正在做以下关于
文本
挖掘
的
教程:在某个时刻,
文档
列表
被转换为语料库:doc.corpus<- Corpus(doc.vec) 有没有人能用简单
的
英语给我解释一下(举个例子更好)这里到底发生了什么?
浏览 6
提问于2015-08-07
得票数 1
1
回答
如何统计DataFrame栏中
的
字数?
python
、
pandas
、
dataframe
我有来自消费者调查
的
数据。在调查中,有一个问题专门询问如何改善与他们希望从交付服务中接收
的
服务
列表
相关
的
服务,并且数据以开放式存储。由于数据是句子,所以我运行了
文本
挖掘
,并获得了列中
的
一些名词
列表
。因此,我
的
问题是如何计算这些
单词
。我想要
每个
单词
的
频率。这可能看起来像这样。我如何编写代码来计算列
列表
中<em
浏览 4
提问于2020-10-19
得票数 1
2
回答
由re.findall
创建
到单个
单词
的
拆分
列表
,然后计数
每个
单词
的
出现次数,并按出现次数降序排序。
python
、
regex
、
parsing
我必须从re.findall
创建
的
列表
的
每个
元素中计数
每个
单词
的
出现数。例如: jobs = "JavaScript“、”数据科学家“、"Business流程
挖掘
”、“JavaScript Developer”然后数数每
浏览 0
提问于2019-02-02
得票数 2
回答已采纳
3
回答
检查英语词典中是否存在
单词
r
、
shiny
、
text-mining
我正在对多个简历进行
文本
分析,使用wordcloud包和tm包生成wordcloud,以便在
R
中对
文档
进行预处理。 感谢你
的
帮助。
浏览 1
提问于2017-07-07
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
手把手教你用R语言分析歌词
手把手教你用 R 语言分析歌词
Spark平台下基于LDA的k-means算法实现
【数据分享】R语言SVM和LDA文本挖掘分类开源软件存储库标签数据和词云可视化
python操作文本文件
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券