腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
skipgrams
的
上下
文中
的
关键字
(
kwic
)?
、
、
、
、
我用quanteda对ngram和tokens进行了
上下
文中
的
关键字
分析,它工作得很好。我现在想为
skipgrams
做这件事,捕捉“进入
的
障碍”和“进入
的
障碍……”
的
上下
文。下面的代码是一个
kwic
对象,它是空
的
,但我不知道我做错了什么。dcc.corpus指的是文本文档。我也使用了标记化
的
版本,但没有任何变化。结果是: “0行
的
kwic
对象”
浏览 45
提问于2020-07-29
得票数 2
回答已采纳
1
回答
在
上下
文中
放置
关键字
时,让‘`
kwic
()’忽略停止词吗?
、
、
、
关于
kwic
()包中
的
quanteda函数,我再次提出一个问题。我想提取一个特定
关键字
周围
的
五个单词(在下面的例子中,它们是“堆栈溢出”和“射电星”)。但是,在删除标记化过程中
的
停止词之后,
kwic
()不会返回实际窗口5字
的
前和后
关键字
,但比这更少
的
字。在
上下
文中
计算
关键字
时,是否有一种方法可以告诉
kwic
()忽略停止词?(pattern = phrase(c(&
浏览 7
提问于2022-05-06
得票数 0
回答已采纳
1
回答
RiTa.js
kwic
()空白和特殊字符弄乱了
我使用RiTa.js库(
kwic
()函数)在文本集合中查找
关键字
,并在
上下
文中
抓取
关键字
。我正确地抓取了单词,但当我得到
kwic
模型
的
结果时,句子中有两个或更多特殊字符,空格和特殊字符被弄乱了。对不起,我是p5.js
的
新手谢谢!for (var i = 0; i < words.length; i++) { key = keys[i]; result = RiTa.
kwic</
浏览 1
提问于2018-07-05
得票数 0
1
回答
如何从文本语料库中切分特定词周围
的
X个词
、
我正在分析我上传到R
的
演讲。我
的
数据帧包括每个演讲
的
一行,其中包含元数据和演讲
的
整个文本。 但是-我不想只分析整个演讲,还想找到一种方法来分析特定单词周围
的
文本块。例如,引用“RED”前后
的
50个单词...有没有办法创建一个新
的
数据帧--每一行都是分段
的
文本,我也会设法保留元数据(它不是同一张表,因为对“红色”
的
引用比演讲更多--所以在一次演讲中,“红色”周围可能有
浏览 10
提问于2016-08-20
得票数 1
1
回答
如何在闪亮
的
应用程序中创建
关键字
搜索?
、
我想要创建一个‘
关键字
在
上下
文’搜索栏使用R闪亮。基本上,用户会输入一个单词,应用程序会检索包含这个单词
的
句子。这是我在我
的
ui.R文件中为这个特定目的所包含
的
代码: textInput("Input_
KWIC
", "Enter a keyword:"),这是我在server.R文件中包含
的<
浏览 3
提问于2021-11-14
得票数 0
回答已采纳
1
回答
在R中,如何将每个词
的
发生表示为一个独立
的
中医学向量?
、
、
、
、
我正在寻找一种有效
的
方法来为语料库中
的
(每个)目标词创建一个术语共现矩阵,这样每个词
的
出现都将在一个中医学中构成自己
的
向量(行),其中列是
上下
文单词(即基于标记
的
共现模型)。这与向量语义中使用
的
更常见
的
方法形成了对比,在向量语义中,每个术语(类型)都在对称
的
tcm中获得一行和一列,并且值被聚集在类型
的
标记
的
(共)点上。显然,这可以从零开始使用基本
的
R功能,也可以通过过滤现有软件包生
浏览 1
提问于2018-10-23
得票数 1
回答已采纳
1
回答
将
KWIC
转换为R中
的
现有数据帧
、
、
我想将Quanteda包
的
结果添加到现有的电子表格中。例如: valuetype = c("glob", "regex", "fixed"),case_insensitive这将创建一个包含多个列
的
数据帧。我希望将其添加到它所来自
的
数据(在本例中为x),然后将其余部分设置为NULL或NA。 在dplyr中变异是正确
的
事情吗?或者我还
浏览 0
提问于2017-07-20
得票数 0
2
回答
添加作为(
上下
文)文本挖掘操作结果
的
列
、
、
、
我正在处理一个包含序数变量
的
数据集以及一个包含文本
的
列。通常,我希望添加作为文本挖掘练习
的
结果
的
列,同时保持表结构。例如,我导入了一个CSV文件data-subset.csv并获得了一个名为datacsv
的
数据框 datacsv=read.csv("data-subset.csv", header=TRUE,sep=我想在"fte“
的
上下
文中
搜索该文本中
的
数字(通常位于0和1之间),并将这些数字添加为列f
浏览 2
提问于2016-03-31
得票数 1
1
回答
是否可以使用`
kwic
`函数来查找彼此相近
的
单词?
、
、
我找到了这个参考:有没有可能将它与quanteda包中
的
kwic
函数一起使用,以便能够在语料库中找到文档,其中包含
的
单词不是“卡住”
的
,而是彼此接近
的
,中间可能还有一些其他单词?例如,如果我在函数中给出两个单词,我希望在语料库中找到这两个单词出现
的
文档,但可能中间有一些单词。例如,你告诉我“引擎”和“电气”,我也会得到“电气同步引擎”出现
的
报告,但不会得到“引擎”和“电气”出现在完全不同
的
上下
文中
的
浏览 2
提问于2018-04-19
得票数 1
1
回答
robotframework -具有多个名称
的
关键字
我有一个带有抽象函数click row
的
资源文件,它在我
的
代码库中用于许多不同
的
上下
文中
。为了帮助可读性和搜索,最好让这个
关键字
可以在许多不同
的
名称下访问; [Arguments] ${group
浏览 14
提问于2018-09-07
得票数 0
回答已采纳
1
回答
如何与quanteda和
kwic
进行模糊模式匹配?
、
、
我有医生写
的
文本,我希望能够在他们
的
上下
文中
突出具体
的
单词(在他们
的
文本中我搜索
的
单词之前有5个单词,后面有5个单词)。说我想找“自杀”这个词。然后,我将在quanteda包中使用
kwic
函数:到目前为止,还不错,但说我想考虑到打字
的
可能性。在这种情况下,我想允许三个不同
的
字符,没有限制
的
地方,这些词是什么。 可以用quanteda
的
函数来
浏览 0
提问于2020-01-13
得票数 4
回答已采纳
3
回答
关键词左右提取词
要想充分发挥绕口令
的
效果,你应该尽可能快地重复几次,不要绊倒或发音错误。twistersProceeding 5 words=you should repeat them several 长期
的
计划是使用10个最频繁
的
术语,以及前面的和正在进行
的
单词,并加载到data.frame中。
浏览 7
提问于2016-07-08
得票数 1
回答已采纳
1
回答
函数返回
的
行数少于它应该返回
的
行数。
、
、
、
我目前正在尝试对
kwic
对象执行情感分析,但恐怕
kwic
()函数不会返回它应该返回
的
所有行。我不太清楚到底是什么问题,这使得很难张贴一个可重复
的
例子,所以我希望,详细解释我试图做什么就足够了。我将包含我要分析
的
演讲
的
原始数据集细分为一个新
的
数据框架,其中只包括提到某些
关键字
的
演讲。但是,当我使用以下代码在相同
的
初始数据集上执行
kwic
()时,它返回
的
数据帧只有82个观测值。有人知道
浏览 6
提问于2022-05-06
得票数 0
回答已采纳
2
回答
quanteda提取数字,然后按百分比计算
、
、
我有一些包含数字短语
的
文本,后面跟着一些符号。例如,我想提取数字,然后是百分比。使用quanteda包中
的
kwic
函数似乎适用于作为正则表达式
的
数字(例如,"\\d{1,}")。
浏览 0
提问于2018-04-11
得票数 3
回答已采纳
1
回答
在定义
的
术语(多酶)周围提取n个单词
、
、
、
我希望提取n个(例如:3)单词(单词
的
特征是字符前后
的
空格),围绕(即,前后)特定
的
术语(例如,'TEST')。改进:几个匹配应该是允许
的
(也就是说,如果一个特定
的
术语出现了不止一次,那么预期
的
解决方案应该捕捉到这些情况)。我已经找出了其他
的
泡泡,它们要么是o,要么与有关。
浏览 3
提问于2018-02-11
得票数 1
回答已采纳
1
回答
有没有办法从wordcloud或comparison.cloud中保存数据?
、
、
我试图保存wordcloud或comparison.cloud (或quanteda textplot_wordcloud)中使用
的
数据,但我注意到当我将其保存到变量(t1 = wordcloud(x)我
的
目标是获得一个组
的
唯一或
关键字
,并构建一个交互情节,当一个单词被点击时,它会显示
kwic
()
的
输出并显示
关键字
的
上下
文。
浏览 0
提问于2018-02-20
得票数 1
回答已采纳
1
回答
Scala:顶级类
的
“私有类”和"private[this]类“有什么区别?
我知道private[this]在方法或类变量
的
上下
文中
意味着什么,但在顶级类
的
上下
文中
又意味着什么呢?它是否与this
关键字
替换当前包
的
名称
的
private[package]相同?
浏览 0
提问于2018-04-22
得票数 4
1
回答
R:使用for循环查找另一个字符串旁边
的
特定字符串
、
、
我有一本小说
的
文本在一个单一
的
向量,它已经被分割成单词,我正在寻找字符串“novel.vector.words”
的
所有实例。然而,由于向量是按单词拆分
的
,所以每个单词都是它自己
的
字符串,我不知道如何在向量中搜索相邻
的
字符串。我对for循环
的
作用有了一个基本
的
了解,按照课本中
的
一些说明,我可以使用这个for循环来定位“key”
的
所有位置以及它周围
的
上下
文,以创建一个制表符描述
浏览 18
提问于2019-03-12
得票数 1
回答已采纳
4
回答
Java类
关键字
、
、
、
、
几天前,我在Java中发现了一段代码,它在
上下
文中
使用类
关键字
,例如:例如,我曾尝试在JFrame中这样做:有人能解释一下类在这个
上下
文中
的
含义吗? 谢谢,
浏览 3
提问于2013-04-29
得票数 6
回答已采纳
6
回答
何时不保留C#
关键字
?
、
、
我不想将保留字用于任何目的,但我不想再犯类似的错误,我想知道在某些情况下不保留
的
语言
关键字
背后
的
理由。
浏览 0
提问于2010-12-03
得票数 8
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券