首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Quanteda:如何绘制作为时间函数的词汇多样性?

Quanteda:如何绘制作为时间函数的词汇多样性?
EN

Stack Overflow用户
提问于 2017-08-02 00:52:23
回答 1查看 169关注 0票数 0

我已经在Quanteda中为我的DFM计算了词汇多样性,并希望随着时间的推移绘制出来。在我的语料库中,每个文档都有年、月和日期变量作为docvar。有没有办法将这些数据结合起来,并绘制出随时间变化的词汇多样性图?

EN

回答 1

Stack Overflow用户

发布于 2017-09-20 20:45:50

要绘制随时间变化的词汇多样性图,您需要计算随时间变化的词汇多样性,即按时间(月或年-取决于您)对数据进行分组,然后计算每个组的词汇多样性。一旦你有了这个,你将有一个值每组,然后可以用来绘图。

示例:

代码语言:javascript
运行
复制
lex_div <- doc1_final %>%  
group_by(Page) %>%
summarise(lex_div = length(unique(word))/length(word)) 

我已经附上了一张doc1_final对象的图片。它基本上是一个被分解成单词的数据帧,即每行一个单词。然后,我将doc1_final对象传递给group_by函数,然后对分组的数据执行计算。

你需要安装'dplyr‘包才能运行上面的代码。enter image description here

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45443574

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档