当绘制文本语料库中某些单词的条件频率分布时,y轴显示为计数,而不是百分比 我遵循Steven Bird,Ewan Klein和Edward Loper在"Natural Language Processingwith Python“中概述的代码,以显示不同语言的UDHR在Jupyter Notebook中的单词频率分布。for word in udhr.words(lang + '-Latin1'))
c
我已经搜索了这个论坛和其他论坛,寻找解决方案,但无法使以前的解决方案在我的材料上起作用。在我的数据框(mydata)中,我在35年的时间里有大约170次观察。有几个变量,但为了简单起见,我们假设:我有一个用于疾病发病日期的变量/列(名为" date ")和一个分组变量(名为"group"),它的值可以是"0“或"1”。在group列中有几个NAs。我想要一个曲线图,显示一段时间内病例的累积</