我使用gensim来计算给定音符中的单词频率。在应用以下代码后: from gensim import corporacorpus = [dictionary.doc2bow(text) for text in sentences] 获取语料库,例如:(0,1),(1,5),(3,1) ...我想要的语料库如下:(word_1,
当绘制文本语料库中某些单词的条件频率分布时,y轴显示为计数,而不是百分比 我遵循Steven Bird,Ewan Klein和Edward Loper在"Natural Language Processingwith Python“中概述的代码,以显示不同语言的UDHR在Jupyter Notebook中的单词频率分布。for word in udhr.