当我使用TM时,我试图用inspect()来显示TermDocumentMatrix,结果并不是所有的矩阵,只是其中的一部分。 impacts 2 social 3 they 4R version 3.4.0 (2017-04-21)
Platform: x86_64-apple-darwin15.6.0
我是tm包的新手,如果能得到帮助,我将不胜感激。我有一堆帖子,我已经从其中提取了不必要的符号和停用词,我已经使用tm包的各种函数(见下文)完成了这些工作。最后,我剩下201个文档,其中包含我需要的干净字符串,但是,它不是R对象,而是VCorpus对象。我应该如何将这些处理过的文档全部缝合到一个文本文件中,使其成为一个长字符串?换句话说,如何将VCorpus对象转换为dataframe、list或另一个R对象?(corpus, PlainTextDocument)
corpus <- tm</
我有一个带有日出时的日期时间数组(whole_set_sr)、一个带有日落时间的日期时间数组(whole_set_ss)和一个包含大量完整日历数据的日期时间数组(tm_whole_date)。我正在尝试创建一个具有相同数量的元素的二进制数组,如果tm_whole_date中的元素是>= --太阳升起小时(whole_set_sr)和日落小时(whole_set_ss),则返回1;如果超出这些条件我尝试了以下几点:date_indexes = [];
for i = 1:nu