情感倾向明显:明显的词汇 如”好” “可以”
语言不规范:会出现一些网络用词,符号,数字等
重复性大:一句话出现词语重复
数据量大....,简单观察一下,分词后 ,有许多 "在","下","一"等等无意义的停用词
4.接下来,我们进行专有名词,停用词过滤....Data1=gsub("\\d+","",Data1)
#构建语料库
corpus1 = Corpus(VectorSource(Data1))
corpus1 = tm_map...(corpus1,FUN=removeWords,stopwordsCN(stopwords))
#建立文档-词条矩阵
sample.dtm1 <- DocumentTermMatrix...说得比较多的几个点,由图我们可以看到”安装”,”师傅””配件””加热””快””便宜””速度””品牌””京东””送货”“服务””价格””加热”等等关键词出现频率较高,我们大致可以猜测的是
安装方面的问题