,需要将其转换为向量格式,即:
mystopwords <- as.vector(mystopwords[,1])
head(mystopwords)
现在有了停止词词库,接下来需要将分割后的词与停止词词库进行比对...这是一个非常繁工的过程,需要耐心的查看这些评论中都是怎么表达的情感的。经过约3个小时的人为选词(不断反复查看),将这些词组成词典,并导入为自定义词汇。...,'态度不好','素质差','质量不错','房间不错','浴缸不错','早餐不错','早餐质量差','自助餐不错','下午茶不错','强烈推荐','推荐入住','值得推荐','性价比不错','隔音不错'...#根据业务情况、需要在原始评论中删除的字和词
pattern 非常','...,说明房客中的一部分来源于携程
4) 当然也有一些负面评价,如“不便”,“施工”,“修路”等
5) 最后,房客觉得这家酒店非常值得推荐,间接将给酒店带来额外客户