摘要:一群数据分析师在一起谈论着什么?他们最关心什么问题,如何从QQ群这个角度,去做客户的定位分析?...将数据导入到R中.....最后我发现的问题是,把TXT导入到R中,会自动的按空格分行.但有的时候谈话内容里很复杂这样会让我们循环定位发生差错,于是我们现在EXCEl里删除空白行.然后再导入....接下来我们便数据的正确性一致性完整性进行探索,当然代码没有写出来,这是在分析过程中做的额外 的事,确保数据的完整性之后,进行简单的统计分析.
3.探索性分析
群成员活跃情况,
群活跃时间分布,
群成员地区分布...,首先冒泡的人占总数的比例,且这其中能够分辨出地区信息的占比又是多少,根据这个比例去调整各地区人数,然后就是,这个我是在EXCEL 里完成的,这里有部分数据和图表, 这里通过R将QQ后都加了后缀,不是QQ