手把手教你分析微信群聊记录,识别害群之马

导读:很多朋友加入了很多微信群,作为群中一员,你想知道这个群是否值得留下?而作为群主,你想了解目前这个群是否健康?如果有问题,那么坏了这锅粥的老鼠屎是谁?应该怎样设立群规?本文通过简单的分析给出思路,抛砖引玉,希望大家多提建议和意见。

作者:汪德诚 大数据文摘创办人

思路

人有人的调性,群有群的调性。观其言行,可对其进行粗略判断,时间跨度越长、信息越多,判断就准确。先把群聊天记录下载下来,看看能有什么收获。

数据收集

(1) 选择一个样本群:XX技术交流群

(2) 导出微信群聊记录到EXCEL

数据分析

导出的聊天记录格式为:时间、联系人、状态、类型、消息

  • 时间:发送或接收消息的时间
  • 联系人:群中昵称
  • 状态:接收/发送,发送表示“我”发出的消息
  • 类型:地理位置/动画表情/名片/视频/图片/网页/文本/系统消息/小视频/语音,一般来说网页指转发的文章,文本指发出的文字
  • 消息:聊天记录的内容

初步观察,群聊记录从2015/5/1 到2015/12/31,总计15112条,群现有成员494人。

个人感觉这个群还是一个很高端的交流群,进群由群主统一邀请,不会有人擅自邀请人进群,也没有什么广告,经常有人针对一个问题发起讨论,那么实际情况是否这样呢?我们看看统计数据

按”类型“统计

网页类型有2082条,占比有14%,总体看这是一个健康群,大部分的交流还是以文字为主,转发的文章不是很多。

不难想象,极端情况,如果群里的人都在转发文章,却没人说话,那么这个群也就没有什么价值了,因为这个群是没有思想的,大家都转发。转发文章和讨论的比例是多少你?没有一定之规,得看群定位,也要看分享的内容。但不管怎么说,如果群成员间交流少了,这不是好的趋势。

虽然目前这个群看似健康,但是未来还会健康吗?趋势很重要,既然要预测,就要加入”时间“维度。

按”类型“统计+时间

发现什么?网页(转发文章)的数量并没有增加,反而减少了,可是再看文本的数量,下滑的趋势非常明显,增加一列 网页/文本,看看

网页/文本比例如下图

可以看出,转发文章的比例越来越高了,群有越来越水的趋势啊!那么到底哪些人在转发文章?

按类型统计+时间维度+具体人员

此群共有人员494人,转发过文章的有249人,进一步分析可得

可以看出,转发的人不多,但是占比非常大,那么接下来我想知道:经常转发文章的人是否说话参与讨论?

统计:TOP10 转发人员,转发占比

初步判断 YJJ,LFY,HXG3人基本不参与讨论,只是转发文章,他们在转发什么?没转发时说什么?必须看原始数据了。

核实验证

经查看,这3人,大部分的时间都在转发文章,而且转发的文章几乎都来自同一个公众账号,即使发言也有很多是无效发言,比如:“感谢XXX”,或是今日公号文章的摘要…基本都是在推他自己的公号。基本可以确定,这3个人就是害群之马。

决策

作为群众,你可以选择留下还是离开

作为群主,你要关注群的现状、趋势,找到问题所在,制定适当的群规并监控执行。

总结

本文只是一个简单的分析案例,以聊天记录数量为基础,逐步加入时间、个人维度,分类统计,为群的运营提供一个思路。其实可分析的内容很多,比如对群管理人员发言的分析,能够看出群管理者对群的热情,再比如通过分析群内互相@,可以看出谁和谁经常公开秀恩爱,哈哈。

另,"群健康度"这个指标,没有统一的标准,和群设立的目标紧密相关。

如果你对群运营有感兴趣,可以加我的微信dataforall,备注“群运营”,我会建一个交流群,在这个群,我希望大家以交流为主,而且我会监控这个群的健康程度:)

附:Excel种操作方法:

(一)按类型统计

(1) 导出的聊天记录在Sheet1,新建Sheet2

(2) 选中类型列全部数据,拷贝到sheet2

(3) 选中类型列全部数据,拷贝到sheet2,删除重复项

(4) 计算各类型聊天记录数量

用到公式:COUNTIF

(二)类型+时间

(1)按月统计,sheet1列加入“月份“列

(2)按月分类统计

技巧:使用公式countifs可以快速、自动统计,注意公式中$符号的运用,单元格B18做好后,只要向右、向下拖拽,就能自动生成其他数据了。上面的例子肯定可以正常运行,有疑问的请各自百度查询了。

(三)网页类型+时间+个人

感谢免费好用的“同步助手”,让我很方便的导出微信聊天记录

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2016-01-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏移动开发之家

跨平台项目GSYGithubApp系列三大开源版本推荐(Flutter 、React Native 、Weex)

跨平台作为移动开发中不可或缺的构成,GSYGithubApp系列一直致力于跨平台开发中的各种尝试,目前已经拥有 GSYGithubAppFlutter 、 G...

11630
来自专栏企鹅号快讯

一个前端工程师的基本修养

有人说互联网是前端工程师的舞台,先不论这个说法是否有些夸大其词,但前端工程师绝对撑起了互联网应用开发的“半壁江山”。随着传统网站、手机应用、桌面应用、微信小程序...

22590
来自专栏闰土大叔

如何在公司体现前端价值 | 提升议价能力

But,国庆长假过后,即将迎来新的一轮跳槽季,土叔来说说前端从业人员跳槽到新公司之后,如何才能站稳脚跟。

18430
来自专栏无原型不设计

原型设计建议规范(一)

现在各种各样的互联网产品层出不穷,但是设计水平着实叫人不敢恭维。其实一款产品的设计水平在原型设计阶段就几乎已经决定了。熊先生最近和几个产品设计的大神接触,通过...

38740
来自专栏视频加密

适用于学校、医院、酒店、监狱等企业的iptv软件系统

点量OTT IPTV互联网电视系统目前已由点量软件的多家合作伙伴在海外正式运营,是最适合海外华人圈使用的电视盒影音聚合系统;同时也适合酒店、学校、监狱等局域网中...

16650
来自专栏SEO

学习|Google排名因素的深入了解

34670
来自专栏无原型不设计

如何构建UI组件设计规范?

以下内容由摹客团队翻译整理,仅供学习交流,摹客设计系统是国内独家设计规范制作平台。

25930
来自专栏互联网杂技

原型设计应当掌握的四个设计思维

从产品助理到产品经理,从负责模块优化到从0到1的全程设计、跟踪,从完全的产品小白到拥有自己的设计方法,这是一个成长的过程艰辛又坎坷。现在将要分享的是成长中所学到...

35940
来自专栏无原型不设计

十个网页设计的常见错误及解决办法

以下内容由Mockplus团队翻译整理,仅供学习交流,Mockplus是更快更简单的原型设计工具。 网页设计师总是在不断的犯错误,可这并不表示他们不够出色...

30940
来自专栏前沿技墅

一个前端工程师的基本修养

21230

扫码关注云+社区

领取腾讯云代金券