前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >集会游行的人数统计学

集会游行的人数统计学

作者头像
大数据文摘
发布2018-05-21 14:11:21
1.4K0
发布2018-05-21 14:11:21
举报
文章被收录于专栏:大数据文摘大数据文摘

文/I.Issak 杜修琪 转自大象公会

3月30日,中国台湾爆发反服贸抗议游行。下午1点,游行民众在凯达格兰大道集结。晚间7点40分左右,学生代表林飞帆宣布凯道活动告一段落,但强调占领“立法院”行动不会停止。

对于前往凯道参加反服贸游行的人数,各方说法大相径庭。截至当天下午2点06分,中国台湾警方估计人数已突破21万人,学生团体则估计高达35万人,而中国台湾“警政署”公布的统计数字则为8.1万人。

反服贸游行现场

政府和组织者对集会人数各执一词的情况并不鲜见,它几乎每年都要在中国香港发生两次。比如在2011年的一次集会中,组织者对媒体宣布参加集会的人数为15万,而警方公布的数字则是7.7万——几乎是组织者公布的一半。

集会人数意味着事件的重要性、民众的关注程度及其所展示的能量。这对组织者和政府来说,都具有不可低估的政治意义,各方所公布的数字也因此总是天差地别。然而,事实的价值不在于服务政治。长期以来,为了获取可靠的集会人数,学者和记者们付出了不懈的努力。

1960年代,美国深陷在越南战争的泥潭中不可自拔,国内反战集会此起彼伏,而校园则是“重灾区”。集会人数较为可靠的计算法首先在加州大学伯克利分校诞生。

计算集会人数的冲动或许来自新闻学教授哈伯特·雅各布斯无意中的一瞥——从他的办公室窗外望去,底下是黑压压的人群——学生们正在校园内发动反战集会。棋盘格的水泥地为统计创造了便利:雅各布斯挑选了几个方格,数出方格中的人数,然后计算出样本方格中的平均人数,再用这个数字乘以总方格数,就得到了集会总人数的近似值。

经过计算,雅各布斯将“松散人群”的密度划定在10平方英尺/人(1平方英尺=0.09平方米),“密集人群”的密度在4.5平方英尺/人。正是基于这样的标准,墨尔本大学研究者雷·华生和中国香港大学研究者保罗·叶认为在前文提到的那次中国香港集会中,组织者公布的数字15万是不现实的——要在4.2万平方米的面积上容纳15万人,则意味着人群密度会在2.7平方英尺/人。在两位研究者来看,那堪称“狂舞密度”。

如今,人们虽然已经可以动用卫星等工具来统计集会人数,但是雅各布斯的方法依然占据指导地位。比如亚利桑那州立大学的研究者,利用GeoEye-1军用卫星统计2009年参加奥巴马就职典礼的人数(统计结论是80万),而纽约警方则用限制人群的围栏数,乘以每个围栏对应的平均人数,来估算集会人数。

GeoEye-1卫星拍摄到的奥巴马就职典礼的高清卫星图片,左为观礼人群,右为国会大厦。

当然,简单的密度乘以面积的方法也有弊端——在集会场所中,人群密度并非均质、稳定,这就意味着,为了得到更精准的数据,人们需要采用更复杂的办法。

2010年,著名媒体人格兰·贝克(Glenn Beck)在林肯纪念碑发动集会游行,CBS(哥伦比亚广播公司)雇佣了DDIS(DigitalDesign and Imaging Service)公司来计算集会人数。DDIS所用的多密度计算法,就是对雅各布斯计算方法的一次升级。

为了预测参与者人数,DDIS首先测量了集会地点,绘制出标志了人群可能聚集点的地图,并与之前类似事件发生时这些地点的图片互相参照。DDIS要找到人群聚集的预期地点:冬天,会寻找避风口;夏天,则留意阴凉处。人群面向舞台、超大电视屏幕,而背对着高音喇叭。

事先的测算帮助DDIS选定具体的观测地点,之后,他们在集会场所的高地上升起带绳子的气球。气球带着一组远程控制摄像机升入空中,短时间内,就可在200英尺、400英尺和800英尺的不同高度抓取360°的人群影像。不同高度的机位可以拍摄到树下或其他较隐蔽地点的人群。

随即,DDIS将合成的影像覆盖在3D模型上,开始检查人数。他们的团队用网格标出各区域的密度,接着,用区域面积乘以相应的密度,最终加总,得出集会的总人数约为8.7万,并将统计结论的误差空间设定为10%。不过,即便有如此高科技水平的统计方法,各方报出的集会人数还是相去甚远——参议员米歇尔·巴赫曼(MicheleBachmann)集会当天在舞台上宣布总人数一百万,NBC报道的数字是30万,而格兰·贝克自己估测的数字则在30万到65万之间。

DDIS测算方法图示

用图片来计算游行人数是个不错的方法——如果人们总是保持一个相对静止的状态。但是,当游行人群在不断移动时,统计者走到游行队伍之中就会变得十分必要,这也是相关课题最新研究中的核心问题。

为了测量行进中的人群,统计者最常用的方法是在人群中设置一个或者两个数据采集点。

在第一个方法中,研究人员在游行、示威人群的中心位置设置观测点,记录给定时间内通过的人数。但这也有不足之处:一些人会在遇到研究人员前就离开了,或者躲避了研究人员,还有人会在通过这一点之后很快离开队伍。这使得进一步用电话采访来了解参与者的游行时间变得必要,但数据仍不够准确。

测算行动中的大规模人群总数绝非易事

对此,一个更快速,更准确的计算方式,是在队伍中分别开设两个计算点。两个点的研究者分别记录通过的人数,并随机提问参与者是否通过或预计通过另一个观测点。同时,研究人员也发现,若设置观测点超过了两个,则无助于提高准确性,只会增加经费。

中国香港学者苏钥机和钟庭耀在估算2003年中国香港的一次集会人数时,就用了两点计算法。他们在游行的主路线轩尼诗道上,选择了近波斯富街及柯布连道的两座行人天桥,在天桥上架设摄录机,抽样拍摄游行过程——每小时抽录四分钟后,马上把录影带运送到一个设有放映器材的地方,用定格在电视大屏幕上点算人数。

基于技术考虑,研究组只用了柯布连道天桥底的数据,推算游行人数,得出的数字是264000人。七月初,研究组通过电话抽样调查,发现游行者中有57%曾于轩尼诗道经过湾仔修顿球场对开马路,75.4%于黄昏六时正在街上聚集。

于是,再将经过计算点的人数,除以经过天桥计算点人数的百份比之后,研究组推算出游行者总数为462000人。电话调查本身的误差率(正负4.5%)也被考虑进来,则整体游行人数的上、下限分别为429000人和502000人。

至于这两个数字到底哪个更可信?这基本取决于你的政治立场。

使用简单的计算方法,任何人都可以进行人数统计。不过,若要做得精确,独立的学术界或许比较合适。而如果多个团体都同时进行独立和科学的人数统计,就可互相比较印证,会令彼此的推算变得更加谨慎,数字也更趋近真实。

当然,中国香港、中国台湾、美国这些非政府组织的游行还都是小儿科。历史上,中国官方组织的游行不仅规模巨大,且阵型整齐,密度均匀。相比之下,朝鲜的游行经验也不逊色:每年6月25日,都是朝鲜的“反美斗争日”,游行人数常年保持在十万级别。2005年05月17日,古巴领导人卡斯特罗亲自引领120万(超过首都哈瓦那人口总数,占全岛的1/10)古巴民众走上街头,举行反美游行。

朝鲜将每年的6月25日定为“反美斗争日”,举行大规模集会,并游行。

2005年5月17日,古巴120万民众在哈瓦那举行游行,要求美国政府惩办波萨达等古巴裔美国人

  此类游行的总人数,新闻界当天就会快速通报。而令学者们寒心的是,他们苦心研究的人数统计模型在此毫无用武之地——因为要按人头发放补贴,数字通常相当精准。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2014-04-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云硬盘
云硬盘(Cloud Block Storage,CBS)为您提供用于 CVM 的持久性数据块级存储服务。云硬盘中的数据自动地在可用区内以多副本冗余方式存储,避免数据的单点故障风险,提供高达99.9999999%的数据可靠性。同时提供多种类型及规格,满足稳定低延迟的存储性能要求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档