首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >川普的逆袭,是给大数据的一记耳光!

川普的逆袭,是给大数据的一记耳光!

作者头像
钱塘数据
发布2018-03-02 10:37:30
1.1K0
发布2018-03-02 10:37:30
举报
文章被收录于专栏:钱塘大数据钱塘大数据
昨日,美国总统选举落下帷幕,共和党总统候选人唐纳德·特朗普在这场权利的游戏中获得胜利,成功当选美国第58届总统。这次美国总统竞选被德国《商报》称作“第一次数字化竞选”,而特朗普的这次逆袭,让之前支持希拉里的数据预测大跌眼镜。

2016年美国总统选举9日落下帷幕,初步统计显示,共和党总统候选人唐纳德·特朗普击败民主党总统候选人希拉里·克林顿,当选美国第58届总统。2016年的美国总统竞选被德国《商报》称作“第一次数字化竞选”,两党候选人都组织起了庞大的技术班底,将大量资金花在获取和使用投票者的信息上。

在这场盛大的政治活动中频繁出现了许多名词:大数据、社交网络、软件机器人、黑客,甚至是维基解密。两党候选人都组织起了庞大的技术班底,将大量资金花在获取和使用投票者的信息上,并且借助社交网络的力量,将自己获胜的希望最大化。

而选举之前美国主流媒体和选前的各种民调明显看好希拉里,各种数据预测也都支持希拉里胜利,而特朗普的逆袭可以说实实在在得打了大数据一记耳光。

“数据巫师”Nate Silver

说起美国大选,不少新闻和舆论总是提到一个“数据大神”Nate Silver。Silver是一名美国专业数模分析人士。以下是他的战绩:①2008年美国大选,他准确预测了50个州中49个州的投票结果。②2012年大选,在华尔街和政客都苦恼选情胶着的时候,他却基于数据分析,断言奥巴马有超过九成概率获胜。更神的是,美国50个州的投票结果,他竟然一个不落地全部预测准确。

那么,对于今年的大选,Silver基于数据分析之后,又得出了什么结论呢?

首先,Nate Silver进行预测并不是靠所谓的“直觉”,而是纯粹地靠数据,对众多的数据用算法进行处理。所以他做的是一个预测算法,编程实现的,报告的是计算结果,是“胜率80.7%”这种精确的数值,不是“希拉里优势明显”这种模糊的话。

在美国大选这个事件上,算法依靠的主要基础数据就是各种各样的“poll”,即大选民意调查。美国大选历时数月之久,全国以及每个州都有各种机构主办的不同规模的大选民意调查,一个州对一次大选可能有多达上百次的民调。如对佛罗里达州,538网站共收集了68次民调数据。这就是Silver需要的“信号”。但是由于各种民调的机构背景、立场倾向、覆盖人群、举办时间差异极大,参考意义肯定各有不同,如何处理就是真正的技术了。这相当于要从一堆“信号”中,排除掉“噪声”,得到真正有效的信息。

所以,我们不能说Nate Silver看好谁,他是没有“预设立场”的。Silver报告的胜率不断波动,领先者是可能发生变化的,8月初特朗普就领先过。这正是他与一般预测专家不同之处。如2016年7月20日,新闻引用Silver的预测,希拉里大选获胜概率为64.2%,领先特朗普的35.8%。9月26日第一场电视辩论会之前,媒体又引用Silver的预测,“如果立刻大选”,特朗普的胜率是51.1%。电视辩论会之后,在Silver建立的“538”网站上,希拉里的胜率明显提升,2016年10月1日为67.3%,10月7日已到达80.7%。而最后的结局打破了Nate Silver的数据预测神话。

微软的Bing

微软为Bing搜索引擎带来了全新“智能自动完成”功能,Bing将能够基于其他用户查询关键字和结果,以及Bing自己的查询和语义绘图技术,让用户进行更广泛的搜索,以便产生预期的用户结果。

在Bing官方博客中,Bing团队解释了这一新功能的工作原理,他们表示,比如用户输入的搜索词是“有关的Andr机器学习篇”,Bing能够智能的工作,并向用户建议他们应该搜索的关键词。另外,Bing还可以根据用户给出的关键词,使用机器智能查找用户希望看到的结果,而不是简单地根据用户关键词展示所有搜索结果。

此前,微软的Bing曾预言:希拉里有87%的可能性赢得大选;而最新一次的预测结果显示,希拉里获胜几率是89%,而特朗普只有10%。最终,希拉里将获得各州选举团的323票,而特朗普会获得215票。

”Nate Silver和微软的预测实在让人大跌眼镜,大数据,有时并非万能的!不要把大数据过度神化。

大数据并非完美,有些事情动态变化比较大

在一些实际考量中,存在大数据动态变化比较大的状况。相对而言,美国大选数据调查的大数据,肯定比今天众多贩卖大数据概念的调研公司,肯定更加专业,考量因素做的更科学。但是即使这样,有些动态变化,也会缺乏及时的把握。

例如曾经杜威和杜鲁门的大选竞争,大选前夕,杜鲁门的支持率虽然落后于杜威,但数字已经从两个月前的32%激增至44%,显示他正在赢得摇摆选民的支持。密歇根大学的调查发现,投给杜鲁门的选民中,有14%的人在竞选的最后两周才决定投他票。盖洛普和罗珀的调查也显示类似的现象。这说明杜鲁门赢在了最后一英里。

这种动态变化的及时性很关键,大数据统计的往往是过去一个时期表现出的特征,最新的特征能否被迅速捕捉到,而一些已经发生变化,但还没有外在表现出特征的变化,很难捕捉到,这些可能往往影响事态变化。

在相差悬殊不大情况下,由于比拼概率、误差也许会很大

在相差悬殊不大,都存在一定概率的时候,这个准确预测能力就很难说了!

毕竟双方都具有较高的概率,具有较高的可能性,谁都有胜出的可能,这种预测的准确性是比较难以判断的。

例如这次,希拉里与特朗普之间的差距实际很小,在当初特朗普骚扰事件之时,两人差距拉大、希拉里保持过较大领先,但是随着维基解密的一些曝光、以及FBI宣布重启邮件门的影响,两者之间差距很小,这种极小的差距,加上美国独特的选举人票模式放大,最后上演了特朗普的逆袭。

毕竟双方都具备一定的胜算概率,胜负在谁手里很难说,某种程度降低了大幅降低了预测的概率和准度。两者差距比较明显,基本上大数据准确率比较高,但是相差不大,呈现胶着状态,也直接影响了准确率。

大数据对黑马、及未来的创新预测,可能会失准

——对于不确定性的状况,大数据就很难把握

无论是黑马、突发情况,还是未来的创新性技术、艺术作品等的出现,都带有不确定性,让大数据束手无策!

一种是黑马情况,突发情况难以预测

大数据更多是对已有事物、现象的总结,但是有时候突发情况出现、黑马出现,意外搅动了局势,让整个格局超出了之前已掌握的情况。让一切发展充满了不确定性!

希拉里上一次竞选总统时,已经遭遇一次黑马状况,上一次竞选之初,希拉里在党内竞选时,开始是具有明显优势,但是没想到奥巴马的横空出世,打乱了计划,当时奥巴马相对声明显赫的希拉里相比,在知名度和影响力相差甚远,但是奥巴马的横空出世却改变了状况,最后赢得党内大选,并最后当选总统。

可以说,奥巴马当时的出现就是黑马姿态,他的信息和潜力都超出了之前掌握的情况。

大数据整体是很有效的,但不是万能的

当然,我们不能否认大数据有效的,总体上是具有很高价值的!多数时候、科学考量状况下准确率很高、所创造的价值极大!

因为,大数据的价值实际上是信息流的获得,获得足够、充分的信息,对于决策的合理性和科学性具有极高的价值,无论是真正的战争,还是商业上的竞争,获得信息越多,数据越多,对于合理的商业决策的帮助越大,成功的可能性也越高!而从国家、企业重视信息、重视大数据,就可以看到大数据的独有价值性。

但是,同时,我们也要看到,大数据的一些局限性,无论是保证数据精准的考量要素设定、消费者回答的真实性,还是对于动态变化的及时把握,对于黑马、突发情况发生、未来的创新技术艺术等方面,都会影响大数据作用的发挥,以及判断的精准性。

所以,大数据不是万能的,要使用它,一方面要具备很高的专业性、保证数据的合理性、科学性,从而保证使用的实效性;另一方面要敏锐感知变化,提高对未来的前瞻性判断能力,避免大数据对于变化、不确定性判断懵圈。

图文整理自网络

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-11-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 钱塘大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档