警惕!《马航MH370调查》之阴谋论,做一个科学吃瓜群众

这几天被一个刘铁侠阴谋论论文章刷屏了:马航MH370调查(终结篇)

后来立刻也有一些文章出来反驳了。

资深机长怒怼一派胡言的所谓“马航MH370调查终结篇”

连人民日报也坐不住,出来强烈怒斥一派胡言。

本文不打算一一反驳里面漏洞百出的论据,上面反驳的文章也都逐条反驳过。所以我们从数学的角度来分析一下,为什么这么多人会被这篇文章带入相信马航阴谋论。科学吃瓜,姿势要帅!

希望读者对下面概念有一点感性的了解,更希望你们永远不要去相信阴谋论。

概念:最大似然估计,先验信息,后验概率,贝叶斯估计,奥卡姆剃刀。可以参考之前的 【通俗理解】贝叶斯统计

从“最大似然估计”看阴谋论

飞机失踪有很多种可能,现在只列出来两种:

1) 刘铁侠的阴谋论观点,被美国劫持了。

2) 飞机失事。

那么问题来了,一个事件有两种可能,我们是去相信可能性大的还是小的?理性的人肯定相信大的,这也就是“最大似然估计”的思想,被广泛应用在统计学,信号处理,模式识别等。

我最近一次用最大似然估计的思想是关于我那个不争气的表弟。玩我姨的手机把她一冬天在超市打工辛辛苦苦赚的8000块钱败光了,说是被深圳一家高科技公司偷偷从微信里把钱转走的。吓得一家人不敢用微信支付宝了。我看这小子绝对是打赏女主播或买王者荣耀皮肤了,过年回家我就去帮我姨查账单。

不是说被盗的可能性没有,钱被他打赏主播然后撒谎的几率远远大于微信里钱被盗,我肯定先排查可能性最大的。

从“先验信息,后验概率和贝叶斯”分析阴谋论

有人说了,理性上我当然知道选可能性大的,但为什么还是情不自禁的想相信那个飞机被美国劫持了呢?

恭喜你,有了贝叶斯推断的思想!

因为你判断一个事情时,不仅仅根据当前观测到的信息,还根据历史相关信息,术语被称作先验信息。先验信息是不知不觉、自然而然就用到了。你和同学打架了,双方各执一词,为什么老师惩罚你?天天惹事生非的你心里还没有点逼数么?我们从小就被灌输了万恶资本主义的坏,很自然的就会代入了:既然美帝这么坏,劫持个飞机也是很有可能的

贝叶斯推断的思想求的后验概率,顾名思义就是已知事件发送,某某原因出现的概率。后验概率是先验信息和似然函数的结合。简单地说,就是根据先验信息和当前事件可能性进行综合评估。数据少时,往往先验信息占主导因素;数据多时,先验信息比重就下降了。

很不幸,错误的先验信息误导了你……正确的先验信息应该有理有据而不是先入为主的印象。要获取这个问题的先验信息,应该查一下历史空难数量,所有空难里因为被美国劫持的占比重,才是先验信息

可惜,人往往选择去相信自己愿意相信的,而不是分析事实。而是不断的为自己愿意相信的东西去找论据支持。不幸的是,他们成功了!

用“复杂的模型”诱导读者相信阴谋论

再匪夷所思的观点,都能有很多人去相信,而且生活中都是精明人。他们为什么能说服自己相信?因为他们为其创造了复杂的数学模型,无限长度的逻辑链条。如此复杂的模型,调一调参数总能match上某些结论。

正如下图,用一条曲线去拟合蓝色点。当用9次函数时,完美match!如果9次不够那就再加!参数足够多,调节的灵活性就越大,得出的结论就可以越匪夷所思。

再来看一个故事,原文找不到了,大体意思是老师教学生逻辑学。老师问一位陌生人家里有没有一块大的草坪。

陌生人说有。

老师继续说:“那你的孩子一定很喜欢在草坪玩。”

“是的。”

……此处略去n个回合。

“那你一定有一位爱你的妻子。”

“是的。”

“所以你是个异性恋。”

“是的。”

然后轮到学生去问另一个陌生人:“你家后面有草坪么?”

“没有啊。”

“我槽!同性恋!”

任何人都知道没有草坪推断出同性恋很荒谬,可是自己却不知不觉犯了这个错误。问题究竟在哪呢?

模型比较与奥卡姆剃刀

先来看一副图:一棵树,后面有箱子。

请问被树挡住的箱子是一个还是两个?如下图:

虽然无法排除2的可能,但一般人都会选择1。理由很简单:哪那么巧,两个箱子高度、颜色都一样。1个箱子是一个简答的模型,2个是复杂一点的模型,我们自然而然选择了简单的,真不容易,这可是奥卡姆剃刀的思想:尽量选择简单的模型。

所以你就知道上面故事问题所在了:用了一个复杂的模型。如果复杂的模型有n个参数,每个参数有m中可能,等概率情况下恰好选到满足你的假设的概率为m×n分之一……可以计算出,上面箱子问题中,2的可能性是1的千分之一。然而

思考题

朋友告诉你XXX股票靠谱,有机构要拉升。已知朋友靠谱程度90%,但是这大概是第n手信息,n=7。简单地,我们假设这些朋友靠谱程度都是90%。到你时,消息靠谱程度有多少?

答案很简单,0.9的7次方,47%,还不如猜……这都还是靠谱的朋友……

有人又说了,你说的似乎有道理,概率上发生概率是很小,但是这个世界就是很巧合,比如……

就好像摸彩票中奖概率很小,但总有人中奖一样,因为事件发生的次数太多了。而人总是对小概率事件有深刻的印象。确实,小概率事件的信息量比较大,这涉及到信息论了^_^:越小概率事件信息量越大

总结

阴谋论者利用人们的情绪和偏见(先验信息),给出你们愿意相信的观点。可是一旦静下心分析一下真实的先验信息(来自历史数据),再结合最大似然思想(请不要侥幸心理去相信小概率事件),就不攻自破了。

阴谋论者还给出很多故事环节(复杂的模型),似乎逻辑上天衣无缝。可是仔细一想,这么多环节一旦有一个没有按阴谋论者的剧本走,就得不到最后的结果了。环环相扣的成功率遵守乘法法则,会非常非常小……

原文发布于微信公众号 - AI启蒙研究院(AIEvolve)

原文发表时间:2017-11-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

【业界】谷歌 DeepMind 的可微分神经计算机 DNC 怎么样?看 Facebook AI 研究员田渊栋、贾扬清怎么说

田渊栋,卡耐基梅隆大学机器人系博士学位、上海交通大学硕士学位和学士学位,前谷歌无人车项目组成员,现任 Facebook 人工智能组研究员,主要负责 Facebo...

3835
来自专栏数据派THU

独家 | 一文读懂社交网络分析-上(附学习资源)

(点击可查看大图) 本文主要阐述: 社交网络的结构特性与演化机理 社交网络群体行为形成与互动规律 社交网络信息传播与演化机理 浏览后四章的内容请见下篇(2017...

80810
来自专栏钱塘大数据

【推荐阅读】如何看穿数据可视化的谎言?

以前我们看到一个做得很烂的图表,或者穿帮的数据可视化作品时,往往是将它们嘲笑一番也就算了。但有些时候,尤其是刚过去的这一年,我们好像更难分辨一个可视化作品是单纯...

3107
来自专栏玉树芝兰

如何有效沟通你的机器学习结果?

他说,许多人跑模型,跑出来一个比别人都高的准确率,于是就觉得任务完成了。他自己做健康信息研究,通过各种特征判定病人是否需要住院治疗。很容易就可以构建一个模型,获...

915
来自专栏大数据文摘

日本科学家的AI读心术,解码脑电波,还原人眼所见

1162
来自专栏AI科技大本营的专栏

AI 行业实践精选:食向量——运用机器智能提高烹饪技能

【AI100 导读】人工智能将人类的思维转化为程序和算法,用计算机的、高速运行能力来提高效率,在一定程度上能替代人的部分功能。如今,随着人工智能的发展,出现了智...

34010
来自专栏数据科学与人工智能

【应用】信用评分卡:逻辑回归

几年前,我和妻子在英格兰和苏格兰度过了几个星期的假期。就在登上英国航空公司的飞机之前,一名空姐告诉我们,我们已升级为商务舱。快乐!度假真是一个美好的开始。一旦我...

1933
来自专栏量子位

Google开启全新图像目标检测大赛,场景多样性和复杂度史无前例

1052
来自专栏新智元

图灵奖得主Judea Pearl:机器学习无法成为强AI基础,突破口在“因果革命”

来源:arXiv 编辑:新智元编辑部 【新智元导读】图灵奖得主、贝叶斯网络之父Judea Pearl日前在arXiv上传了他的最新论文,论述当前机器学习理论局限...

44511
来自专栏AI科技大本营的专栏

《自然》杂志医疗AI领域最新成果系列二:关于皮肤患者的AI解决方式

图片来源:CDAPEX 编译 | Ziqi Zhang 编辑 | Donna 【AI科技大本营导读】澳大利亚阿德莱德大学的在读医学博士生、放射线学专家Luke...

3476

扫码关注云+社区

领取腾讯云代金券