贝叶斯思想概述:从贝叶斯定理到贝叶斯网络

翻译 | AI科技大本营(ID:rgznai100)

参与 | 刘畅

假设世界上存在一种非常罕见的疾病,你患有这种疾病的几率只有千分之一。你想知道你是否被感染了,所以你做了一个99%准确的测试...且测试的结果是阳性的(译者注:阳性是感染了病毒的情况)! 那么你到底有多确定你真的被感染了?

怎么让疾病的第二次测试结果告诉你,你确实被感染了?

对于上述问题,如果你不想做所有的数学计算,而是更喜欢画一个网络结构来帮助自己更好地理解,那这篇文章是非常适合你的!

第一个测试

由于它是一种非常罕见的疾病(千分之一的机率被感染)。下表(称为条件概率表)给出了身体中有这个病毒的概率

这个表格显示只有千分之一的人被感染了。也可以这样认为:一千人中有999个人都是没有被感染的。

现在我们做了一个相似的测试表:第二个表表示测试的准确性。就是测试结果会告诉测试的准确度。因此,如果你被感染了,测试结果就是True,就是意味着你有99%的可能性被感染了,如果你没有被感染,测试结果将显示false(也是99%的准确度)。在这两种情况下,测试结果的错误率都是1%。

接下来的这张图显示,在给定测试结果的病毒是否存在的条件下,它的结果也取决于测试(如上面的表格所示):

然后,当我提供证据证明测试结果是True。由于只做了一次测试且结果是阳性的,因此该网络告诉我病毒存在于你的身体里,但是实际上病毒存在的概率只有9%!

那为什么会这样呢?这个数字来自贝叶斯定理:

在这个问题上,计算方法如下:

所以,即使你做了一个99%准确的测试,但是患该病的几率也只有9%。

这个计算看起来很复杂,但是一旦在图中来表示,我们就可以更好地理解贝叶斯思想是如何工作的。

进行第二次测试:

如果你进行第二次测试会发生什么?让我们假设这个新的测试也有99%的准确度,然后有一个和第一次测试一样的表:

相应的贝叶斯网络将是如下图所示:

这意味着:如果进行了两个阳性的测试,患该病的几率增加到了91%。由于加上了上一次实验的结果,并且是连续的两次实验,患病的几率从9%跳到了91%。但并不是100%!

在另一种情况下,如果第二个测试是一个阴性样本,则有100%的几率没有该疾病。

进行三次测试:

在三个测试中,所有的测试都有一样的准确度,我们可以看到一些有趣的结果。如果你有证据证明这3个测试结果都是阳性的,那么现在100%肯定你被病毒感染了。

但是如果一个测试结果是false,之前的结果会再次出现,即病毒只有91%的机会存在于你的体内:

总之,贝叶斯网络有助于我们展现贝叶斯思维,当数据量适中、不完整和/或不确定时,贝叶斯网络可以用于数据科学中。他们还可以引入专家判断来建立或完善网络。它们允许“模拟”不同的场景,而且能够表示出输入值(在这个例子中即是病毒的存在和测试的准确度)与输出(事件实际发生的概率)是如何在某种程度上联系在一起的。

在这篇文章中,我解释了如何从贝叶斯定理开始建立贝叶斯网络。我目前正在研究贝叶斯网络来预测项目的成本和风险。我想分享构建这种强大的人工智能工具的基础知识。

在这个暖心的视频中也解释了这个例子:https://youtu.be/R13BD8qKeTg

了解更多关于贝叶斯网络的知识:

关于在模型源上如何进行理论与数据的横向划分,贝叶斯网络有其特殊性。贝叶斯网络可以建立在人类的知识上,即理论上,也可以从数据中学习。因此,他们可以使用整个光谱作为模型源。此外,由于其图形结构,基于机器学习的贝叶斯网络在视觉上可以解释,因此也促进了人类学习和理论的发展。

贝叶斯网络允许人类学习和机器学习同时进行,也就是说,贝叶斯网络可以由人类和人工智能相结合而发展起来。除了跨越理论和数据之间的界限外,贝叶斯网络还具有因果关系这种特殊性质。

在特定条件下,即特定的理论驱动假设下,贝叶斯网络可以促进因果关系的推理。事实上,贝叶斯网络模型可以涵盖从关联/相关(Association/Correlation)关系到因果关系的全部范围。

实际上,这意味着我们可以将因果假设加入到现有的非因果关系网络中,从而建立一个基于因果关系的贝叶斯网络。当我们试图模拟一个领域中的干预项,例如估计一个治疗的效果时,这一点尤其重要。在这种情况下,必须使用因果模型,而贝叶斯网络帮助我们实现了这种过渡。来源:Bayesia book

原文链接: https://towardsdatascience.com/will-you-become-a-zombie-if-a-99-accuracy-test-result-positive-3da371f5134

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2018-01-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏cloudskyme

算法——贝叶斯

简介 学过概率理论的人都知道条件概率的公式:P(AB)=P(A)P(B|A)=P(B)P(A|B);即事件A和事件B同时发生的概率等于在发生A的条件下B发生的概...

36810
来自专栏专知

最新综述文章推荐:自然语言生成、深度学习算法、多媒体大数据分析

【导读】专知内容组整理了最近人工智能领域相关期刊的5篇最新综述文章,为大家进行介绍,欢迎查看! 1 ▌自然语言生成综述:任务,应用,评价 ---- ---- ...

6487
来自专栏FreeBuf

如何构建一个反电信网络诈骗基础模型

网络诈骗,电信诈骗层出不穷,花样翻新,防不胜防,伤害普通百姓利益。本文通过对目前社会上关于网络电信诈骗新闻进行提取,从中分析当前网络诈骗发展趋势和关键因素,进而...

2186
来自专栏云社区全球资讯抢先看

新的算法将一键修复损坏的数字图像

技术可以使用人工神经网络的力量来一次处理单个图像中的多种类型的图像噪点和图像模糊。

1922
来自专栏鸿的学习笔记

The Brain vs Deep Learning(一)

---这是一篇很有深度的文章,把深度学习和大脑做了比较,一步步分析,通俗却不简单。

752
来自专栏AI科技评论

学界 | Ian Goodfellow和Papernot半年三篇博文,对机器学习的安全隐私来了个大起底

AI 科技评论按:随着人工智能研究的不断发展,由机器学习模型在背后提供支持的功能越来越多地开始商业化,最终用户的生活里机器学习能造成的影响也越来越大。这时候,机...

41812
来自专栏量子位

伯克利用120万美元设备24分钟训练ImageNet,刷新Facebook成绩

李林 编译整理 量子位 报道 | 公众号 QbitAI 最近,加州大学伯克利分校的研究人员用120万美元的设备,24分钟完成了ImageNet的训练。 ? 在最...

3364
来自专栏机器之心

ICML 2018 | 英伟达提出仅使用噪点图像训练的图像增强方法,可去除照片噪点

近期在深度学习领域的研究聚焦于通过展示带噪点和清晰的图像示例对来训练神经网络修复图像。然后 AI 系统学习如何弥补差异。新方法的不同之处在于,它仅需要两张都带噪...

1324
来自专栏Python中文社区

回归树的原理及Python实现

提到回归树,相信大家应该都不会觉得陌生(不陌生你点进来干嘛[捂脸]),大名鼎鼎的 GBDT 算法就是用回归树组合而成的。本文就回归树的基本原理进行讲解,并手把手...

992
来自专栏阮一峰的网络日志

指数式增长(Exponential Growth)

前几天,我在日志中写到,有人根据我国历代古籍的数量,整理出一个指数方程。当时我还嘲笑说,这种做法有点无聊。今天我才发现,不是人家无聊,而是我太无知。 原来,文献...

4985

扫码关注云+社区

领取腾讯云代金券