首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

“生日悖论”:为什么23个人中就可能有两人同一天生日?

在一个只有23人的房间里,至少有两个人同一天生日的概率是50%。

这听起来像个悖论,对吧?

为什么说这是悖论呢?我们知道,一个人和另一个人生日相同的概率只有1/365。而我们大多数人可能认识的朋友远远超过23人,却很少遇到生日相同的情况。这不禁让人质疑:这个说法怎么会成立呢?

其实,这种逻辑存在一些问题。首先,这里并不是问“有没有人和你同一天生日”,而是“是否有任意两个人生日相同”。这种可能性比你想象的要大得多。

为了更好地理解这一点,我们可以通过计算机模拟来验证“生日悖论”的真实性。

模拟就是用计算机或模型去重现现实情况的一种方法,既高效又经济。比如,用风洞测试飞机模型的气流表现就是一种模拟。

在这里,我们通过Python编程语言模拟“生日悖论”。模拟的核心是:随机选择人并记录他们的生日,直到有两个人的生日相同为止,然后统计需要多少人才能发生这种情况。

以下是模拟实验的具体步骤:

随机选择一个人的生日。

检查之前是否有人有相同的生日。

如果没有重复,则继续选择下一人,重复步骤1和2,直到找到生日重复的人。

统计询问人数,并将其记为结果。

以下是模拟该实验的单个实例的代码:

def collect_until_repeat(dist = np.ones(365)/365):    # dist is the distribution of birthdays. If it is not known    # it is assumed uniform    # We'll use this variable as the stopping condition    repeat = False    # We'll store the birthdays in this vector    outcomes = np.zeros(dist.shape[0])    # n will count the number of people we meet. Each loop is    # a new person.    n = 0    while not repeat:        # add  one to the counter        n += 1        # simulate meeting a person with a random birthday        outcomes += np.random.multinomial(1,dist)        # check if we got a repeat        if np.any(outcomes > 1):            repeat = True    return n

重复以上步骤多次,我们可以得到一个关于“多少人需要满足生日重复”这一问题的概率分布。

通过一百万次实验的结果,我们得到了如下统计分布图:

水平轴表示需要询问的人数(n)。

垂直轴表示发生相应n值的概率。

实验结果显示,当房间里有23个人时,至少两人生日相同的概率确实达到了50%。这个结果验证了“生日悖论”的真实性。

有人可能会问:现实生活中,生日并非完全均匀分布。比如,12月25日和12月31日的出生人数明显偏低。如果我们用真实的生日分布数据来做实验,结果会有所不同吗?

答案是:不会!

我们通过实际的美国1994至2014年间的出生数据进行模拟后发现,无论是否考虑真实分布,“生日悖论”都成立。

如果你对“近似生日”(比如前后相差1天)也感兴趣,那么所需人数会更少。比如,当允许1天的容差时,只需要大约20人就几乎可以保证找到一对“接近生日”的人。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ON4NM6Lt6dLD3gT29uM_ZJfA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券