有时候不能太迷信数据

终于找回了某天早上刷牙的时候突如其来又很快丢掉的灵感,就是别太迷信数据结果。

迄今为止,人类确实已经发现了非常多的事物,并把这些事物通过繁茂的记录工作组成了一个非常庞大的数据库,有很多生活中的现象,包括我们身体上的,自然界的,地球以外的等等等等,都能在这个数据库中找到相互关联的交织的记录,从而去认识了解这些现象背后的原因和规律,这对于整个人类社会来说,是不断累积的不可多得的宝贵财富,首先我们要对这些数据予以肯定,它们所建立的真实的功劳不是我们三两句怀疑就可以摧毁。

这里我要说的不是要我们去怀疑数据构成的结果,而是去认识数据的“起源”。

数据既然是人为记录的结果,那肯定是先有这些数据的原始元素出现的地方,这些数据从何收集而来,通过怎样的方式去收集而来,并不是一两个人能够发现并完成这个工作,真实有效的数据必须像钻石的诞生那样,需要先存在,后被发现,然后组织开采,组织搬运,统一进出库管理,按照流程分配原矿给设计院,最后统一安排工匠或工作加工制作出来,整个操作过程从发现矿石到展现钻石,都有一套非常系统严谨的管理体系,这种管理体系,用于数据采集与组织呈现,可以说有异曲同工之妙。

那么,数据又有哪些方面需要我们去“怀疑”呢?

上面已经说了,从数据出现的地方,就可以一步一步开展去了解了。

首先我们需要知道数据源自哪里。这里要用一个最贴近实际的例子去说,就说人类的病患数据。

这些数据来源于我们人类本身,首先需要我们先发生疾病,去看了医生,把这些疾病信息传输给医疗机构,医疗机构记录病患信息与治疗过程,保存成档,成为一个新的病例数据。好了,此时此刻,在地球的另外几个角落,可能也出现了患了相同症状的病人,他们也都及时去看了医生,及时地接受了治疗,医院也及时地记录了整个患病和治疗过程,最后存档病例库。一切看上去都进行得非常的顺利,我们就先把它放顺利地看。那么此时此刻,我们的人类疾病数据库里面就有了3例新的同样的病案,如果运气“好”的话,后面还会有不同时间或不同地区的人发病,再去看医生,贡献自己的疾病数据;运气“不好”的话,这几年内可能也就没有人再患这样的疾病了,然后前面那3例疾病就变成了“少少数民族”,一直被冷藏在万千的病例之下,如果数据保存得好,这样冰封几十年应该也不是问题,我们就且认为数据没有被破环。

但是,即便没有被破坏,它始终是一个体量极小的病案,并不会引起多少人的注意,而那些动不动就几万或几十万个病例起步的大体量数据库,才能引起人们的关注,一旦有人关注,而需要解决这个疾病问题的病患越多,这个病例就能成为大众瞩目的“明星”,人们会加大投入研发对症治疗的药物方案或治疗仪器,加速地传播这种疾病的常见症状以及防避方法。这样一来,一个完整的围绕这项疾病展开的人类生产生活“产业链”就此形成良好的闭环,大多数人就都围着这个疾病转,去认识它了解它防备它治疗它,大部分的社会资源也就倾向了这一号疾病了,其他不是每天都有新的不同的病例情况出现吗,怎么不去讨论了?从上面这个过程可以看出来,不是没有人去讨论,而是病例个案实在太少,不是病例相关的人很难参与讨论研究起来。

那我们说,那些孤独病例的人不是很惨吗?患了这么少见的病已经很惨了,还没有人去关心自己,没有组织可以依靠。这个,只能说真就是命运安排,谁也不知道基因突变什么时候会发生在自己身上。其实人类社会发展到现在,虽然确实已经解决了不少自身的健康问题,但是整个地球的生态链生物链细胞链等都是在不断的发生变化的,受到太阳等粒子磁场的干扰,我们的环境又会变得跟以前不一样,我们人类身体里面的其他生物身体里面的细胞细菌等生命体为了适应这些变化,肯定也在发生着微妙的改变。

举一个例子,我们当代人基本都人手一部智能手机,我们接触手机电脑等电子产品的时间非常长,直到有一项研究检查出当代人的脑前额比以前多了一个海马区,这个发现则已经充分的说明了我们的身体在悄悄的发生改变去适应我们当前的生活,直到某一天这个变化长大到能被我们发现,其实对于我们的身体,我们的认识都是滞后的。

同样的道理,回归到我们的数据库,可以这么说,所有数据库里面的数据都已经是滞后的,相比起我们当下的身体情况,这些数据更多是一个历史数据,是一个可参考的数值。然而特殊疾病的发生概率在现实中确实也比较小,因此我们也不需要对自己的疾病情况大惊小怪或过度紧张,是大概率的情况就按照大概率的治疗手段去操作,一切跟随历史数据建立的系统,只是,当我们采用大数据治疗手段也无法根治疾病时,则需要缓一缓下来,换一种思路,自己替自己理清楚疾病出现的本质,是工作过劳压力太大导致内分泌失调免疫力下降收到特殊病菌的入侵,还是一不小心毫无保护的进入了某个高辐射区,还是平时的饮食接触吸收了大量有害物质,还是自己心情郁闷或过度惊慌导致的免疫失衡,等等等等,在我们求医无门求助无神的时候,该轮到我们自己亲自上场,给自己“望闻问切”,而不是等待类似的数据或数据结果的出现。当我们看到某些数据的时候,也许这些数据早己经“过时”了,因为这个世界的微生环境在以某个不可预知的速度发生着变化,我们能做的,就是多点关注自己,做自己身体的主人。

因此由此例子我们可以推断,其他行业或物种当下所展现的公共数据,可能并不能完全代表所有行业或物种的情况,而我们能做的,除了遵循历史数据,还应当保留一个小小的角落,去容纳正在发生但又未及时被记录的数据情况,记住,没有什么是绝对的有或绝对的无,对比永远是相对的。

上官简安

有理想,不理想主义,关照世界和现实。

封面图片取材于网络,如有侵权,请联系作者删除

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180713G002JW00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券