首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >工作中的定律与悖论

工作中的定律与悖论

作者头像
数据仓库晨曦
发布2025-06-12 14:13:18
发布2025-06-12 14:13:18
650
举报
文章被收录于专栏:数据仓库技术数据仓库技术

日常工作中经常有各种感慨、感悟或者一些经验,慢慢发现其中一些在不同领域早就有了定律、悖论等。只恨读书少啊。例如经常感悟一些指标用着用着就不好用了;一些架构怎么改,怎么重构都会慢慢回到原来的样子;一些时候认为某些东西重要,但是苦于没有办法量化导致没有办法证明,就不被支持,最后采坑了,等等等等。今天我整理了一些自己相对比较认可的定律分享给大家,挂一漏万,欢迎大家补充。

古德哈特定律

当一个评价指标成为目标时,它就不再是一个好的评价指标。

当某个指标被用作衡量或评估某一现象,并被设定为追求的目标时,人们往往会采取各种手段来操纵或优化这个指标,从而导致其失去原有的真实性和准确性。这种操纵行为不仅可能使指标失效,还可能引发资源浪费、道德风险、系统失衡等一系列问题。

麦克纳马拉谬误

过度依赖量化指标,忽略无法量化的关键因素

麦克纳马拉谬误发生的过程如下:

  • 第一步是测量任何可以轻松测量的东西。
  • 第二步是忽略那些不容易测量或给出定量值的东西。
  • 第三步是假设那些不容易测量的东西真的不重要。
  • 第四步是不容易测量的东西真的不存在。

ETL 延迟传递定律

首先这个并不是什么定律,属于经验了,内容是:如果上游任务延迟,其延迟效果到下游会被放大。

什么意思呢?假设一条执行链路执行时间为5小时,某天该链路第一个任务执行完成时间延迟了一个小时,那么最终这条链路完成时间会比1小时长的多。

辛普森悖论

在分组分析中出现的趋势(正相关/负相关)与整体合并分析时相反(原因是分组比例发生了变化)

伯克森悖论

当不同样本被纳入统计的概率不同时,样本的两个不显著相关的特征就能够表现出一定的相关性。

数据质量守恒定律

数据质量问题无法被消除,只能在不同环节转移。

90/90定律

90%的数据在采集后90天内不再被访问。(所以生命周期该怎么设计呢?)

幸存者偏差

仅分析“存活”样本而忽略已消失数据,导致结论失真

康威定律

核心观点:组织设计系统的结构往往会反映出该组织的沟通结构。

康威定律分为四个定律:

  • 第一定律:组织的沟通方式会通过系统设计表达出来。意味着组织的沟通方式会直接影响系统的设计,系统的架构会反映出组织的沟通架构
  • 第二定律:时间再多一件事情也不可能做的完美,但总有时间做完一件事情。强调了在软件开发,尽管时间有限,但总可以通过迭代和逐步完善来完成任务。(观点与扎克伯格的“完成比完美更重要”类似)
  • 第三定律:线型系统和线型组织架构间有潜在的异质同态特性。意味着系统的设计和组织架构之间存在某种对应关系,系统的设计往往受到组织架构的影响。
  • 第四定律 大的系统组织总是比小系统更倾向于分解。表明复杂的系统在开发过程中更容易出现分解和模块化问题。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据仓库技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 古德哈特定律
  • 麦克纳马拉谬误
  • ETL 延迟传递定律
  • 辛普森悖论
  • 伯克森悖论
  • 数据质量守恒定律
  • 90/90定律
  • 幸存者偏差
  • 康威定律
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档