统计性判断的基本概念

QualityManagementStory:

统计性判断的基本概念

※通过简单易懂的案例故事,了解QM。

----------------------------

品质管理中心有品质分布的说法,这在实验中称为误差(Error)。.

因为无论多么严密的实验,也会存在不可控的细微要因产生的变动。

误差和失误(mistake)或实验的失败是有本质上的区别的。

即便实验中未出现任何失误,实验非常成功, 数据上分布的原因总称为误差要因。

即使两个实验平均值相同,但是结论不同,原因在于实验误差,或说“同一条件下产生的数据散布的大小”。

例:

汽车制造商 改善燃料消耗,安装新型引擎的A车,和旧引擎的B车,

假设我们对2种车型各3辆进行行驶实验后得出数据。

新型车A的消耗比 旧车B的消耗多出2km/l,可以得出结论“新型车的消耗得到了提升”

观察这里3组数据会产生疑问。A的3个数据中“11”比B中的2个数据14和17要小,所以这么看时,单纯的拿着平均的数据(A平均比B平均多出2km/l),很难说就是A比B消耗低。 假设慎重起见多测量一个样本得出的数据 A是11,B是17(从前面3组数据看的话,这个结果是可能的).这时 A和B的平均都得出14.75, 那么就无法得出结论了。

这种时候继续增加测量样本数据,A和B的平均值会持续上下浮动,所以无法得出结论谁的消耗更低。

但是如果消耗的测量值如下,这时能否判断谁的消耗更低呢?

这样看时,平均值和刚才相同是A16,B14 。但关注各自的细部数据时A的3组数据比B的3组数据都大。这就可以推测,即便将测量值增加为4个,5个 A的数据会比B的数据更大。

所以 , A的平均值与B的平均值之间的差, 虽不可能一直是2, 但是“A的平均值肯定比B的平均值更大”这个推论是可以成立的。

----------------------------------

所以即便实验值的平均是16,14 。数据表时 无法判断新型车A的消耗是否得到了提升,但后者的情况,是确信新型车的消耗得到了提升,所以可下此结论。

至于为什么会这样,为了知道这个原因,我们需要关注各个的细部数据。即使是在相同的条件下,也就是相同的引擎和部件,相同的条件下组装。但每辆汽车的性能总是免不了有些许不同。

品质管理中有“品质散布”这个说法。这在实验中叫做误差 (Error)。因为不论多么严密的实验总会存在一些无法管控的细微要因引起的变动。误差与失误(mistake)或实验的失败 有着本质上的不同。

即便没有失误或失败,即便实验非常成功,也无法避免数据上的一些散布,这些原因的总称叫做误差要因。前面的两种情况,实验结果和实验值的平均即使相同,也就是同样都是A:16,B:14 , 结论也会有可能不同。其原因就是实验误差,也就是原因在于“相同条件下出现的数据的散布的大小”

仔细观察各个数据,前者(数据)是A的3组数据从小到大是11到19, 存在8的差异,B的3个数据是11到17,存在6的差异。

后者(数据)是,A的3组数据是15.5到16.3, 散布大小是0.8, B的3组数据是13.7到14.3,散布大小是0.6。

两种情况的实验误差大小(散布的大小)居然有10倍的差异。所以说,无视实验误差 单纯的比较实验值的平均值,是无法判断“新型车A”和“旧车B”是否存在消耗差异的。

想要检验A和B之间的差异,需要评价A和B平均值的差和相对性的实验误差才能做到。

统计性判定的规则概念公式可参考下图。

这里留下2个问题, 一是如何评价和计算出“误差”,二是 如何将“并非如此”这抽象性的概念,客观性的基准化。 对此后续将继续推送...~

--------------

往期QualityManagementStory:

2.什么叫“Quality”?

只有7%微信订阅号在坚持原创

需要您的一个“在看”

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191025A0QBRL00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券