使用全部数据进行计算,那么这种计算更类似于评估过程的PPK,PPK与计算CPK是不一样的,因为当数据以子组形式收集时,可以很容易地根据每个子组的范围或子组标准差来计算各个子组内的变异性。这是因为每个子组包含多个数据点,可以直接计算这些数据点的标准差或范围,以评估子组内的变异性,因此,CPK可以让你了解到过程的潜在能力。
PPK使用的是过程的总体标准差(表示长期数据的变异性),通常基于长期数据计算得出。CPK使用的是过程的样本标准差(表示短期数据的变异性),通常基于一段时间内的样本数据(子组)计算得出。
在没有子组的情况下(或者说子组大小为1),通常关注的是整个数据集内的变异性,而不是子组内的变异性。此时,可以通过计算整个数据集的标准差来评估过程的整体变异性。这种方法反映了所有数据点相对于整体平均值的波动程度,而不是在子组内部的变异性。
只要你明白以上的区别,明白你本身想计算的目的,能够清晰解读计算的结果,就可以透过这个结果进行决策。
在六西格玛项目中,相对于Ppk而言,我们更常用Cpk是因为Cpk主要用于衡量过程在一定时间段内的表现,假设过程已经处于统计控制状态,即过程是稳定的。Cpk评估的是过程的中心位置和分布与规格极限之间的关系,并且考虑了过程的自然波动。简而言之,Cpk反映了过程能力的当前状态,或者说是过程潜在的能力。