置信区间(Confidence Interval, CI):置信区间是指由样本统计量所构造的,以一定的置信度包含未知总体参数的区间。95% CI意味着我们有95%的信心认为总体参数落在这个区间内。
Kappa系数(Cohen's Kappa):Kappa系数是一种衡量两个评估者之间一致性的统计量,用于评估分类变量的一致性。Kappa系数的取值范围是[-1, 1],其中1表示完全一致,0表示随机一致,-1表示完全不一致。
解决方法:
import numpy as np
from scipy.stats import t
# 示例数据
data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
n = len(data)
alpha = 0.05
# 计算95% CI
mean = np.mean(data)
std = np.std(data, ddof=1)
t_value = t.ppf(1 - alpha/2, n-1)
ci_lower = mean - t_value * (std / np.sqrt(n))
ci_upper = mean + t_value * (std / np.sqrt(n))
print(f"95% CI: [{ci_lower}, {ci_upper}]")
# 示例混淆矩阵
observed = np.array([[10, 2], [3, 15]]) # a, b, c, d
N = np.sum(observed)
# 计算Kappa系数
Po = (observed[0, 0] + observed[1, 1]) / N
Pe = ((observed[0, 0] + observed[0, 1]) * (observed[0, 0] + observed[1, 0]) +
(observed[1, 0] + observed[1, 1]) * (observed[0, 1] + observed[1, 1])) / N**2
kappa = (Po - Pe) / (1 - Pe)
print(f"Kappa系数: {kappa}")
通过上述方法和示例代码,可以有效地计算95% CI的准确性和Kappa系数。
领取专属 10元无门槛券
手把手带您无忧上云