【卡方计算公式和例题】卡方检验(Chi-square test)是一种常用的统计方法,用于判断两个分类变量之间是否存在显著的关联性。它常用于分析列联表中的数据,适用于计数资料。本文将总结卡方检验的基本公式,并通过一个实际例题进行演示。
一、卡方检验的基本公式
卡方统计量(χ²)的计算公式为:
$$
\chi^2 = \sum \frac{(O - E)^2}{E}
$$
其中:
- $ O $ 表示观察频数(Observed frequency)
- $ E $ 表示期望频数(Expected frequency)
期望频数的计算公式为:
$$
E = \frac{(\text{行合计}) \times (\text{列合计})}{\text{总样本数}}
$$
二、卡方检验步骤
1. 建立假设
- H₀:两个变量之间无关联
- H₁:两个变量之间存在关联
2. 构建列联表
将数据整理成一个表格,列出各组的观察频数。
3. 计算期望频数
根据行与列的合计数,计算每个单元格的期望频数。
4. 计算卡方值
使用上述公式计算卡方统计量。
5. 确定自由度和临界值
自由度(df)= (行数 - 1) × (列数 - 1)
根据自由度和显著性水平(如α=0.05),查卡方分布表确定临界值。
6. 做出统计结论
若计算出的卡方值大于临界值,则拒绝H₀;否则不拒绝H₀。
三、例题分析
题目:某医院对两种治疗方案(A和B)的效果进行研究,结果如下表所示。试判断治疗方案与疗效是否有关联。
| 治疗方案 | 有效 | 无效 | 合计 |
| A | 30 | 20 | 50 |
| B | 25 | 25 | 50 |
| 合计 | 55 | 45 | 100 |
步骤1:计算期望频数
- 对于A方案有效:$ E = \frac{50 \times 55}{100} = 27.5 $
- 对于A方案无效:$ E = \frac{50 \times 45}{100} = 22.5 $
- 对于B方案有效:$ E = \frac{50 \times 55}{100} = 27.5 $
- 对于B方案无效:$ E = \frac{50 \times 45}{100} = 22.5 $
步骤2:计算卡方值
| 单元格 | 观察值 $ O $ | 期望值 $ E $ | $ (O-E)^2/E $ |
| A有效 | 30 | 27.5 | 0.227 |
| A无效 | 20 | 22.5 | 0.278 |
| B有效 | 25 | 27.5 | 0.227 |
| B无效 | 25 | 22.5 | 0.278 |
| 总计 | 1.01 |
因此,卡方值 $ \chi^2 = 1.01 $
步骤3:判断是否显著
- 自由度 $ df = (2-1)(2-1) = 1 $
- 查卡方分布表,α=0.05时,临界值为3.841
- 因为 $ 1.01 < 3.841 $,所以不拒绝H₀
四、结论
根据卡方检验结果,治疗方案与疗效之间没有显著关联(P > 0.05)。因此,可以认为两种治疗方案在疗效上无明显差异。
五、总结表格
| 项目 | 内容说明 |
| 卡方公式 | $ \chi^2 = \sum \frac{(O - E)^2}{E} $ |
| 期望频数公式 | $ E = \frac{\text{行合计} \times \text{列合计}}{\text{总样本数}} $ |
| 例题结果 | 卡方值为1.01,小于临界值3.841,不拒绝原假设 |
| 结论 | 治疗方案与疗效无显著关联 |
以上内容为原创总结,结合了理论知识与实际应用,便于理解与记忆。
以上就是【卡方计算公式和例题】相关内容,希望对您有所帮助。


