【如何计算相关系数r】在统计学中,相关系数(r)是衡量两个变量之间线性关系强度和方向的一个重要指标。r的取值范围在-1到1之间,其中:
- r = 1 表示完全正相关;
- r = -1 表示完全负相关;
- r = 0 表示无线性相关。
本文将详细讲解如何计算相关系数r,并通过一个实例帮助理解。
一、相关系数r的计算公式
相关系数r的计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $ 是样本数量;
- $ x $ 和 $ y $ 分别是两个变量的观测值;
- $ \sum xy $ 是x与y对应乘积的总和;
- $ \sum x $ 和 $ \sum y $ 是x和y各自的总和;
- $ \sum x^2 $ 和 $ \sum y^2 $ 是x和y各自平方后的总和。
二、计算步骤
1. 收集数据:获取两个变量x和y的观测数据。
2. 计算各项总和:包括$ \sum x $、$ \sum y $、$ \sum xy $、$ \sum x^2 $、$ \sum y^2 $。
3. 代入公式:将上述结果代入相关系数公式进行计算。
4. 解释结果:根据r的值判断变量之间的相关性。
三、示例计算
假设我们有以下两组数据:
| x | y |
| 1 | 2 |
| 2 | 4 |
| 3 | 6 |
| 4 | 8 |
步骤1:计算各项总和
| x | y | x² | y² | xy |
| 1 | 2 | 1 | 4 | 2 |
| 2 | 4 | 4 | 16 | 8 |
| 3 | 6 | 9 | 36 | 18 |
| 4 | 8 | 16 | 64 | 32 |
- $ \sum x = 1 + 2 + 3 + 4 = 10 $
- $ \sum y = 2 + 4 + 6 + 8 = 20 $
- $ \sum x^2 = 1 + 4 + 9 + 16 = 30 $
- $ \sum y^2 = 4 + 16 + 36 + 64 = 120 $
- $ \sum xy = 2 + 8 + 18 + 32 = 60 $
- $ n = 4 $
步骤2:代入公式
$$
r = \frac{4 \times 60 - (10 \times 20)}{\sqrt{[4 \times 30 - (10)^2][4 \times 120 - (20)^2]}}
$$
$$
r = \frac{240 - 200}{\sqrt{[120 - 100][480 - 400]}} = \frac{40}{\sqrt{20 \times 80}} = \frac{40}{\sqrt{1600}} = \frac{40}{40} = 1
$$
四、结果分析
通过计算得出,r = 1,说明x和y之间存在完全正相关关系,即随着x的增加,y也成比例增加。
五、总结表格
| 步骤 | 内容 |
| 1 | 收集两个变量的数据 |
| 2 | 计算 $ \sum x $、$ \sum y $、$ \sum x^2 $、$ \sum y^2 $、$ \sum xy $ |
| 3 | 代入公式 $ r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}} $ |
| 4 | 根据r的值判断相关性 |
| 5 | r = 1 表示完全正相关;r = -1 表示完全负相关;r = 0 表示无相关性 |
通过以上步骤,你可以准确地计算出两个变量之间的相关系数r,并据此分析它们之间的关系。


