样本相关系数R计算器

作者: Neo Huang 审查者: Nancy Deng
最后更新: 2024-10-03 17:45:42 使用次数: 2227 标签:

欢迎加入官方 QQ 用户交流群,群号: 960855308

有任何问题或者新的计算器添加都可以提出,我们负责免费修正和实现提高你的工作效率。

单位转换器 ▲

单位转换器 ▼

From: To:
Powered by @Calculator Ultra

Find More Calculator

样本相关系数 (R) 是一种统计量度,用于确定两个变量之间线性关系的强度和方向。其取值范围为 -1 到 1,其中 -1 表示完全负相关,1 表示完全正相关,0 表示不相关。

历史背景

相关性的概念最早由弗朗西斯·高尔顿爵士在 19 世纪后期提出。他试图测量不同变量之间的关系,最终导致他的学生卡尔·皮尔逊发展出相关系数。皮尔逊积差相关系数如今广泛用作“样本相关系数”。

计算公式

两组数据 \(X\) 和 \(Y\) 之间的样本相关系数 (R) 使用以下公式计算:

\[ R = \frac{n\sum{XY} - \sum{X}\sum{Y}}{\sqrt{\left(n\sum{X^2} - (\sum{X})^2\right) \left(n\sum{Y^2} - (\sum{Y})^2\right)}} \]

其中:

  • \(n\) 是数据点的数量。
  • \(\sum{X}\) 和 \(\sum{Y}\) 分别是 \(X\) 和 \(Y\) 值的和。
  • \(\sum{XY}\) 是对应 \(X\) 和 \(Y\) 值乘积的和。
  • \(\sum{X^2}\) 和 \(\sum{Y^2}\) 分别是 \(X\) 和 \(Y\) 值平方的和。

示例计算

考虑两个数据集:

  • \(X = [1, 2, 3, 4]\)
  • \(Y = [2, 4, 6, 8]\)

逐步计算:

  1. \(\sum{X} = 1 + 2 + 3 + 4 = 10\)
  2. \(\sum{Y} = 2 + 4 + 6 + 8 = 20\)
  3. \(\sum{XY} = (1 \times 2) + (2 \times 4) + (3 \times 6) + (4 \times 8) = 60\)
  4. \(\sum{X^2} = 1^2 + 2^2 + 3^2 + 4^2 = 30\)
  5. \(\sum{Y^2} = 2^2 + 4^2 + 6^2 + 8^2 = 120\)
  6. 应用公式:

\[ R = \frac{4(60) - (10)(20)}{\sqrt{(4(30) - (10)^2) \cdot (4(120) - (20)^2)}} = 1 \]

这表明完全正相关。

重要性和应用场景

  • 数据分析: 它通常用于测量金融、生物学和社会科学等领域中不同变量之间的关系。
  • 预测建模: 在预测分析中,相关性有助于评估哪些变量可能对其他变量具有预测能力。
  • 实验研究: 帮助科学家确定受控实验中变量之间关系的强度。

常问问题

  1. R 的良好取值是多少? 接近 1 或 -1 的值表示强相关,而接近 0 的值表示弱相关或不相关。

  2. R 能大于 1 或小于 -1 吗? 不能,R 始终介于 -1 和 1 之间。

  3. 高度相关是否意味着因果关系? 不,相关性并不意味着因果关系。它仅表明两个变量一起变化。

推荐