皮尔逊相关系数计算器

作者: Neo Huang 审查者: Nancy Deng
最后更新: 2024-06-30 01:13:41 使用次数: 4341 标签: Data Analysis Math Statistics

单位转换器 ▲

单位转换器 ▼

From: To:

计数:{{ this.valuesY.length }}

相关系数:{{ correlationResult }}

X 均值:{{ meanX }}

Y 均值:{{ meanY }}

X 方差: {{ stdDevX }}

Y 方差: {{ stdDevY }}

Powered by @Calculator Ultra

皮尔森相关系数 ( Pearson Correlation Coefficient ),又称皮尔森系数 ( Pearson's r ),是两个变量 X 和 Y 之间的线性相关性的度量,范围从 -1 到 1。该系数是一种关键的统计工具,用于各个领域来了解两个变量之间线性关系的强度和方向。

历史背景

皮尔森相关系数由卡尔·皮尔森 ( Karl Pearson ) 在 20 世纪初开发,作为其回归分析工作的一部分。其公式为相关性概念提供了数学基础,而该概念以前是基于散点图上的数据点的视觉观察。

计算公式

皮尔森相关系数采用以下公式计算:

\[ r = \frac{\sum (X - \mu_X)(Y - \mu_Y)}{\sqrt{\sum (X - \mu_X)^2 \sum (Y - \mu_Y)^2}} \]

其中:

  • \(X\) 和 \(Y\) 是这些变量。
  • \(\mu_X\) 和 \(\mu_Y\) 分别是 \(X\) 和 \(Y\) 的均值。

计算示例

给定:

  • X 的值:5、45、50、70、80
  • Y 的值:8、30、25、50、85

可以先计算这些值的均值、标准差和协方差,然后应用上述公式计算皮尔森相关系数。

重要性和使用场景

皮尔森相关系数广泛应用于科学和经济领域,用于衡量线性关系的强度、进行假设检验以及预测分析。它有助于了解一个变量的增加是否与另一个变量的增加(或减少)相关。

常见问题解答

  1. 皮尔森相关系数为 0 表示什么?

    • 系数为 0 表示变量之间没有线性关系。
  2. 皮尔森系数能用于非线性关系吗?

    • 不行,皮尔森系数仅测量线性相关性。对于非线性关系,应使用其他类型的相关系数。
  3. 异常值是否会影响皮尔森系数?

    • 是的,皮尔森系数可能会受到异常值极大影响,因为它依赖于数据集的均值和标准差。

推荐