En estadística, el coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.

Definición

Para una población

El coeficiente de correlación de Pearson cuando se aplica a una población típicamente se representa por la letra griega ρ {\displaystyle \rho } (rho) y se refiere a ella coeficiente de correlación poblacional o el coeficiente de correlación poblacional de Pearson.

Dado un par de variables aleatorias ( X , Y ) {\displaystyle (X,Y)} , el coeficiente de correlación poblacional de Pearson (también denotado por ρ X , Y {\displaystyle \rho _{X,Y}} ) se define como

ρ X , Y = σ X Y σ X σ Y = Cov ( X , Y ) Var ( X ) Var ( Y ) {\displaystyle \rho _{X,Y}={\sigma _{XY} \over \sigma _{X}\sigma _{Y}}={\frac {\operatorname {Cov} (X,Y)}{\sqrt {\operatorname {Var} (X)\operatorname {Var} (Y)}}}}

donde

  • σ X Y {\displaystyle \sigma _{XY}} es la covarianza de ( X , Y ) {\displaystyle (X,Y)}
  • σ X {\displaystyle \sigma _{X}} es la desviación estándar de la variable X {\displaystyle X}
  • σ Y {\displaystyle \sigma _{Y}} es la desviación estándar de la variable Y {\displaystyle Y}

Para una muestra

El coeficiente de correlación de Pearson cuando es aplicado a una muestra, se suele denotar por r x y {\displaystyle r_{xy}} y se refiere a este como el coeficiente de correlación muestral o el coeficiente de correlación muestral de Pearson. Dados n {\displaystyle n} pares de datos { ( x i , y i ) } i = 1 n {\displaystyle \{(x_{i},y_{i})\}_{i=1}^{n}} , se define el coeficiente de correlación muestral de Pearson como

r x y = i = 1 n ( x i x ¯ ) ( y i y ¯ ) i = 1 n ( x i x ¯ ) 2 i = 1 n ( y i y ¯ ) 2 {\displaystyle r_{xy}={\frac {\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)\left(y_{i}-{\bar {y}}\right)}{{\sqrt {\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}}{\sqrt {\sum _{i=1}^{n}\left(y_{i}-{\bar {y}}\right)^{2}}}}}}

donde

  • n {\displaystyle n} es el tamaño de la muestra.
  • x i , y i {\displaystyle x_{i},y_{i}} son puntos muestrales individuales indexados con i {\displaystyle i} .
  • x ¯ {\displaystyle {\bar {x}}} denota la media muestral definida por x ¯ = 1 n i = 1 n x i {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}} (análogamente para y ¯ {\displaystyle {\bar {y}}} ).

El coeficiente de correlación muestral también puede ser escrito como

r x y = n x i y i x i y i n x i 2 ( x i ) 2   n y i 2 ( y i ) 2 . {\displaystyle r_{xy}={\frac {n\sum x_{i}y_{i}-\sum x_{i}\sum y_{i}}{{\sqrt {n\sum x_{i}^{2}-(\sum x_{i})^{2}}}~{\sqrt {n\sum y_{i}^{2}-(\sum y_{i})^{2}}}}}.}

Interpretación

El valor del índice de correlación varía en el intervalo [ 1 , 1 ] {\displaystyle [-1,1]} , indicando el signo el sentido de la relación:

  • Si r = 1 {\displaystyle r=1} , existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
  • Si 0 < r < 1 {\displaystyle 0 entonces existe una correlación positiva.
  • Si r = 0 {\displaystyle r=0} entonces no existe relación lineal pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
  • Si 1 < r < 0 {\displaystyle -1 , existe una correlación negativa.
  • Si r = 1 {\displaystyle r=-1} , existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación opuesta: cuando una de ellas aumenta, la otra cambia su signo en proporción constante.

Véase también

  • Covarianza
  • Correlación
  • Coeficiente de determinación
  • Regresión
  • Coeficiente de correlación de Spearman

Enlaces externos

  • Correlación de Pearson en el Departamento de Psicología de la Universidad de Oviedo.
  • Weisstein, Eric W. «Correlation Coefficient». En Weisstein, Eric W, ed. MathWorld (en inglés). Wolfram Research. 

Coeficiente de Correlación de Pearson PDF

Coeficiente de correlación de Pearson Probabilidad y Estadística

Coeficiente de correlación de Pearson Probabilidad y Estadística

Calculo Del Coeficiente Correlacion De Pearson R Youtube My XXX Hot Girl

Coeficiente de Correlación de PEARSON PDF Covarianza Matemáticas