fbpx
Wikipedia

Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

Ejemplos de diagramas de dispersión con diferentes valores del coeficiente de correlación

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.

Definición

Para una población

El coeficiente de correlación de Pearson cuando se aplica a una población típicamente se representa por la letra griega   (rho) y se refiere a ella coeficiente de correlación poblacional o el coeficiente de correlación poblacional de Pearson.

Dado un par de variables aleatorias  , el coeficiente de correlación poblacional de Pearson (también denotado por  ) se define como

 

donde

  •   es la covarianza de  
  •   es la desviación estándar de la variable  
  •   es la desviación estándar de la variable  

Para una muestra

El coeficiente de correlación de Pearson cuando es aplicado a una muestra, se suele denotar por   y se refiere a este como el coeficiente de correlación muestral o el coeficiente de correlación muestral de Pearson. Dados   pares de datos  , se define el coeficiente de correlación muestral de Pearson como

 

donde

  •   es el tamaño de la muestra.
  •   son puntos muestrales individuales indexados con  .
  •   denota la media muestral definida por   (análogamente para  ).

El coeficiente de correlación muestral también puede ser escrito como

 

Interpretación

 
Varios grupos de puntos  , con el coeficiente de correlación para cada grupo. Nótese que la correlación refleja la no linealidad y la dirección de la relación lineal. En la figura del centro, la varianza de y es nula, por lo que la correlación es indeterminada.

El valor del índice de correlación varía en el intervalo  , indicando el signo el sentido de la relación:

  • Si  , existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
  • Si   entonces existe una correlación positiva.
  • Si   entonces no existe relación lineal pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
  • Si  , existe una correlación negativa.
  • Si  , existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

Véase también

Enlaces externos

  •   Datos: Q1136628

coeficiente, correlación, pearson, estadística, coeficiente, correlación, pearson, medida, dependencia, lineal, entre, variables, aleatorias, cuantitativas, diferencia, covarianza, correlación, pearson, independiente, escala, medida, variables, ejemplos, diagr. En estadistica el coeficiente de correlacion de Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas A diferencia de la covarianza la correlacion de Pearson es independiente de la escala de medida de las variables Ejemplos de diagramas de dispersion con diferentes valores del coeficiente de correlacion r displaystyle rho De manera menos formal podemos definir el coeficiente de correlacion de Pearson como un indice que puede utilizarse para medir el grado de relacion de dos variables siempre y cuando ambas sean cuantitativas y continuas Indice 1 Definicion 1 1 Para una poblacion 1 2 Para una muestra 1 3 Interpretacion 2 Vease tambien 3 Enlaces externosDefinicion EditarPara una poblacion Editar El coeficiente de correlacion de Pearson cuando se aplica a una poblacion tipicamente se representa por la letra griega r displaystyle rho rho y se refiere a ella coeficiente de correlacion poblacional o el coeficiente de correlacion poblacional de Pearson Dado un par de variables aleatorias X Y displaystyle X Y el coeficiente de correlacion poblacional de Pearson tambien denotado por r X Y displaystyle rho X Y se define como r X Y s X Y s X s Y Cov X Y Var X Var Y displaystyle rho X Y sigma XY over sigma X sigma Y frac operatorname Cov X Y sqrt operatorname Var X operatorname Var Y donde s X Y displaystyle sigma XY es la covarianza de X Y displaystyle X Y s X displaystyle sigma X es la desviacion estandar de la variable X displaystyle X s Y displaystyle sigma Y es la desviacion estandar de la variable Y displaystyle Y Para una muestra Editar El coeficiente de correlacion de Pearson cuando es aplicado a una muestra se suele denotar por r x y displaystyle r xy y se refiere a este como el coeficiente de correlacion muestral o el coeficiente de correlacion muestral de Pearson Dados n displaystyle n pares de datos x i y i i 1 n displaystyle x i y i i 1 n se define el coeficiente de correlacion muestral de Pearson como r x y i 1 n x i x y i y i 1 n x i x 2 i 1 n y i y 2 displaystyle r xy frac sum i 1 n left x i bar x right left y i bar y right sqrt sum i 1 n left x i bar x right 2 sqrt sum i 1 n left y i bar y right 2 donde n displaystyle n es el tamano de la muestra x i y i displaystyle x i y i son puntos muestrales individuales indexados con i displaystyle i x displaystyle bar x denota la media muestral definida por x 1 n i 1 n x i displaystyle bar x frac 1 n sum i 1 n x i analogamente para y displaystyle bar y El coeficiente de correlacion muestral tambien puede ser escrito como r x y n x i y i x i y i n x i 2 x i 2 n y i 2 y i 2 displaystyle r xy frac n sum x i y i sum x i sum y i sqrt n sum x i 2 sum x i 2 sqrt n sum y i 2 sum y i 2 Interpretacion Editar Varios grupos de puntos x y displaystyle x y con el coeficiente de correlacion para cada grupo Notese que la correlacion refleja la no linealidad y la direccion de la relacion lineal En la figura del centro la varianza de y es nula por lo que la correlacion es indeterminada El valor del indice de correlacion varia en el intervalo 1 1 displaystyle 1 1 indicando el signo el sentido de la relacion Si r 1 displaystyle r 1 existe una correlacion positiva perfecta El indice indica una dependencia total entre las dos variables denominada relacion directa cuando una de ellas aumenta la otra tambien lo hace en proporcion constante Si 0 lt r lt 1 displaystyle 0 lt r lt 1 entonces existe una correlacion positiva Si r 0 displaystyle r 0 entonces no existe relacion lineal pero esto no necesariamente implica que las variables son independientes pueden existir todavia relaciones no lineales entre las dos variables Si 1 lt r lt 0 displaystyle 1 lt r lt 0 existe una correlacion negativa Si r 1 displaystyle r 1 existe una correlacion negativa perfecta El indice indica una dependencia total entre las dos variables llamada relacion inversa cuando una de ellas aumenta la otra disminuye en proporcion constante Vease tambien EditarCovarianza Correlacion Coeficiente de determinacion RegresionEnlaces externos EditarCorrelacion de Pearson en el Departamento de Psicologia de la Universidad de Oviedo Weisstein Eric W Correlation Coefficient En Weisstein Eric W ed MathWorld en ingles Wolfram Research Datos Q1136628 Obtenido de https es wikipedia org w index php title Coeficiente de correlacion de Pearson amp oldid 137289436, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos