fbpx
Wikipedia

Coeficiente de determinación

En estadística, el coeficiente de determinación, denominado y pronunciado R cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es predecir futuros resultados o probar una hipótesis. El coeficiente determina la calidad del modelo para replicar los resultados, y la proporción de variación de los resultados que puede explicarse por el modelo.[1]

Ajuste ordinario por mínimos cuadrados. Mientras puntos no disten mucho de la línea de la regresión, el coeficiente de determinación adoptará valores altos.

Hay varias definiciones diferentes para R² que son algunas veces equivalentes. Las más comunes se refieren a la regresión lineal. En este caso, el R² es simplemente el cuadrado del coeficiente de correlación de Pearson, lo cual es sólo cierto para la regresión lineal simple. Si existen varios resultados para una única variable, es decir, para una X existe una Y, Z... el coeficiente de determinación resulta del cuadrado del coeficiente de determinación múltiple. En ambos casos el R² adquiere valores entre 0 y 1. Existen casos dentro de la definición computacional de R² donde este valor puede tomar valores negativos.[2]

Cálculo

Caso general

Un modelo estadístico se construye para explicar una variable aleatoria, que llamaremos dependiente, a través de otras variables aleatorias a las que llamaremos factores. Dado que podemos predecir una variable aleatoria mediante su media y que, en este caso, el error cuadrático medio es su varianza, el máximo error cuadrático medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos primeros momentos es la varianza. Para estimar el modelo haremos varias observaciones de la variable a predecir y de los factores. A la diferencia entre el valor observado de la variable y el valor predicho la llamaremos residuo. La media cuadrática de los residuos es la varianza residual.

Si representamos por   la varianza de la variable dependiente y la varianza residual por  , el coeficiente de determinación viene dado por la siguiente ecuación:

 

Se mide en tantos por ciento. Si la varianza residual es cero, el modelo explica el 100% de valor de la variable; si coincide con la varianza de la variable dependiente, el modelo no explica nada y el coeficiente de determinación es del 0%. En variables económicas y financieras, suele ser difícil conseguir un coeficiente de determinación mayor de un 30%.

Para la regresión lineal

Para la regresión basta con hacer el cuadrado del coeficiente de correlación de Pearson.

 

Donde:

  •   es la covarianza de  
  •   es la Varianza de la variable  
  •   es la Varianza de la variable  

Modelo lineal

En un modelo lineal, la variable dependiente   se explica mediante la ecuación   . Si observamos   veces tanto la variable aleatoria como los factores, podemos ordenar nuestras observaciones de la variable dependiente en una matriz   mientras que colocaremos las de los factores en la matriz de regresión   . Cada observación corresponderá a una coordenada de   y a una fila de  . Cada columna de la matriz de regresión corresponde a las observaciones de un factor. En cada observación el modelo cometerá un error:

 

Estos errores se llaman residuos. La varianza residual es la varianza de estos residuos.

 

  es la parte de la variación de   explicada por el modelo lineal.

  es la parte de la variación de   que no explica el modelo lineal.

Sumando estas dos partes, obtenemos  .

El valor del coeficiente de determinación aumenta cuando se incluyen nuevas variables en el modelo, incluso cuando éstas son poco significativas o tienen poca correlación con la variable dependiente. El coeficiente de determinación corregido mide el porcentaje de variación de la variable dependiente (al igual que el coeficiente de determinación) pero tiene en cuenta además el número de variables incluidas en el modelo.

Véase también

Enlaces externos

  • Relación entre el Coeficiente de Determinación r Cuadrado (r²) y el Coeficiente de Correlación de Pearson (r)
  • Mail.com Coeficiente de determinación

Referencias

  1. Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill, 1960, pp. 187, 287.)
  2. Colin Cameron, A.; Windmeijer, Frank A.G.; Gramajo, H; Cane, DE; Khosla, C (1997). «An R-squared measure of goodness of fit for some common nonlinear regression models». Journal of Econometrics 77 (2): 1790-2. PMID 11230695. doi:10.1016/S0304-4076(96)01818-0. 
  •   Datos: Q192830
  •   Multimedia: Coefficient of determination

coeficiente, determinación, estadística, coeficiente, determinación, denominado, pronunciado, cuadrado, estadístico, usado, contexto, modelo, estadístico, cuyo, principal, propósito, predecir, futuros, resultados, probar, hipótesis, coeficiente, determina, cal. En estadistica el coeficiente de determinacion denominado R y pronunciado R cuadrado es un estadistico usado en el contexto de un modelo estadistico cuyo principal proposito es predecir futuros resultados o probar una hipotesis El coeficiente determina la calidad del modelo para replicar los resultados y la proporcion de variacion de los resultados que puede explicarse por el modelo 1 Ajuste ordinario por minimos cuadrados Mientras puntos no disten mucho de la linea de la regresion el coeficiente de determinacion adoptara valores altos Hay varias definiciones diferentes para R que son algunas veces equivalentes Las mas comunes se refieren a la regresion lineal En este caso el R es simplemente el cuadrado del coeficiente de correlacion de Pearson lo cual es solo cierto para la regresion lineal simple Si existen varios resultados para una unica variable es decir para una X existe una Y Z el coeficiente de determinacion resulta del cuadrado del coeficiente de determinacion multiple En ambos casos el R adquiere valores entre 0 y 1 Existen casos dentro de la definicion computacional de R donde este valor puede tomar valores negativos 2 Indice 1 Calculo 1 1 Caso general 1 2 Para la regresion lineal 2 Modelo lineal 3 Vease tambien 4 Enlaces externos 5 ReferenciasCalculo EditarCaso general Editar Un modelo estadistico se construye para explicar una variable aleatoria que llamaremos dependiente a traves de otras variables aleatorias a las que llamaremos factores Dado que podemos predecir una variable aleatoria mediante su media y que en este caso el error cuadratico medio es su varianza el maximo error cuadratico medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos primeros momentos es la varianza Para estimar el modelo haremos varias observaciones de la variable a predecir y de los factores A la diferencia entre el valor observado de la variable y el valor predicho la llamaremos residuo La media cuadratica de los residuos es la varianza residual Si representamos por s 2 displaystyle sigma 2 la varianza de la variable dependiente y la varianza residual por s r 2 displaystyle sigma r 2 el coeficiente de determinacion viene dado por la siguiente ecuacion r 2 1 s r 2 s 2 displaystyle rho 2 1 sigma r 2 over sigma 2 Se mide en tantos por ciento Si la varianza residual es cero el modelo explica el 100 de valor de la variable si coincide con la varianza de la variable dependiente el modelo no explica nada y el coeficiente de determinacion es del 0 En variables economicas y financieras suele ser dificil conseguir un coeficiente de determinacion mayor de un 30 Para la regresion lineal Editar Para la regresion basta con hacer el cuadrado del coeficiente de correlacion de Pearson R 2 s X Y 2 s X 2 s Y 2 displaystyle R 2 sigma XY 2 over sigma X 2 sigma Y 2 Donde s X Y displaystyle sigma XY es la covarianza de X Y displaystyle X Y s X 2 displaystyle sigma X 2 es la Varianza de la variable X displaystyle X s Y 2 displaystyle sigma Y 2 es la Varianza de la variable Y displaystyle Y Modelo lineal EditarEn un modelo lineal la variable dependiente y displaystyle y se explica mediante la ecuacion y j 1 n b j x j displaystyle y sum j 1 n beta j x j Si observamos m displaystyle m veces tanto la variable aleatoria como los factores podemos ordenar nuestras observaciones de la variable dependiente en una matriz y displaystyle mathbf y mientras que colocaremos las de los factores en la matriz de regresion X displaystyle mathbf X Cada observacion correspondera a una coordenada de y displaystyle mathbf y y a una fila de X displaystyle mathbf X Cada columna de la matriz de regresion corresponde a las observaciones de un factor En cada observacion el modelo cometera un error y i i 1 m b j x i j e i displaystyle y i sum i 1 m beta j x ij varepsilon i Estos errores se llaman residuos La varianza residual es la varianza de estos residuos s r 2 i 1 n e i 2 e e y X b y X b displaystyle sigma r 2 sum i 1 n varepsilon i 2 mathbf varepsilon mathbf varepsilon mathbf y mathbf X mathbf beta mathbf y mathbf X mathbf beta j 1 n b j x i j displaystyle sum j 1 n beta j x ij es la parte de la variacion de y i displaystyle y i explicada por el modelo lineal e i displaystyle varepsilon i es la parte de la variacion de y i displaystyle y i que no explica el modelo lineal Sumando estas dos partes obtenemos y i displaystyle y i El valor del coeficiente de determinacion aumenta cuando se incluyen nuevas variables en el modelo incluso cuando estas son poco significativas o tienen poca correlacion con la variable dependiente El coeficiente de determinacion corregido mide el porcentaje de variacion de la variable dependiente al igual que el coeficiente de determinacion pero tiene en cuenta ademas el numero de variables incluidas en el modelo Vease tambien EditarCovarianza Correlacion Coeficiente de correlacion de Pearson RegresionEnlaces externos EditarRelacion entre el Coeficiente de Determinacion r Cuadrado r y el Coeficiente de Correlacion de Pearson r Mail com Coeficiente de determinacionReferencias Editar Steel R G D and Torrie J H Principles and Procedures of Statistics with Special Reference to the Biological Sciences McGraw Hill 1960 pp 187 287 Colin Cameron A Windmeijer Frank A G Gramajo H Cane DE Khosla C 1997 An R squared measure of goodness of fit for some common nonlinear regression models Journal of Econometrics 77 2 1790 2 PMID 11230695 doi 10 1016 S0304 4076 96 01818 0 Datos Q192830 Multimedia Coefficient of determinationObtenido de https es wikipedia org w index php title Coeficiente de determinacion amp oldid 131073673, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos