fbpx
Wikipedia

Desviación (medida de bondad de ajuste)

En estadística, la desviación (del inglés deviance) es un estadístico para comprobar la bondad de ajuste para un modelo estadístico mediante contrastes de hipótesis. Es especialmente usado en los modelos de dispersión exponencial y los modelos lineales generalizados, en los que el ajuste se realiza por máxima verosimilitud en vez de por mínimos cuadrados ordinarios.

Definición editar

Sea   un modelo lineal generalizado dado por  , con   las predicciones del modelo. La intención de la desviación es determinar la bondad de ajuste, es decir, cuán bien explica el modelo propuesto la distribución de las observaciones. La forma de hacerlo es comparándolo con el modelo saturado, aquel que tiene un parámetro para cada observación y por tanto ofrece el mejor ajuste posible a las observaciones, es decir,  .

Se plantéa la hipótesis   de que el modelo propuesto   explica tan bien las observaciones como el modelo saturado y para contrastarla se usa un estadístico de razón de verosimilitudes: si   es el supremo de la función de verosimilitud del modelo  , y   el supremo de la función de verosimimilitud para el modelo saturado, definimos

 

Se define entonces la desviación de   como

 

donde   y   son las log-likelihood.[1]

Distribución asintótica editar

Para algunos modelos lineales generalizados y bajo ciertas condiciones[2][3]​ el estadístico de desviación tiene distribución asintótica chi cuadrado   con grados de libertad la diferencia en el número de parámetros entre los dos modelos, que es   (el número de observaciones) para el saturado y  para  .

Esto se cumple, por ejemplo, para los modelos binomiales con datos agrupados  , donde   se toma como la proporción de éxitos en el grupo  , cuando los   son grandes y ninguna probabilidad estimada se acerca a 0 o 1, y para los modelos Poisson, cuando los valores estimados son razonablemente grandes, mayores que 2 o 3.

Comparación de modelos editar

A través de la desviación se pueden comparar dos modelos encajados   para ver si el modelo más general   con vector de parámetros   produce una mejora significativa en el ajuste respecto al modelo más restringido  . El modelo más simple (con menos parámetros) siempre tiene una desviación mayor, esto es así porque el espacio paramétrico de   está contenido en el de  ya que están engajados, de manera que para las verosimilitudes maximizadas  , y como   está presente en las dos por igual

 

Se puede considerar como estadístico de contraste la diferencia de desviaciones  , que bajo ciertas condiciones se distribuye asintóticamente como una  .

Referencias editar

  1. Agresti, Alan (2015). Foundations of linear and generalized linear models. ISBN 978-1-118-73030-0. OCLC 890971757. Consultado el 15 de junio de 2022. 
  2. «generalized linear model - Why does the glm residual deviance have a chi-squared asymptotic null distribution?». Cross Validated (en inglés). Consultado el 15 de junio de 2022. 
  3. Generalized Linear Models With Examples in R (en inglés). En la sección 7.5 Small Dispersion Asymptotics. doi:10.1007/978-1-4419-0118-7. Consultado el 15 de junio de 2022. 
  •   Datos: Q3706279

desviación, medida, bondad, ajuste, estadística, desviación, inglés, deviance, estadístico, para, comprobar, bondad, ajuste, para, modelo, estadístico, mediante, contrastes, hipótesis, especialmente, usado, modelos, dispersión, exponencial, modelos, lineales, . En estadistica la desviacion del ingles deviance es un estadistico para comprobar la bondad de ajuste para un modelo estadistico mediante contrastes de hipotesis Es especialmente usado en los modelos de dispersion exponencial y los modelos lineales generalizados en los que el ajuste se realiza por maxima verosimilitud en vez de por minimos cuadrados ordinarios Indice 1 Definicion 2 Distribucion asintotica 3 Comparacion de modelos 4 ReferenciasDefinicion editarSea M0 displaystyle M 0 nbsp un modelo lineal generalizado dado por g E y Xb0 displaystyle g mathbb E boldsymbol y boldsymbol X boldsymbol beta 0 nbsp con m 0 displaystyle boldsymbol hat mu 0 nbsp las predicciones del modelo La intencion de la desviacion es determinar la bondad de ajuste es decir cuan bien explica el modelo propuesto la distribucion de las observaciones La forma de hacerlo es comparandolo con el modelo saturado aquel que tiene un parametro para cada observacion y por tanto ofrece el mejor ajuste posible a las observaciones es decir m 0 y displaystyle boldsymbol hat mu 0 boldsymbol y nbsp Se plantea la hipotesis H0 displaystyle H 0 nbsp de que el modelo propuesto M0 displaystyle M 0 nbsp explica tan bien las observaciones como el modelo saturado y para contrastarla se usa un estadistico de razon de verosimilitudes si ℓ0 displaystyle ell 0 nbsp es el supremo de la funcion de verosimilitud del modelo M0 displaystyle M 0 nbsp y ℓsat displaystyle ell sat nbsp el supremo de la funcion de verosimimilitud para el modelo saturado definimosL ℓ0ℓsat displaystyle Lambda frac ell 0 ell sat nbsp Se define entonces la desviacion de M0 displaystyle M 0 nbsp comoD y m 0 2log L 2 Lsat L0 displaystyle D boldsymbol y boldsymbol hat mu 0 2 log Lambda 2 L sat L 0 nbsp donde Lsat log ℓsat displaystyle L sat log ell sat nbsp y L0 log ℓ0 displaystyle L 0 log ell 0 nbsp son las log likelihood 1 Distribucion asintotica editarPara algunos modelos lineales generalizados y bajo ciertas condiciones 2 3 el estadistico de desviacion tiene distribucion asintotica chi cuadrado xn p02 displaystyle chi n p 0 2 nbsp con grados de libertad la diferencia en el numero de parametros entre los dos modelos que es n displaystyle n nbsp el numero de observaciones para el saturado y p0 displaystyle p 0 nbsp para M0 displaystyle M 0 nbsp Esto se cumple por ejemplo para los modelos binomiales con datos agrupados niyi b ni pi displaystyle n i y i sim b n i pi i nbsp donde yi displaystyle y i nbsp se toma como la proporcion de exitos en el grupo i displaystyle i nbsp cuando los ni displaystyle n i nbsp son grandes y ninguna probabilidad estimada se acerca a 0 o 1 y para los modelos Poisson cuando los valores estimados son razonablemente grandes mayores que 2 o 3 Comparacion de modelos editarA traves de la desviacion se pueden comparar dos modelos encajados M0 M1 displaystyle M 0 subset M 1 nbsp para ver si el modelo mas general M1 displaystyle M 1 nbsp con vector de parametros b1 displaystyle boldsymbol beta 1 nbsp produce una mejora significativa en el ajuste respecto al modelo mas restringido M0 displaystyle M 0 nbsp El modelo mas simple con menos parametros siempre tiene una desviacion mayor esto es asi porque el espacio parametrico de M0 displaystyle M 0 nbsp esta contenido en el de M1 displaystyle M 1 nbsp ya que estan engajados de manera que para las verosimilitudes maximizadas ℓ0 ℓ1 displaystyle ell 0 leq ell 1 nbsp y como ℓsat displaystyle ell sat nbsp esta presente en las dos por igualD y m 1 D y m 0 displaystyle D boldsymbol y boldsymbol hat mu 1 leq D boldsymbol y boldsymbol hat mu 0 nbsp Se puede considerar como estadistico de contraste la diferencia de desviaciones T D y m 0 D y m 1 displaystyle T D boldsymbol y boldsymbol hat mu 0 D boldsymbol y boldsymbol hat mu 1 nbsp que bajo ciertas condiciones se distribuye asintoticamente como una xp1 p02 displaystyle chi p 1 p 0 2 nbsp Referencias editar Agresti Alan 2015 Foundations of linear and generalized linear models ISBN 978 1 118 73030 0 OCLC 890971757 Consultado el 15 de junio de 2022 generalized linear model Why does the glm residual deviance have a chi squared asymptotic null distribution Cross Validated en ingles Consultado el 15 de junio de 2022 Generalized Linear Models With Examples in R en ingles En la seccion 7 5 Small Dispersion Asymptotics doi 10 1007 978 1 4419 0118 7 Consultado el 15 de junio de 2022 nbsp Datos Q3706279 Obtenido de https es wikipedia org w index php title Desviacion medida de bondad de ajuste amp oldid 156561687, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos