fbpx
Wikipedia

Modelo lineal generalizado

En estadística, el modelo lineal generalizado (GLM) es una generalización flexible de la regresión lineal ordinaria que permite variables de respuesta que tienen modelos de distribución de errores distintos de una distribución normal. El GLM generaliza la regresión lineal al permitir que el modelo lineal esté relacionado con la variable de respuesta a través de una función de enlace y al permitir que la magnitud de la varianza de cada medición sea una función de su valor predicho.

John Nelder y Robert Wedderburn formularon modelos lineales generalizados como una forma de unificar otros modelos estadísticos, como la regresión lineal, la regresión logística y la regresión de Poisson. Propusieron un método de mínimos cuadrados iterativamente ponderados para la estimación de máxima verosimilitud de los parámetros del modelo. La estimación de máxima verosimilitud sigue siendo popular y es el método predeterminado en muchos paquetes de computación estadística. Se han desarrollado otros enfoques, incluidos los enfoques bayesianos y los ajustes de mínimos cuadrados a las respuestas estabilizadas de la varianza.

Intuición

La regresión lineal ordinaria predice el valor esperado de una cantidad desconocida dada (la variable de respuesta, una variable aleatoria) como una combinación lineal de un conjunto de valores observados (predictores). Esto implica que un cambio constante en un predictor conduce a un cambio constante en la variable de respuesta (es decir, un modelo de respuesta lineal). Esto es apropiado cuando la variable de respuesta tiene una distribución normal (intuitivamente, cuando una variable de respuesta puede variar esencialmente de modo indefinido en cualquier dirección sin un "valor cero" fijo o, más generalmente, para cualquier cantidad que solo varía en una cantidad relativamente pequeña comparada con la variación en las variables predictivas, por ejemplo, la altura humana).

Sin embargo, estos supuestos son inapropiados para algunos tipos de variables de respuesta. Por ejemplo, en los casos en que se espera que la variable de respuesta sea siempre positiva y varíe en un amplio rango, los cambios constantes de entrada conducen a cambios en los resultados o salidas que presentan variaciones geométricas (es decir, exponenciales) en lugar de variaciones constantes. Como ejemplo, supóngase que un modelo de predicción aprende a partir de ciertos datos (posiblemente recogidos de grandes playas) que una disminución de 10 grados en la temperatura lleva a una disminución de 1000 personas que visitan la playa. Es poco probable que este modelo se pueda generalizar bien a playas de diferentes tamaños. Más específicamente, el problema es que si se utiliza este modelo para predecir la asistencia que habrá con una disminución de la temperatura de 10 grados en una playa que normalmente recibe 50 personas, se pronosticará una asistencia con el imposible valor de -950 personas. De manera lógica, un modelo más realista debería pronosticar una tasa constante de incremento de la asistencia a la playa (en que, por ejemplo, un incremento de 10 grados provoca una duplicación de la cantidad de visitantes, y una disminución de 10 grados lleva a una reducción a la mitad de la asistencia). Dicho modelo se denomina modelo de respuesta exponencial (o modelo log-lineal, ya que lo que se predice es que el logaritmo de la respuesta variará linealmente).

De manera similar, un modelo que pronostique la probabilidad de elegir entre sí/no (una variable de Bernoulli) es incluso menos apropiado en tanto modelo de respuesta lineal, ya que las probabilidades están limitadas en ambos extremos (deben estar entre 0 y 1). Hay que imaginar, por ejemplo, un modelo que pronostique la probabilidad de que una persona determinada vaya a la playa en función de la temperatura. Un modelo razonable podría predecir, por ejemplo, que un cambio en 10 grados hace que una persona tenga el doble de probabilidades de ir o no ir a la playa. Pero, ¿qué significa "el doble" en términos de probabilidad? No puede significar literalmente duplicar el valor de probabilidad (por ejemplo, 50% se convierte en 100%, 75% se convierte en 150%, etc.). Más bien, es la razón de oportunidades la que se duplica: de una razón de oportunidades 2:1, a una razón de oportunidades 4:1, a una razón de oportunidades 8: 1, etc. Tal modelo es un log-odds o un modelo logístico.

Los modelos lineales generalizados cubren todas estas situaciones al permitir variables de respuesta que tienen distribuciones arbitrarias (en lugar de tener simplemente distribuciones normales), y que una función arbitraria de la variable de respuesta (la función de enlace) varíe linealmente con los valores predichos. Por ejemplo, en el caso anterior, el número pronosticado de asistentes a la playa se modelaría corrientemente con una distribución de Poisson y una función de enlace log, mientras que el caso de la probabilidad pronosticada de asistencia a la playa se modelaría habitualmente con una distribución de Bernoulli (o distribución binomial, dependiendo exactamente de cómo se expresa el problema) y una función de enlace log-odds (o logit).

Introducción

En un modelo lineal generalizado (GLM), se supone que cada resultado Y de las variables dependientes se genera a partir de una distribución particular en la familia exponencial, una clase numerosa de distribuciones de probabilidad que incluye las distribuciones normal, binomial, Poisson y gamma, entre otras. La media, μ, de la distribución depende de las variables independientes, X, por medio de:


 

donde

  es el valor esperado de  ;
  es el «predictor lineal», una combinación lineal de parámetros desconocidos  ;
  es la función de enlace.

Con esta notación, la varianza es típicamente una función   de la media:

 

Es conveniente si V sigue la distribución de la familia exponencial, pero puede ser simplemente que la varianza sea una función del valor predicho.

Los parámetros desconocidos, β, se suelen calcular con técnicas de máxima verosimilitud, máxima cuasiverosimilitud o bayesianas.

Componentes del modelo

El MLG consiste de tres elementos:

  1. Una función de distribución  , perteneciente a la familia exponencial.
  2. Un predictor lineal  .
  3. Una función de enlace   tal que  .

Distribución de probabilidad

La familia exponencial de distribuciones sobredispersa es una generalización de la familia exponencial y el modelo de dispersión exponencial de distribuciones e incluye esas distribuciones de probabilidad, parametrizadas por     y Ƭ, cuyas funciones de densidad   (o función de masa de probabilidad, para el caso de una distribución discreta) se pueden expresar en la forma

 

El parámetro de dispersión,   , generalmente se conoce y generalmente está relacionado con la varianza de la distribución. Las funciones  ,  ,  .   y   son conocidas. Muchas distribuciones comunes están en esta familia, incluyendo binomial, multinomial y binomial normal, exponencial, gamma, Poisson, Bernoulli y (para un número fijo de ensayos).

Para el escalar Y y  , esto se reduce a:

 

Θ está relacionado con la media de la distribución. Si   es la función de identidad, se dice que la distribución está en forma canónica (o forma natural). Tenga en cuenta que cualquier distribución se puede convertir a una forma canónica reescribiendo   como   y luego aplicar la transformación  . Siempre es posible convertir   en términos de la nueva parametrización, incluso si   no es una función de uno a uno. Si, además,   es la identidad y   se conoce, entonces   se llama el parámetro canónico (o parámetro natural) y está relacionado con la media a través de

μ = E(Y) = ΔA(θ)

Para el escalar Y y θ, esto se reduce a

μ = E(Y) = A’(θ)

Bajo este escenario, la varianza de la distribución puede mostrarse como

Var(Y) = Δ2 A(θ)d(Ƭ).

Para el escalar Y y θ, esto se reduce a

Var(Y) = A’’(θ)d(Ƭ).

Predictor lineal

El predictor lineal es la cantidad que incorpora la información sobre las variables independientes en el modelo. El símbolo η ("eta" griego) denota un predictor lineal. Está relacionado con el valor esperado de los datos a través de la función de enlace.

η se expresa como combinaciones lineales (por lo tanto, "lineales") de parámetros desconocidos β. Los coeficientes de la combinación lineal se representan como la matriz de las variables independientes X. Por lo tanto, η puede expresarse como

η=Xβ.

Función de enlace

La función de enlace proporciona la relación entre el predictor lineal y la media de la función de distribución. Existen muchas funciones de enlace de uso común, y su elección se basa en varias consideraciones. Siempre hay una función de enlace canónico bien definida que se deriva del exponencial de la función de densidad de la respuesta. Sin embargo, en algunos casos tiene sentido tratar de hacer coincidir el dominio de la función de enlace con el rango de la media de la función de distribución, o usar una función de enlace no canónica con fines algorítmicos, por ejemplo, regresión probit Bayesiana.


Cuando se utiliza una función de distribución con un parámetro canónico θ, la función de enlace canónico es la función que expresa θ en términos de μ, es decir, θ = b(μ). Para las distribuciones más comunes, la media μ es uno de los parámetros en la forma estándar de la función de densidad de la distribución, y luego b(μ) es la función como se definió anteriormente que mapea la función de densidad en su forma canónica. Cuando se utiliza la función de enlace canónico, b(μ) = θ = Xβ que permite que XTY sea una estadística suficiente para β.

Prueba

Máxima verosimilitud

Las estimaciones de máxima verosimilitud se pueden encontrar usando un algoritmo de mínimos cuadrados iterativamente ponderados o un método de Newton-Raphson con actualizaciones de la forma:

Β(t+1) = β(t) + J-1(t))u(t)),

Donde J(β(t)) es la matriz de información observada (el negativo de la matriz de Hesse) y u(β(t)) es la función de puntuación; o un método de puntuación de Fisher:

Β(t+1) = β(t)  + I-1(t))u(t)),

Donde I(t)) es la matriz de información de Fisher. Tenga en cuenta que si se utiliza la función de enlace canónico, entonces son iguales.

Métodos bayesianos

En general, la distribución posterior no se puede encontrar en forma cerrada y, por lo tanto, debe ser aproximada, generalmente utilizando aproximaciones de Laplace o algún tipo de método de Monte Carlo de cadena de Markov como el muestreo de Gibbs.

Ejemplos

Modelos lineales generales

Un posible punto de confusión tiene que ver con la distinción entre modelos lineales generalizados y el modelo lineal general, dos modelos estadísticos amplios. El modelo lineal general puede verse como un caso especial del modelo lineal generalizado con enlace de identidad y respuestas normalmente distribuidas. Como los resultados de interés más exactos se obtienen solo para el modelo lineal general, el modelo lineal general ha experimentado un desarrollo histórico algo más largo. Los resultados para el modelo lineal generalizado con enlace de no identidad son asintóticos (tienden a funcionar bien con muestras grandes).

Regresión lineal

Un ejemplo simple y muy importante de un modelo lineal generalizado (también un ejemplo de un modelo lineal general) es la regresión lineal. En la regresión lineal, el uso del estimador de mínimos cuadrados se justifica por el teorema de Gauss-Markov, que no supone que la distribución sea normal.

Sin embargo, desde la perspectiva de los modelos lineales generalizados, es útil suponer que la función de distribución es la distribución normal con varianza constante y la función de enlace es la identidad, que es el enlace canónico si se conoce la varianza.

Para la distribución normal, el modelo lineal generalizado tiene una expresión de forma cerrada para las estimaciones de máxima verosimilitud, lo que es conveniente. La mayoría de los otros GLM carecen de estimaciones de forma cerrada.

Datos binarios

Cuando los datos de respuesta,  , son binarios (que toman solo los valores 0 y 1), la función de distribución generalmente se elige para ser la distribución de Bernoulli y la interpretación de   es la probabilidad,  , de que   tome el valor uno.

Hay varias funciones de enlace populares para funciones binomiales.

Función de enlace logit

La función de enlace más típica es el enlace logit canónico:

 

Los GLM con esta configuración son modelos de regresión logística (o modelos logit).

Función de enlace Probit como opción popular de la función de distribución acumulativa inversa

Alternativamente, el inverso de cualquier función de distribución acumulativa continua (CDF) se puede usar para el enlace, ya que el rango del CDF es [0,1], el rango de la media binomial. El CDF normal φ es una opción popular y produce el modelo probit. Su enlace es

 

La razón para el uso del modelo probit es que una escala constante de la variable de entrada a un CDF normal (que se puede absorber a través de la escala equivalente de todos los parámetros) produce una función que es prácticamente idéntica a la función logit, pero probit Los modelos son más manejables en algunas situaciones que los modelos logit. (En un entorno bayesiano en el que las distribuciones anteriores normalmente distribuidas se colocan en los parámetros, la relación entre los anteriores normales y la función de enlace CDF normal significa que un modelo probit puede calcularse utilizando el muestreo de Gibbs, mientras que un modelo logit generalmente no puede).

Log-log complementario (cloglog)

La función complementaria log-log también se puede utilizar:

 

Esta función de enlace es asimétrica y con frecuencia producirá resultados diferentes de las funciones de enlace logit y probit. El modelo de cloglog corresponde a aplicaciones en las que observamos cero eventos (por ejemplo, defectos) o uno o más, donde se supone que el número de eventos sigue la distribución de Poisson. El supuesto de Poisson significa que

 

donde μ es un número positivo que denota el inverso del número esperado de eventos. Si p representa la proporción de observaciones con al menos un evento, su complemento

 

y entonces

 

Un modelo lineal requiere que la variable de respuesta tome valores sobre toda la línea real. Dado que μ debe ser positivo, podemos imponer eso tomando el logaritmo y dejando que log (μ) sea un modelo lineal. Esto produce la transformación "cloglog".

 

Enlace de identidad

El enlace de identidad g (p) = p también se usa a veces para que los datos binomiales produzcan un modelo de probabilidad lineal. Sin embargo, el enlace de identidad puede predecir "probabilidades" sin sentido menores que cero o mayores que uno. Esto se puede evitar utilizando una transformación como cloglog, probit o logit (o cualquier función de distribución acumulativa inversa). Un mérito principal del enlace de identidad es que se puede estimar utilizando matemáticas lineales, y otras funciones de enlace estándar son aproximadamente lineales que coinciden con el enlace de identidad cerca de p = 0.5.

Función de varianza

La función de variación para datos "cuasibinomiales" es:

 

donde el parámetro de dispersión τ es exactamente 1 para la distribución binomial. De hecho, la probabilidad binomial estándar omite τ. Cuando está presente, el modelo se denomina "cuasibinomial" y la probabilidad modificada se denomina cuasi probabilidad, ya que generalmente no es la probabilidad correspondiente a ninguna distribución de probabilidad real. Si τ excede de 1, se dice que el modelo exhibe una sobredispersión.

Extensiones

Datos correlacionados o agrupados

El GLM estándar asume que las observaciones no están correlacionadas. Se han desarrollado extensiones para permitir la correlación entre las observaciones, como ocurre, por ejemplo, en estudios longitudinales y diseños agrupados:

Las ecuaciones de estimación generalizadas (GEE) permiten la correlación entre las observaciones sin el uso de un modelo de probabilidad explícito para el origen de las correlaciones, por lo que no existe una probabilidad explícita. Son adecuados cuando los efectos aleatorios y sus variaciones no son de interés inherente, ya que permiten la correlación sin explicar su origen. El enfoque se centra en estimar la respuesta promedio sobre la población (efectos "promediados por la población") en lugar de los parámetros de regresión que permitirían predecir el efecto de cambiar uno o más componentes de X en un individuo determinado. Los GEE se utilizan generalmente junto con los errores estándar de Huber-White.


Los modelos mixtos lineales generalizados (GLMM) son una extensión de los GLM que incluyen efectos aleatorios en el predictor lineal, lo que proporciona un modelo de probabilidad explícito que explica el origen de las correlaciones. Las estimaciones de los parámetros "específicos del sujeto" resultantes son adecuadas cuando se enfoca en estimar el efecto de cambiar uno o más componentes de X en un individuo determinado. Los GLMM también se conocen como modelos multinivel y como modelo mixto. En general, el ajuste de los GLMM es más complejo e intensivo computacionalmente que el ajuste de los GEE.

Modelos aditivos generalizados.

Los modelos aditivos generalizados (GAM) son otra extensión de los GLM en los que el predictor lineal η no está restringido a ser lineal en las covariables X, sino que es la suma de las funciones de suavizado aplicadas a la  :

 

Las funciones de suavizado   se estiman a partir de los datos. En general, esto requiere un gran número de puntos de datos y es computacionalmente intensivo.

Confusión con modelos lineales generales

El término "modelo lineal generalizado", y especialmente su abreviatura GLM, a veces se confunde con el término "modelo lineal general". El co-originador John Nelder ha expresado su pesar por esta terminología.

Véase también

    • Comparison of general and generalized linear models
    • Generalized linear array model
    • Tweedie distributions
    • GLIM (software)
    • Natural exponential familyVector gen
    • Veralized linear model (VGLM)
    • Quasi-variance

Referencias


  •   Datos: Q1501882

modelo, lineal, generalizado, estadística, modelo, lineal, generalizado, generalización, flexible, regresión, lineal, ordinaria, permite, variables, respuesta, tienen, modelos, distribución, errores, distintos, distribución, normal, generaliza, regresión, line. En estadistica el modelo lineal generalizado GLM es una generalizacion flexible de la regresion lineal ordinaria que permite variables de respuesta que tienen modelos de distribucion de errores distintos de una distribucion normal El GLM generaliza la regresion lineal al permitir que el modelo lineal este relacionado con la variable de respuesta a traves de una funcion de enlace y al permitir que la magnitud de la varianza de cada medicion sea una funcion de su valor predicho John Nelder y Robert Wedderburn formularon modelos lineales generalizados como una forma de unificar otros modelos estadisticos como la regresion lineal la regresion logistica y la regresion de Poisson Propusieron un metodo de minimos cuadrados iterativamente ponderados para la estimacion de maxima verosimilitud de los parametros del modelo La estimacion de maxima verosimilitud sigue siendo popular y es el metodo predeterminado en muchos paquetes de computacion estadistica Se han desarrollado otros enfoques incluidos los enfoques bayesianos y los ajustes de minimos cuadrados a las respuestas estabilizadas de la varianza Indice 1 Intuicion 2 Introduccion 3 Componentes del modelo 3 1 Distribucion de probabilidad 3 2 Predictor lineal 3 3 Funcion de enlace 4 Prueba 4 1 Maxima verosimilitud 4 2 Metodos bayesianos 5 Ejemplos 5 1 Modelos lineales generales 5 2 Regresion lineal 5 3 Datos binarios 5 3 1 Funcion de enlace logit 5 3 2 Log log complementario cloglog 5 4 Enlace de identidad 5 5 Funcion de varianza 6 Extensiones 6 1 Datos correlacionados o agrupados 6 2 Modelos aditivos generalizados 7 Confusion con modelos lineales generales 8 Vease tambien 8 1 ReferenciasIntuicion EditarLa regresion lineal ordinaria predice el valor esperado de una cantidad desconocida dada la variable de respuesta una variable aleatoria como una combinacion lineal de un conjunto de valores observados predictores Esto implica que un cambio constante en un predictor conduce a un cambio constante en la variable de respuesta es decir un modelo de respuesta lineal Esto es apropiado cuando la variable de respuesta tiene una distribucion normal intuitivamente cuando una variable de respuesta puede variar esencialmente de modo indefinido en cualquier direccion sin un valor cero fijo o mas generalmente para cualquier cantidad que solo varia en una cantidad relativamente pequena comparada con la variacion en las variables predictivas por ejemplo la altura humana Sin embargo estos supuestos son inapropiados para algunos tipos de variables de respuesta Por ejemplo en los casos en que se espera que la variable de respuesta sea siempre positiva y varie en un amplio rango los cambios constantes de entrada conducen a cambios en los resultados o salidas que presentan variaciones geometricas es decir exponenciales en lugar de variaciones constantes Como ejemplo supongase que un modelo de prediccion aprende a partir de ciertos datos posiblemente recogidos de grandes playas que una disminucion de 10 grados en la temperatura lleva a una disminucion de 1000 personas que visitan la playa Es poco probable que este modelo se pueda generalizar bien a playas de diferentes tamanos Mas especificamente el problema es que si se utiliza este modelo para predecir la asistencia que habra con una disminucion de la temperatura de 10 grados en una playa que normalmente recibe 50 personas se pronosticara una asistencia con el imposible valor de 950 personas De manera logica un modelo mas realista deberia pronosticar una tasa constante de incremento de la asistencia a la playa en que por ejemplo un incremento de 10 grados provoca una duplicacion de la cantidad de visitantes y una disminucion de 10 grados lleva a una reduccion a la mitad de la asistencia Dicho modelo se denomina modelo de respuesta exponencial o modelo log lineal ya que lo que se predice es que el logaritmo de la respuesta variara linealmente De manera similar un modelo que pronostique la probabilidad de elegir entre si no una variable de Bernoulli es incluso menos apropiado en tanto modelo de respuesta lineal ya que las probabilidades estan limitadas en ambos extremos deben estar entre 0 y 1 Hay que imaginar por ejemplo un modelo que pronostique la probabilidad de que una persona determinada vaya a la playa en funcion de la temperatura Un modelo razonable podria predecir por ejemplo que un cambio en 10 grados hace que una persona tenga el doble de probabilidades de ir o no ir a la playa Pero que significa el doble en terminos de probabilidad No puede significar literalmente duplicar el valor de probabilidad por ejemplo 50 se convierte en 100 75 se convierte en 150 etc Mas bien es la razon de oportunidades la que se duplica de una razon de oportunidades 2 1 a una razon de oportunidades 4 1 a una razon de oportunidades 8 1 etc Tal modelo es un log odds o un modelo logistico Los modelos lineales generalizados cubren todas estas situaciones al permitir variables de respuesta que tienen distribuciones arbitrarias en lugar de tener simplemente distribuciones normales y que una funcion arbitraria de la variable de respuesta la funcion de enlace varie linealmente con los valores predichos Por ejemplo en el caso anterior el numero pronosticado de asistentes a la playa se modelaria corrientemente con una distribucion de Poisson y una funcion de enlace log mientras que el caso de la probabilidad pronosticada de asistencia a la playa se modelaria habitualmente con una distribucion de Bernoulli o distribucion binomial dependiendo exactamente de como se expresa el problema y una funcion de enlace log odds o logit Introduccion EditarEn un modelo lineal generalizado GLM se supone que cada resultado Y de las variables dependientes se genera a partir de una distribucion particular en la familia exponencial una clase numerosa de distribuciones de probabilidad que incluye las distribuciones normal binomial Poisson y gamma entre otras La media m de la distribucion depende de las variables independientes X por medio de E Y m g 1 X b displaystyle mathbb E mathbf Y boldsymbol mu g 1 mathbf X boldsymbol beta donde E Y displaystyle mathbb E mathbf Y es el valor esperado de Y displaystyle mathbf Y X b displaystyle mathbf X beta es el predictor lineal una combinacion lineal de parametros desconocidos b displaystyle mathbf beta g displaystyle g es la funcion de enlace Con esta notacion la varianza es tipicamente una funcion V displaystyle mathbf V de la media Var Y V m V g 1 X b displaystyle operatorname Var mathbf Y operatorname V boldsymbol mu operatorname V g 1 mathbf X boldsymbol beta Es conveniente si V sigue la distribucion de la familia exponencial pero puede ser simplemente que la varianza sea una funcion del valor predicho Los parametros desconocidos b se suelen calcular con tecnicas de maxima verosimilitud maxima cuasiverosimilitud o bayesianas Componentes del modelo EditarEl MLG consiste de tres elementos Una funcion de distribucion f displaystyle f perteneciente a la familia exponencial Un predictor lineal h X b displaystyle eta mathbf X beta Una funcion de enlace g displaystyle g tal que E Y m g 1 h displaystyle mathbb E mathbf Y mathbf mu g 1 eta Distribucion de probabilidad Editar La familia exponencial de distribuciones sobredispersa es una generalizacion de la familia exponencial y el modelo de dispersion exponencial de distribuciones e incluye esas distribuciones de probabilidad parametrizadas por 8 displaystyle mathbf theta y Ƭ cuyas funciones de densidad f displaystyle f o funcion de masa de probabilidad para el caso de una distribucion discreta se pueden expresar en la formaf Y y 8 t h y t exp b 8 T T y A 8 d t displaystyle f Y y mid theta tau h y tau exp left frac b theta T T y A theta d tau right El parametro de dispersion T displaystyle T generalmente se conoce y generalmente esta relacionado con la varianza de la distribucion Las funciones h y t displaystyle h y tau b 8 displaystyle b theta T y displaystyle T y A 8 displaystyle A theta y d t displaystyle d tau son conocidas Muchas distribuciones comunes estan en esta familia incluyendo binomial multinomial y binomial normal exponencial gamma Poisson Bernoulli y para un numero fijo de ensayos Para el escalar Y y 8 displaystyle theta esto se reduce a f Y y 8 t h y t exp b 8 T y A 8 d t displaystyle f Y y mid theta tau h y tau exp left frac b theta T y A theta d tau right 8 esta relacionado con la media de la distribucion Si b 8 displaystyle b theta es la funcion de identidad se dice que la distribucion esta en forma canonica o forma natural Tenga en cuenta que cualquier distribucion se puede convertir a una forma canonica reescribiendo 8 displaystyle theta como 8 displaystyle theta y luego aplicar la transformacion 8 b 8 displaystyle theta b theta Siempre es posible convertir A 8 displaystyle A theta en terminos de la nueva parametrizacion incluso si b 8 displaystyle b theta no es una funcion de uno a uno Si ademas T y displaystyle T y es la identidad y t displaystyle tau se conoce entonces 8 displaystyle theta se llama el parametro canonico o parametro natural y esta relacionado con la media a traves dem E Y DA 8 Para el escalar Y y 8 esto se reduce am E Y A 8 Bajo este escenario la varianza de la distribucion puede mostrarse comoVar Y D2 A 8 d Ƭ Para el escalar Y y 8 esto se reduce aVar Y A 8 d Ƭ Predictor lineal Editar El predictor lineal es la cantidad que incorpora la informacion sobre las variables independientes en el modelo El simbolo h eta griego denota un predictor lineal Esta relacionado con el valor esperado de los datos a traves de la funcion de enlace h se expresa como combinaciones lineales por lo tanto lineales de parametros desconocidos b Los coeficientes de la combinacion lineal se representan como la matriz de las variables independientes X Por lo tanto h puede expresarse comoh Xb Funcion de enlace Editar La funcion de enlace proporciona la relacion entre el predictor lineal y la media de la funcion de distribucion Existen muchas funciones de enlace de uso comun y su eleccion se basa en varias consideraciones Siempre hay una funcion de enlace canonico bien definida que se deriva del exponencial de la funcion de densidad de la respuesta Sin embargo en algunos casos tiene sentido tratar de hacer coincidir el dominio de la funcion de enlace con el rango de la media de la funcion de distribucion o usar una funcion de enlace no canonica con fines algoritmicos por ejemplo regresion probit Bayesiana Cuando se utiliza una funcion de distribucion con un parametro canonico 8 la funcion de enlace canonico es la funcion que expresa 8 en terminos de m es decir 8 b m Para las distribuciones mas comunes la media m es uno de los parametros en la forma estandar de la funcion de densidad de la distribucion y luego b m es la funcion como se definio anteriormente que mapea la funcion de densidad en su forma canonica Cuando se utiliza la funcion de enlace canonico b m 8 Xb que permite que XTY sea una estadistica suficiente para b Prueba EditarMaxima verosimilitud Editar Las estimaciones de maxima verosimilitud se pueden encontrar usando un algoritmo de minimos cuadrados iterativamente ponderados o un metodo de Newton Raphson con actualizaciones de la forma B t 1 b t J 1 b t u b t Donde J b t es la matriz de informacion observada el negativo de la matriz de Hesse y u b t es la funcion de puntuacion o un metodo de puntuacion de Fisher B t 1 b t I 1 b t u b t Donde I b t es la matriz de informacion de Fisher Tenga en cuenta que si se utiliza la funcion de enlace canonico entonces son iguales Metodos bayesianos Editar En general la distribucion posterior no se puede encontrar en forma cerrada y por lo tanto debe ser aproximada generalmente utilizando aproximaciones de Laplace o algun tipo de metodo de Monte Carlo de cadena de Markov como el muestreo de Gibbs Ejemplos EditarModelos lineales generales Editar Un posible punto de confusion tiene que ver con la distincion entre modelos lineales generalizados y el modelo lineal general dos modelos estadisticos amplios El modelo lineal general puede verse como un caso especial del modelo lineal generalizado con enlace de identidad y respuestas normalmente distribuidas Como los resultados de interes mas exactos se obtienen solo para el modelo lineal general el modelo lineal general ha experimentado un desarrollo historico algo mas largo Los resultados para el modelo lineal generalizado con enlace de no identidad son asintoticos tienden a funcionar bien con muestras grandes Regresion lineal Editar Un ejemplo simple y muy importante de un modelo lineal generalizado tambien un ejemplo de un modelo lineal general es la regresion lineal En la regresion lineal el uso del estimador de minimos cuadrados se justifica por el teorema de Gauss Markov que no supone que la distribucion sea normal Sin embargo desde la perspectiva de los modelos lineales generalizados es util suponer que la funcion de distribucion es la distribucion normal con varianza constante y la funcion de enlace es la identidad que es el enlace canonico si se conoce la varianza Para la distribucion normal el modelo lineal generalizado tiene una expresion de forma cerrada para las estimaciones de maxima verosimilitud lo que es conveniente La mayoria de los otros GLM carecen de estimaciones de forma cerrada Datos binarios Editar Cuando los datos de respuesta Y displaystyle Y son binarios que toman solo los valores 0 y 1 la funcion de distribucion generalmente se elige para ser la distribucion de Bernoulli y la interpretacion de m i displaystyle mu i es la probabilidad p displaystyle p de que Y i displaystyle Y i tome el valor uno Hay varias funciones de enlace populares para funciones binomiales Funcion de enlace logit Editar La funcion de enlace mas tipica es el enlace logit canonico g p ln p 1 p displaystyle g p ln left frac p 1 p right Los GLM con esta configuracion son modelos de regresion logistica o modelos logit Funcion de enlace Probit como opcion popular de la funcion de distribucion acumulativa inversaAlternativamente el inverso de cualquier funcion de distribucion acumulativa continua CDF se puede usar para el enlace ya que el rango del CDF es 0 1 el rango de la media binomial El CDF normal f es una opcion popular y produce el modelo probit Su enlace esg p ϕ 1 p displaystyle g p phi 1 p La razon para el uso del modelo probit es que una escala constante de la variable de entrada a un CDF normal que se puede absorber a traves de la escala equivalente de todos los parametros produce una funcion que es practicamente identica a la funcion logit pero probit Los modelos son mas manejables en algunas situaciones que los modelos logit En un entorno bayesiano en el que las distribuciones anteriores normalmente distribuidas se colocan en los parametros la relacion entre los anteriores normales y la funcion de enlace CDF normal significa que un modelo probit puede calcularse utilizando el muestreo de Gibbs mientras que un modelo logit generalmente no puede Log log complementario cloglog Editar La funcion complementaria log log tambien se puede utilizar g p l o g l o g 1 p displaystyle g p log log 1 p Esta funcion de enlace es asimetrica y con frecuencia producira resultados diferentes de las funciones de enlace logit y probit El modelo de cloglog corresponde a aplicaciones en las que observamos cero eventos por ejemplo defectos o uno o mas donde se supone que el numero de eventos sigue la distribucion de Poisson El supuesto de Poisson significa queP r 0 e x p m displaystyle Pr 0 exp mu donde m es un numero positivo que denota el inverso del numero esperado de eventos Si p representa la proporcion de observaciones con al menos un evento su complemento 1 p P r 0 e x p m displaystyle 1 p Pr 0 exp mu y entonces log 1 p m displaystyle log 1 p mu Un modelo lineal requiere que la variable de respuesta tome valores sobre toda la linea real Dado que m debe ser positivo podemos imponer eso tomando el logaritmo y dejando que log m sea un modelo lineal Esto produce la transformacion cloglog l o g l o g 1 p l o g m displaystyle log log 1 p log mu Enlace de identidad Editar El enlace de identidad g p p tambien se usa a veces para que los datos binomiales produzcan un modelo de probabilidad lineal Sin embargo el enlace de identidad puede predecir probabilidades sin sentido menores que cero o mayores que uno Esto se puede evitar utilizando una transformacion como cloglog probit o logit o cualquier funcion de distribucion acumulativa inversa Un merito principal del enlace de identidad es que se puede estimar utilizando matematicas lineales y otras funciones de enlace estandar son aproximadamente lineales que coinciden con el enlace de identidad cerca de p 0 5 Funcion de varianza Editar La funcion de variacion para datos cuasibinomiales es V a r Y i t m 1 m i displaystyle Var Y i tau mu 1 mu i donde el parametro de dispersion t es exactamente 1 para la distribucion binomial De hecho la probabilidad binomial estandar omite t Cuando esta presente el modelo se denomina cuasibinomial y la probabilidad modificada se denomina cuasi probabilidad ya que generalmente no es la probabilidad correspondiente a ninguna distribucion de probabilidad real Si t excede de 1 se dice que el modelo exhibe una sobredispersion Extensiones EditarDatos correlacionados o agrupados Editar El GLM estandar asume que las observaciones no estan correlacionadas Se han desarrollado extensiones para permitir la correlacion entre las observaciones como ocurre por ejemplo en estudios longitudinales y disenos agrupados Las ecuaciones de estimacion generalizadas GEE permiten la correlacion entre las observaciones sin el uso de un modelo de probabilidad explicito para el origen de las correlaciones por lo que no existe una probabilidad explicita Son adecuados cuando los efectos aleatorios y sus variaciones no son de interes inherente ya que permiten la correlacion sin explicar su origen El enfoque se centra en estimar la respuesta promedio sobre la poblacion efectos promediados por la poblacion en lugar de los parametros de regresion que permitirian predecir el efecto de cambiar uno o mas componentes de X en un individuo determinado Los GEE se utilizan generalmente junto con los errores estandar de Huber White Los modelos mixtos lineales generalizados GLMM son una extension de los GLM que incluyen efectos aleatorios en el predictor lineal lo que proporciona un modelo de probabilidad explicito que explica el origen de las correlaciones Las estimaciones de los parametros especificos del sujeto resultantes son adecuadas cuando se enfoca en estimar el efecto de cambiar uno o mas componentes de X en un individuo determinado Los GLMM tambien se conocen como modelos multinivel y como modelo mixto En general el ajuste de los GLMM es mas complejo e intensivo computacionalmente que el ajuste de los GEE Modelos aditivos generalizados Editar Los modelos aditivos generalizados GAM son otra extension de los GLM en los que el predictor lineal h no esta restringido a ser lineal en las covariables X sino que es la suma de las funciones de suavizado aplicadas a la x i s displaystyle x i s h b 0 f 1 x 1 f 2 x 2 displaystyle eta beta 0 f 1 x 1 f 2 x 2 Las funciones de suavizado f i displaystyle f i se estiman a partir de los datos En general esto requiere un gran numero de puntos de datos y es computacionalmente intensivo Confusion con modelos lineales generales EditarEl termino modelo lineal generalizado y especialmente su abreviatura GLM a veces se confunde con el termino modelo lineal general El co originador John Nelder ha expresado su pesar por esta terminologia Vease tambien EditarComparison of general and generalized linear models Generalized linear array model Tweedie distributions GLIM software Natural exponential familyVector gen Veralized linear model VGLM Quasi varianceReferencias Editar Datos Q1501882 Obtenido de https es wikipedia org w index php title Modelo lineal generalizado amp oldid 142192364, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos