fbpx
Wikipedia

Regresión logística

En estadística, la regresión logística es un tipo de análisis de regresión utilizado para predecir el resultado de una variable categórica (una variable que puede adoptar un número limitado de categorías) en función de las variables independientes o predictoras. Es útil para modelar la probabilidad de un evento ocurriendo en función de otros factores. El análisis de regresión logística se enmarca en el conjunto de Modelos Lineales Generalizados (GLM por sus siglas en inglés) que usa como función de enlace la función logit. Las probabilidades que describen el posible resultado de un único ensayo se modelan como una función de variables explicativas, utilizando una función logística.

La regresión logística es usada extensamente en las ciencias médicas y sociales. Otros nombres para regresión logística usados en varias áreas de aplicación incluyen modelo logístico, modelo logit, y clasificador de máxima entropía.

Introducción

La regresión logística analiza datos distribuidos binomialmente de la forma

 

donde los números de ensayos Bernoulli   son conocidos y las probabilidades de éxito   son desconocidas. Un ejemplo de esta distribución es el porcentaje de semillas ( ) que germinan después de que   son plantadas.

El modelo es entonces obtenido a base de lo que cada ensayo (valor de  ) y el conjunto de variables explicativas/independientes puedan informar acerca de la probabilidad final. Estas variables explicativas pueden pensarse como un vector    -dimensional y el modelo toma entonces la forma

 

Los logits de las probabilidades binomiales desconocidas (i.e., los logaritmos de la razón de momios) son modeladas como una función lineal de los  .

 

Note que un elemento particular de   puede ser ajustado a 1 para todo   obteniéndose una constante independiente en el modelo. Los parámetros desconocidos   son usualmente estimados a través del método de máxima verosimilitud.

La interpretación de los estimados del parámetro   es como los efectos aditivos en el logaritmo de la razón de momios para una unidad de cambio en la jésima variable explicativa. En el caso de una variable explicativa dicotómica, por ejemplo género,   es la estimación de la razón de momios (odds ratio) de tener el resultado para, por decir algo, hombres comparados con mujeres. El modelo tiene una formulación equivalente dada por:

 

Esta forma funcional es comúnmente identificada como un "perceptrón" de una capa simple o red neuronal artificial de una sola capa. Una red neuronal de una sola capa calcula una salida continua en lugar de una función definida a trozos. La derivada de pi con respecto a X = x1...xk es calculada de la forma general:

 

donde   es una función analítica en X. Con esta elección, la red de capa simple es idéntica al modelo de regresión logística. Esta función tiene una derivada continua, la cual permite ser usada en propagación hacia atrás. Esta función también es preferida pues su derivada es fácilmente calculable:

 

Implementación práctica

 
Función logística con   en el eje horizontal y   en el eje vertical.

La regresión logística unidimensional puede usarse para tratar de correlacionar la probabilidad de una variable cualitativa binaria (asumiremos que puede tomar los valores reales "0" y "1") con una variable escalar x. La idea es que la regresión logística aproxime la probabilidad de obtener "0" (no ocurre cierto suceso) o "1" (ocurre el suceso) con el valor de la variable explicativa x. En esas condiciones, la probabilidad aproximada del suceso se aproximará mediante una función logística del tipo:[1]

 

que puede reducirse al cálculo de una regresión lineal para la función logit de la probabilidad:

 

o una regresión exponencial:

 

El gráfico de la función logística se muestra en la figura que encabeza esta sección, la variable independiente es la combinación lineal   y la variable dependiente es la probabilidad estimada  . Si se realiza la regresión lineal, la forma de la probabilidad estimada puede ser fácilmente recuperada a partir de los coeficientes calculados:[1]

Para hacer la regresión deben tomarse los valores   de las observaciones ordenados de mayor a menor y formar la siguiente tabla:

Valores
ordenados
Valor de
categoría
Probabilidad
estimada
Logit
X1 ε1 π(X1) g(X1)
X2 ε2 π(X2) g(X2)
... ... ... ...
Xn εn π(Xn) g(Xn)

Donde εi es "0" o "1" según el caso y además:

 

En el cálculo de g pueden aparecer problemas al principio del intervalo si π(Xj) = 0 para algunos valores de  .

Ejemplo

Sea   la probabilidad de éxito cuando el valor de la variable predictora es   entonces sea

 

Después de algunas operaciones se prueba que

 

donde   son las posibilidades en favor de éxito.

Si tomamos un valor de ejemplo, digamos p(50) = 2/3, entonces

 

Cuando x = 50, un éxito es dos veces tan probable como una falla. Es decir, se puede decir simplemente que las chances (odds) son 2 a 1.

Extensiones

Algunas extensiones del modelo existen para tratar variables dependientes multicategóricas y/o ordinales, tales como la regresión politómica. La clasificación en varias clases por regresión logística es conocida como regresión logística multinomial. Una extensión del modelo logístico para ajustar conjuntos de variables independientes es el campo aleatorio condicional.

Véase también

Referencias

  1. Hosmer, David W.; Lemeshow, Stanley (2000). Applied Logistic Regression (2nd edición). Wiley. ISBN 0-471-35632-8. 

Bibliografía

Enlaces externos

  • Web-based logistic regression calculator
  • MALLET Java library, includes a trainer for logistic models
  •   Datos: Q1132755

regresión, logística, estadística, regresión, logística, tipo, análisis, regresión, utilizado, para, predecir, resultado, variable, categórica, variable, puede, adoptar, número, limitado, categorías, función, variables, independientes, predictoras, útil, para,. En estadistica la regresion logistica es un tipo de analisis de regresion utilizado para predecir el resultado de una variable categorica una variable que puede adoptar un numero limitado de categorias en funcion de las variables independientes o predictoras Es util para modelar la probabilidad de un evento ocurriendo en funcion de otros factores El analisis de regresion logistica se enmarca en el conjunto de Modelos Lineales Generalizados GLM por sus siglas en ingles que usa como funcion de enlace la funcion logit Las probabilidades que describen el posible resultado de un unico ensayo se modelan como una funcion de variables explicativas utilizando una funcion logistica La regresion logistica es usada extensamente en las ciencias medicas y sociales Otros nombres para regresion logistica usados en varias areas de aplicacion incluyen modelo logistico modelo logit y clasificador de maxima entropia Indice 1 Introduccion 2 Implementacion practica 3 Ejemplo 4 Extensiones 5 Vease tambien 6 Referencias 6 1 Bibliografia 6 2 Enlaces externosIntroduccion EditarLa regresion logistica analiza datos distribuidos binomialmente de la forma Y i B p i n i para i 1 m displaystyle Y i sim B p i n i text para i 1 dots m donde los numeros de ensayos Bernoulli n i displaystyle n i son conocidos y las probabilidades de exito p i displaystyle p i son desconocidas Un ejemplo de esta distribucion es el porcentaje de semillas p i displaystyle p i que germinan despues de que n i displaystyle n i son plantadas El modelo es entonces obtenido a base de lo que cada ensayo valor de i displaystyle i y el conjunto de variables explicativas independientes puedan informar acerca de la probabilidad final Estas variables explicativas pueden pensarse como un vector X i displaystyle X i k displaystyle k dimensional y el modelo toma entonces la forma p i E Y i n i X i displaystyle p i operatorname E left left frac Y i n i right X i right Los logits de las probabilidades binomiales desconocidas i e los logaritmos de la razon de momios son modeladas como una funcion lineal de los X i displaystyle X i logit p i ln p i 1 p i b 0 b 1 x 1 i b k x k i displaystyle operatorname logit p i ln left frac p i 1 p i right beta 0 beta 1 x 1 i cdots beta k x k i Note que un elemento particular de X i displaystyle X i puede ser ajustado a 1 para todo i displaystyle i obteniendose una constante independiente en el modelo Los parametros desconocidos b j displaystyle beta j son usualmente estimados a traves del metodo de maxima verosimilitud La interpretacion de los estimados del parametro b j displaystyle beta j es como los efectos aditivos en el logaritmo de la razon de momios para una unidad de cambio en la jesima variable explicativa En el caso de una variable explicativa dicotomica por ejemplo genero e b displaystyle e beta es la estimacion de la razon de momios odds ratio de tener el resultado para por decir algo hombres comparados con mujeres El modelo tiene una formulacion equivalente dada por p i 1 1 e b 0 b 1 x 1 i b k x k i displaystyle p i frac 1 1 e beta 0 beta 1 x 1 i cdots beta k x k i Esta forma funcional es comunmente identificada como un perceptron de una capa simple o red neuronal artificial de una sola capa Una red neuronal de una sola capa calcula una salida continua en lugar de una funcion definida a trozos La derivada de pi con respecto a X x1 xk es calculada de la forma general y 1 1 e f X displaystyle y frac 1 1 e f X donde f x displaystyle f x es una funcion analitica en X Con esta eleccion la red de capa simple es identica al modelo de regresion logistica Esta funcion tiene una derivada continua la cual permite ser usada en propagacion hacia atras Esta funcion tambien es preferida pues su derivada es facilmente calculable y y 1 y d f d X displaystyle y y 1 y frac mathrm d f mathrm d X Implementacion practica Editar Funcion logistica con b 0 b 1 x e displaystyle beta 0 beta 1 x e en el eje horizontal y p x displaystyle pi x en el eje vertical La regresion logistica unidimensional puede usarse para tratar de correlacionar la probabilidad de una variable cualitativa binaria asumiremos que puede tomar los valores reales 0 y 1 con una variable escalar x La idea es que la regresion logistica aproxime la probabilidad de obtener 0 no ocurre cierto suceso o 1 ocurre el suceso con el valor de la variable explicativa x En esas condiciones la probabilidad aproximada del suceso se aproximara mediante una funcion logistica del tipo 1 p x e b 0 b 1 x e b 0 b 1 x 1 1 e b 0 b 1 x 1 displaystyle pi x frac e beta 0 beta 1 x e beta 0 beta 1 x 1 frac 1 e beta 0 beta 1 x 1 que puede reducirse al calculo de una regresion lineal para la funcion logit de la probabilidad g x ln p x 1 p x b 0 b 1 x displaystyle g x ln frac pi x 1 pi x beta 0 beta 1 x o una regresion exponencial p x 1 p x e b 0 b 1 x displaystyle frac pi x 1 pi x e beta 0 beta 1 x El grafico de la funcion logistica se muestra en la figura que encabeza esta seccion la variable independiente es la combinacion lineal b 0 b 1 x displaystyle beta 0 beta 1 x y la variable dependiente es la probabilidad estimada p x displaystyle pi x Si se realiza la regresion lineal la forma de la probabilidad estimada puede ser facilmente recuperada a partir de los coeficientes calculados 1 Para hacer la regresion deben tomarse los valores X i displaystyle X i de las observaciones ordenados de mayor a menor y formar la siguiente tabla Valores ordenados Valor de categoria Probabilidad estimada LogitX1 e1 p X1 g X1 X2 e2 p X2 g X2 Xn en p Xn g Xn Donde ei es 0 o 1 segun el caso y ademas 0 p X i k 1 i e k i 1 g X i ln p X i 1 p X i b 0 b 1 X i displaystyle 0 leq pi X i cfrac sum k 1 i varepsilon k i leq 1 qquad g X i ln left frac pi X i 1 pi X i right beta 0 beta 1 X i En el calculo de g pueden aparecer problemas al principio del intervalo si p Xj 0 para algunos valores de j displaystyle j Ejemplo EditarSea p x displaystyle p x la probabilidad de exito cuando el valor de la variable predictora es x displaystyle x entonces sea p x 1 1 e b 0 b 1 x e b 0 b 1 x 1 e b 0 b 1 x displaystyle p x frac 1 1 e beta 0 beta 1 x frac e beta 0 beta 1 x 1 e beta 0 beta 1 x Despues de algunas operaciones se prueba que p x 1 p x e b 0 b 1 x displaystyle frac p x 1 p x e beta 0 beta 1 x donde p x 1 p x displaystyle frac p x 1 p x son las posibilidades en favor de exito Si tomamos un valor de ejemplo digamos p 50 2 3 entonces p 50 1 p 50 2 3 1 2 3 2 displaystyle frac p 50 1 p 50 frac frac 2 3 1 frac 2 3 2 Cuando x 50 un exito es dos veces tan probable como una falla Es decir se puede decir simplemente que las chances odds son 2 a 1 Extensiones EditarAlgunas extensiones del modelo existen para tratar variables dependientes multicategoricas y o ordinales tales como la regresion politomica La clasificacion en varias clases por regresion logistica es conocida como regresion logistica multinomial Una extension del modelo logistico para ajustar conjuntos de variables independientes es el campo aleatorio condicional Vease tambien EditarRed neuronal artificial Mineria de datos Modelos de regresion multiple postulados y no postulados Analisis discriminante lineal Perceptron Modelo probit Analisis de regla de variables Modelo de Jarrow TurnbullReferencias Editar a b Hosmer David W Lemeshow Stanley 2000 Applied Logistic Regression 2nd edicion Wiley ISBN 0 471 35632 8 Bibliografia Editar Agresti Alan 2002 Categorical Data Analysis New York Wiley Interscience ISBN 0 471 36093 7 Amemiya T 1985 Advanced Econometrics Harvard University Press ISBN 0 674 00560 0 Balakrishnan N 1991 Handbook of the Logistic Distribution Marcel Dekker Inc ISBN 978 0824785871 Green William H 2003 Econometric Analysis fifth edition Prentice Hall ISBN 0 13 066189 9 Hosmer David W Stanley Lemeshow 2000 Applied Logistic Regression 2nd ed New York Chichester Wiley ISBN 0 471 35632 8 Enlaces externos Editar Web based logistic regression calculator A highly optimized Maximum Entropy modeling package MALLET Java library includes a trainer for logistic models La Regresion Logistica Paginas de Bioestadistica de la Sociedad Espanola de Hipertension Arterial Datos Q1132755 Obtenido de https es wikipedia org w index php title Regresion logistica amp oldid 140628398, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos