fbpx
Wikipedia

Regresión logística multinomial

En estadística, la regresión logística multinomial generaliza el método de regresión logística para problemas multiclase, es decir, con más de dos posibles resultados discretos.[1]​ Es decir, se trata de un modelo que se utiliza para predecir las probabilidades de los diferentes resultados posibles de una distribución categórica como variable dependiente, dado un conjunto de variables independientes (que pueden ser de valor real, valor binario, categórico-valorado, etc.)

La regresión logística multinomial se conoce por una variedad de otros nombres, incluyendo regresión multiclase LR, la regresión multinomial,[2]función SoftMax regression, Logit multinomial, clasificador de máxima entropía (MaxEnt), etc.[3]

Introducción

La regresión logística multinomial se utiliza cuando la variable dependiente en cuestión es nominal (equivalente categórica, lo que significa que puede incluirse en una de un conjunto de categorías que se excluyen) y para los cuales hay más de dos categorías. Algunos ejemplos serían:

  • ¿Qué tan importante será un estudiante de universidad, teniendo en cuenta sus calificaciones, sus gustos, etc.?
  • ¿Qué tipo de sangre tiene una persona, teniendo en cuenta los resultados de varias pruebas de diagnóstico?
  • En una aplicación de marcación del teléfono móvil de manos libres, que el nombre de persona se hablaba, dado diversas propiedades de la señal de voz?
  • ¿Qué candidato tendrá el voto de una persona, teniendo en cuenta determinadas características demográficas?
  • ¿En qué país se localizará una empresa, dadas las características de la empresa y de los distintos países candidatos?[4]

Estos son todos ejemplos de clasificación estadística. Todos ellos tienen en común una variable dependiente que se predijo que proviene de una de un conjunto limitado de artículos que no pueden ser ordenados de manera significativa, así como un conjunto de variables independientes (también conocidas como características), que se utilizan para predecir la variable dependiente. La regresión logit es una solución particular al problema de clasificación que asume que una combinación lineal de las características observadas y algunos parámetros específicos del problema puede ser utilizadas para determinar la probabilidad de cada resultado, en particular de la variable dependiente. Los mejores valores de los parámetros para un problema determinado se determinan a partir de algunos datos de entrenamiento (por ejemplo, algunas personas para quienes se conocen tanto los resultados de las pruebas de diagnóstico como los tipos de sangre o algunos ejemplos de palabras conocidas).

Supuestos

El modelo logístico multinomial supone que los datos son específicos del caso; Es decir, cada variable independiente tiene un valor único para cada caso. El modelo logístico multinomial también supone que la variable dependiente no puede ser perfectamente pronosticada a partir de las variables independientes para ningún caso. Al igual que con otros tipos de regresión, no es necesario que las variables independientes sean estadísticamente independientes entre sí (a diferencia, por ejemplo, en un clasificador ingenuo de Bayes); sin embargo, se supone que la colinealidad es relativamente baja, ya que resulta difícil diferenciar entre el impacto de varias variables si no es así.[5]

Si el logit multinomial se utiliza para modelar elecciones, se basa en el supuesto de independencia de alternativas irrelevantes (IIA), lo que no siempre es deseable. Este supuesto establece que las probabilidades de preferir una clase sobre otra no dependen de la presencia o ausencia de otras alternativas "irrelevantes". Por ejemplo, las probabilidades relativas de llevar un automóvil o un autobús al trabajo no cambian si se agrega una bicicleta como una posibilidad adicional. Esto permite que la elección de K alternativas se modele como un conjunto de opciones binarias independientes de K- 1, en la que una alternativa se elige como un "pivote" y la otra K-1 se compara con ella, una a la vez. La hipótesis IIA es una hipótesis central en la teoría de la elección racional; sin embargo, numerosos estudios en psicología muestran que los individuos a menudo violan esta suposición cuando toman decisiones. Un ejemplo de un caso de problema surge si las opciones incluyen un automóvil y un autobús azul. Supongamos que la proporción de probabilidades entre los dos es 1:1. Ahora, si se introduce la opción de un bus rojo, una persona puede ser indiferente entre un bus rojo y uno azul, y por lo tanto puede exhibir una relación de probabilidades coche: bus azul: bus rojo de 1:0.5:0.5, manteniendo así una proporción de 1:1 de automóvil: cualquier autobús mientras adopta una relación de automóvil: azul de 1:0.5. Aquí la opción del autobús rojo no era, de hecho, irrelevante, porque un autobús rojo era un sustituto perfecto para un autobús azul.

Si el logit multinomial se usa para modelar elecciones, en algunas situaciones puede imponer demasiadas restricciones en las preferencias relativas entre las diferentes alternativas. Es especialmente importante tener en cuenta este punto si el análisis pretende predecir cómo cambiarían las opciones si desapareciera una alternativa (por ejemplo, si un candidato político se retira de una carrera de tres candidatos). Se pueden usar otros modelos como el logit anidado o el probit multinomial en tales casos, ya que permiten la violación del IIA.[6]

Referencias

  1. Greene, William H., Econometric Analysis, fifth edition, Prentice Hall, 1993: 720-723.
  2. Friedman, Jerome; Hastie, Trevor; Tibshirani, Rob (2010). «Regularization paths for generalized linear models via coordinate descent». Journal of Statistical Software 33 (1). 
  3. . Sixth Conf. on Natural Language Learning (CoNLL). 2002. pp. 49-55. Archivado desde el original el 1 de noviembre de 2013. 
  4. Harrell, F. E. (2001). Regression modeling strategies: with applications to linear models, logistic regression, and survival analysis. Springer.
  5. Belsley, David (1991). Conditioning diagnostics : collinearity and weak data in regression. New York: Wiley. ISBN 9780471528890. 
  6. Baltas, G.; Doyle, P. (2001). «Random Utility Models in Marketing Research: A Survey». Journal of Business Research 51 (2): 115-125. doi:10.1016/S0148-2963(99)00058-2. 
  •   Datos: Q1650843

regresión, logística, multinomial, estadística, regresión, logística, multinomial, generaliza, método, regresión, logística, para, problemas, multiclase, decir, más, posibles, resultados, discretos, decir, trata, modelo, utiliza, para, predecir, probabilidades. En estadistica la regresion logistica multinomial generaliza el metodo de regresion logistica para problemas multiclase es decir con mas de dos posibles resultados discretos 1 Es decir se trata de un modelo que se utiliza para predecir las probabilidades de los diferentes resultados posibles de una distribucion categorica como variable dependiente dado un conjunto de variables independientes que pueden ser de valor real valor binario categorico valorado etc La regresion logistica multinomial se conoce por una variedad de otros nombres incluyendo regresion multiclase LR la regresion multinomial 2 funcion SoftMax regression Logit multinomial clasificador de maxima entropia MaxEnt etc 3 Introduccion EditarLa regresion logistica multinomial se utiliza cuando la variable dependiente en cuestion es nominal equivalente categorica lo que significa que puede incluirse en una de un conjunto de categorias que se excluyen y para los cuales hay mas de dos categorias Algunos ejemplos serian Que tan importante sera un estudiante de universidad teniendo en cuenta sus calificaciones sus gustos etc Que tipo de sangre tiene una persona teniendo en cuenta los resultados de varias pruebas de diagnostico En una aplicacion de marcacion del telefono movil de manos libres que el nombre de persona se hablaba dado diversas propiedades de la senal de voz Que candidato tendra el voto de una persona teniendo en cuenta determinadas caracteristicas demograficas En que pais se localizara una empresa dadas las caracteristicas de la empresa y de los distintos paises candidatos 4 Estos son todos ejemplos de clasificacion estadistica Todos ellos tienen en comun una variable dependiente que se predijo que proviene de una de un conjunto limitado de articulos que no pueden ser ordenados de manera significativa asi como un conjunto de variables independientes tambien conocidas como caracteristicas que se utilizan para predecir la variable dependiente La regresion logit es una solucion particular al problema de clasificacion que asume que una combinacion lineal de las caracteristicas observadas y algunos parametros especificos del problema puede ser utilizadas para determinar la probabilidad de cada resultado en particular de la variable dependiente Los mejores valores de los parametros para un problema determinado se determinan a partir de algunos datos de entrenamiento por ejemplo algunas personas para quienes se conocen tanto los resultados de las pruebas de diagnostico como los tipos de sangre o algunos ejemplos de palabras conocidas Supuestos EditarEl modelo logistico multinomial supone que los datos son especificos del caso Es decir cada variable independiente tiene un valor unico para cada caso El modelo logistico multinomial tambien supone que la variable dependiente no puede ser perfectamente pronosticada a partir de las variables independientes para ningun caso Al igual que con otros tipos de regresion no es necesario que las variables independientes sean estadisticamente independientes entre si a diferencia por ejemplo en un clasificador ingenuo de Bayes sin embargo se supone que la colinealidad es relativamente baja ya que resulta dificil diferenciar entre el impacto de varias variables si no es asi 5 Si el logit multinomial se utiliza para modelar elecciones se basa en el supuesto de independencia de alternativas irrelevantes IIA lo que no siempre es deseable Este supuesto establece que las probabilidades de preferir una clase sobre otra no dependen de la presencia o ausencia de otras alternativas irrelevantes Por ejemplo las probabilidades relativas de llevar un automovil o un autobus al trabajo no cambian si se agrega una bicicleta como una posibilidad adicional Esto permite que la eleccion de K alternativas se modele como un conjunto de opciones binarias independientes de K 1 en la que una alternativa se elige como un pivote y la otra K 1 se compara con ella una a la vez La hipotesis IIA es una hipotesis central en la teoria de la eleccion racional sin embargo numerosos estudios en psicologia muestran que los individuos a menudo violan esta suposicion cuando toman decisiones Un ejemplo de un caso de problema surge si las opciones incluyen un automovil y un autobus azul Supongamos que la proporcion de probabilidades entre los dos es 1 1 Ahora si se introduce la opcion de un bus rojo una persona puede ser indiferente entre un bus rojo y uno azul y por lo tanto puede exhibir una relacion de probabilidades coche bus azul bus rojo de 1 0 5 0 5 manteniendo asi una proporcion de 1 1 de automovil cualquier autobus mientras adopta una relacion de automovil azul de 1 0 5 Aqui la opcion del autobus rojo no era de hecho irrelevante porque un autobus rojo era un sustituto perfecto para un autobus azul Si el logit multinomial se usa para modelar elecciones en algunas situaciones puede imponer demasiadas restricciones en las preferencias relativas entre las diferentes alternativas Es especialmente importante tener en cuenta este punto si el analisis pretende predecir como cambiarian las opciones si desapareciera una alternativa por ejemplo si un candidato politico se retira de una carrera de tres candidatos Se pueden usar otros modelos como el logit anidado o el probit multinomial en tales casos ya que permiten la violacion del IIA 6 Referencias Editar Greene William H Econometric Analysis fifth edition Prentice Hall 1993 720 723 Friedman Jerome Hastie Trevor Tibshirani Rob 2010 Regularization paths for generalized linear models via coordinate descent Journal of Statistical Software 33 1 A comparison of algorithms for maximum entropy parameter estimation Sixth Conf on Natural Language Learning CoNLL 2002 pp 49 55 Archivado desde el original el 1 de noviembre de 2013 Harrell F E 2001 Regression modeling strategies with applications to linear models logistic regression and survival analysis Springer Belsley David 1991 Conditioning diagnostics collinearity and weak data in regression New York Wiley ISBN 9780471528890 Baltas G Doyle P 2001 Random Utility Models in Marketing Research A Survey Journal of Business Research 51 2 115 125 doi 10 1016 S0148 2963 99 00058 2 Datos Q1650843Obtenido de https es wikipedia org w index php title Regresion logistica multinomial amp oldid 134607720, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos