fbpx
Wikipedia

Regresión a la media

En estadística, la regresión hacia la media es el fenómeno en el que si una variable es extrema en su primera medición, tenderá a estar más cerca de la media en su segunda medición y, paradójicamente, si es extrema en su segunda medición, tenderá a haber estado más cerca de la media en su primera.[1][2][3]​ Para evitar hacer inferencias equivocadas, la regresión hacia la media debe ser considerada en el diseño de experimentos científicos y la interpretación de los datos.[4]

Las condiciones bajo las que se produce la regresión hacia la media dependen de la forma en que el término se defina matemáticamente. Sir Francis Galton observó por primera vez el fenómeno en el contexto de una regresión lineal simple de puntos de datos. Sin embargo, un enfoque menos restrictivo es posible. La regresión hacia la media se puede definir para cualquier distribución bivariante con idénticas distribuciones marginales. Existen dos tipo de definiciones.[5]​ Una definición concuerda estrechamente con el uso común del término "regresión hacia la media". No todas esas distribuciones bivariadas muestran la regresión hacia la media en esta definición. Sin embargo, todas estas distribuciones de dos variables muestran regresión hacia la media bajo la otra definición.

Históricamente, lo que hoy se llama regresión hacia la media también se ha llamado la reversión a la media y la reversión a la mediocridad. En las finanzas, el término reversión a la media tiene un significado diferente. Jeremy Siegel lo utiliza para describir una series de tiempo financiera en la que "los retornos pueden ser muy inestables en el corto plazo, pero muy estables en el largo plazo." Más cuantitativamente, es aquella en la que la desviación estándar de los rendimientos anuales promedio disminuye más rápidamente que la inversa del periodo de mantenimiento, lo que implica que el proceso no es un paseo aleatorio, sino que los períodos de rendimientos más bajos se siguen sistemáticamente por períodos de mayor rentabilidad.[6]

Antecedentes conceptuales

Consideremos un ejemplo simple: un grupo de estudiantes realiza un examen de 100 preguntas verdadera/falsa sobre un tema. Supongamos que todos los estudiantes eligen al azar todas sus respuestas. Entonces, la puntuación de cada alumno sería una realización de un conjunto de variables aleatorias independientes e idénticamente distribuidas, con una media de 50. Naturalmente, algunos estudiantes calificarán sustancialmente por encima de 50 y algunos sustancialmente por debajo de 50 por casualidad. Si se toma solo a los estudiantes que han obtenido una puntuación en el 10% superior y se les da una segunda prueba en la que volvieran a elegir al azar en todas las preguntas, de nuevo se espera que la puntuación media esté cerca de 50. Así, la media de estos estudiantes sería "una regresión" a la media de todos los estudiantes que tomaron la prueba original. No importa lo que un estudiante obtiene en la prueba original, la mejor predicción de su puntuación en la segunda prueba es de 50.

Si no existiera la suerte o el hecho de adivinar al azar las respuestas proporcionadas por los estudiantes a las preguntas de la prueba, a continuación, todos los estudiantes se anotan el mismo en la segunda prueba, ya que anotó en la prueba original, y no habría ninguna regresión hacia la media.

La mayoría de las situaciones reales se sitúan entre estos dos extremos: por ejemplo, se podría considerar los resultados del examen como una combinación de habilidad y suerte. En este caso, el subgrupo de estudiantes con calificaciones por encima del promedio se compone de aquellos que fueron calificados y no tenía especial mala suerte, junto con los que estaban no calificados, pero eran extremadamente afortunados. En una nueva prueba de este subconjunto, los no calificados será poco probable que repetir su golpe de suerte, mientras que el experto no tendrá una segunda oportunidad de tener mala suerte. Por lo tanto, los que le fue bien con anterioridad no es probable que haga tan bien en la segunda prueba.

El siguiente es un ejemplo de este segundo tipo de regresión hacia la media. Una clase de estudiantes toma dos ediciones de la misma prueba en dos días sucesivos. Se ha observado con frecuencia que los peores resultados en el primer día tienden a mejorar sus puntuaciones en el segundo día, y los mejores intérpretes en el primer día tienden a hacer peor en el segundo día. El fenómeno se produce porque las calificaciones de los estudiantes están determinadas en parte por la capacidad subyacente y en parte por casualidad. Para la primera prueba, algunos tendrán suerte, y una puntuación mayor que su capacidad, y algunos tendrán mala suerte y puntuación menor que su capacidad. Algunos de los estudiantes afortunados en la primera prueba tendrán suerte otra vez en la segunda prueba, pero más de ellos tendrá un promedio menor o por debajo de las puntuaciones promedio. Por lo tanto, un estudiante que tuvo suerte en la primera prueba es más probable que tenga una puntuación peor en la segunda prueba que una mejor puntuación. De manera similar, los estudiantes que obtengan una puntuación menor que la media en la primera prueba tenderán a ver que sus puntuaciones aumentan en la segunda prueba.

Historia

El concepto de regresión proviene de la genética y fue popularizado por Sir Francis Galton a finales del siglo XIX con la publicación de Regression towards mediocrity in hereditary stature.[7]​ Galton observó que las características extremas (por ejemplo, la altura) de los padres no se transmiten por completo a su descendencia. Más bien, las características de la descendencia retroceden hacia un punto mediocre (un punto que desde entonces ha sido identificado como la media). Al medir las alturas de cientos de personas, fue capaz de cuantificar la regresión a la media, y estimar el tamaño del efecto. Galton escribió que "la regresión media de la descendencia es una fracción constante de sus respectivos mediados de los padres desviaciones". Esto significa que la diferencia entre un niño y sus padres para algunas características es proporcional a la desviación de sus padres de las personas típicas de la población. Si sus padres son dos pulgadas más altos que el promedio para los hombres y las mujeres, en promedio, será más corta que sus padres por algún factor (que, en la actualidad, llamaríamos uno menos el coeficiente de regresión) veces dos pulgadas. Para la altura, Galton estimó que este coeficiente era aproximadamente 2/3: la altura de un individuo medirá alrededor de un punto medio que es dos tercios de la desviación de los padres del promedio de la población.

Galton acuñó el término regresión para describir un hecho observable en la herencia de rasgos genéticos cuantitativos multifactoriales: a saber, que el descendiente de los padres que se encuentran en las colas de la distribución tiende a estar más cerca del centro, la media de la distribución. Él cuantificó esta tendencia, y al hacerlo inventó el análisis de regresión lineal, sentando así las bases para gran parte del modelado estadístico moderno. Desde entonces, el término "regresión" ha tomado una variedad de significados, y puede ser utilizado por los estadísticos modernos para describir fenómenos de sesgo de muestreo que tienen poco que ver con las observaciones originales de Galton en el campo de la genética.

La explicación de Galton para el fenómeno de regresión que observó se sabe ahora que es incorrecta. Él declaró: "Un niño hereda en parte de sus padres, en parte de sus antepasados. Hablando en general, cuanto más se remonta su genealogía, más numerosos y variados serán sus ancestros, hasta que dejen de diferir de cualquier muestra igualmente numerosa tomada al azar de la raza en general."[7]​. Esto es incorrecto, ya que un niño recibe su constitución genética exclusivamente de sus padres. No hay generación de saltos en el material genético: cualquier material genético de antepasados anteriores que los padres deben haber pasado a través de los padres, pero puede no haber sido expresado en ellos. El fenómeno se entiende mejor si asumimos que el rasgo heredado (por ejemplo, la altura) es controlado por un gran número de genes recesivos. Los individuos excepcionalmente altos deben ser homocigóticos para las mutaciones aumentadas de la altura en una porción grande de estos loci. Pero los loci que llevan estas mutaciones no son necesariamente compartidos entre dos individuos altos, y si estos individuos se aparean, su descendencia será en promedio homocigótica para mutaciones "altas" en menos loci que cualquiera de sus padres. Además, la altura no está totalmente determinada genéticamente, sino que también está sujeta a influencias ambientales durante el desarrollo, lo que hace que los hijos de padres excepcionales sean aún más propensos a estar más cerca del promedio que sus padres.

Referencias

  1. Everitt, B.S. (2002) The Cambridge Dictionary of Statistics, CUP. ISBN 0-521-81099-X
  2. Upton, G., Cook, I. (2006) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4
  3. Stigler, Stephen M (1997). «Regression toward the mean, historically considered». Statistical Methods in Medical Research 6 (2): 103-114. PMID 9261910. doi:10.1191/096228097676361431. 
  4. Chiolero, A; Paradis, G; Rich, B; Hanley, JA (2013). «Assessing the Relationship between the Baseline Value of a Continuous Variable and Subsequent Change Over Time.». Frontiers in Public Health 1: 29. PMC 3854983. PMID 24350198. doi:10.3389/fpubh.2013.00029. 
  5. Samuels (1991).
  6. "Jeremy Siegel" (2007). Stocks for the Long Run, 4th edition. McGraw–Hill. ISBN 978-0071494700. , p. 13, pp. 28–9
  7. Galton, F. (1886). «Regression towards mediocrity in hereditary stature». The Journal of the Anthropological Institute of Great Britain and Ireland 15: 246-263. JSTOR 2841583. doi:10.2307/2841583. 
  •   Datos: Q1135405
  •   Multimedia: Category:Regression toward the mean

regresión, media, estadística, regresión, hacia, media, fenómeno, variable, extrema, primera, medición, tenderá, estar, más, cerca, media, segunda, medición, paradójicamente, extrema, segunda, medición, tenderá, haber, estado, más, cerca, media, primera, para,. En estadistica la regresion hacia la media es el fenomeno en el que si una variable es extrema en su primera medicion tendera a estar mas cerca de la media en su segunda medicion y paradojicamente si es extrema en su segunda medicion tendera a haber estado mas cerca de la media en su primera 1 2 3 Para evitar hacer inferencias equivocadas la regresion hacia la media debe ser considerada en el diseno de experimentos cientificos y la interpretacion de los datos 4 Las condiciones bajo las que se produce la regresion hacia la media dependen de la forma en que el termino se defina matematicamente Sir Francis Galton observo por primera vez el fenomeno en el contexto de una regresion lineal simple de puntos de datos Sin embargo un enfoque menos restrictivo es posible La regresion hacia la media se puede definir para cualquier distribucion bivariante con identicas distribuciones marginales Existen dos tipo de definiciones 5 Una definicion concuerda estrechamente con el uso comun del termino regresion hacia la media No todas esas distribuciones bivariadas muestran la regresion hacia la media en esta definicion Sin embargo todas estas distribuciones de dos variables muestran regresion hacia la media bajo la otra definicion Historicamente lo que hoy se llama regresion hacia la media tambien se ha llamado la reversion a la media y la reversion a la mediocridad En las finanzas el termino reversion a la media tiene un significado diferente Jeremy Siegel lo utiliza para describir una series de tiempo financiera en la que los retornos pueden ser muy inestables en el corto plazo pero muy estables en el largo plazo Mas cuantitativamente es aquella en la que la desviacion estandar de los rendimientos anuales promedio disminuye mas rapidamente que la inversa del periodo de mantenimiento lo que implica que el proceso no es un paseo aleatorio sino que los periodos de rendimientos mas bajos se siguen sistematicamente por periodos de mayor rentabilidad 6 Antecedentes conceptuales EditarConsideremos un ejemplo simple un grupo de estudiantes realiza un examen de 100 preguntas verdadera falsa sobre un tema Supongamos que todos los estudiantes eligen al azar todas sus respuestas Entonces la puntuacion de cada alumno seria una realizacion de un conjunto de variables aleatorias independientes e identicamente distribuidas con una media de 50 Naturalmente algunos estudiantes calificaran sustancialmente por encima de 50 y algunos sustancialmente por debajo de 50 por casualidad Si se toma solo a los estudiantes que han obtenido una puntuacion en el 10 superior y se les da una segunda prueba en la que volvieran a elegir al azar en todas las preguntas de nuevo se espera que la puntuacion media este cerca de 50 Asi la media de estos estudiantes seria una regresion a la media de todos los estudiantes que tomaron la prueba original No importa lo que un estudiante obtiene en la prueba original la mejor prediccion de su puntuacion en la segunda prueba es de 50 Si no existiera la suerte o el hecho de adivinar al azar las respuestas proporcionadas por los estudiantes a las preguntas de la prueba a continuacion todos los estudiantes se anotan el mismo en la segunda prueba ya que anoto en la prueba original y no habria ninguna regresion hacia la media La mayoria de las situaciones reales se situan entre estos dos extremos por ejemplo se podria considerar los resultados del examen como una combinacion de habilidad y suerte En este caso el subgrupo de estudiantes con calificaciones por encima del promedio se compone de aquellos que fueron calificados y no tenia especial mala suerte junto con los que estaban no calificados pero eran extremadamente afortunados En una nueva prueba de este subconjunto los no calificados sera poco probable que repetir su golpe de suerte mientras que el experto no tendra una segunda oportunidad de tener mala suerte Por lo tanto los que le fue bien con anterioridad no es probable que haga tan bien en la segunda prueba El siguiente es un ejemplo de este segundo tipo de regresion hacia la media Una clase de estudiantes toma dos ediciones de la misma prueba en dos dias sucesivos Se ha observado con frecuencia que los peores resultados en el primer dia tienden a mejorar sus puntuaciones en el segundo dia y los mejores interpretes en el primer dia tienden a hacer peor en el segundo dia El fenomeno se produce porque las calificaciones de los estudiantes estan determinadas en parte por la capacidad subyacente y en parte por casualidad Para la primera prueba algunos tendran suerte y una puntuacion mayor que su capacidad y algunos tendran mala suerte y puntuacion menor que su capacidad Algunos de los estudiantes afortunados en la primera prueba tendran suerte otra vez en la segunda prueba pero mas de ellos tendra un promedio menor o por debajo de las puntuaciones promedio Por lo tanto un estudiante que tuvo suerte en la primera prueba es mas probable que tenga una puntuacion peor en la segunda prueba que una mejor puntuacion De manera similar los estudiantes que obtengan una puntuacion menor que la media en la primera prueba tenderan a ver que sus puntuaciones aumentan en la segunda prueba Historia EditarEl concepto de regresion proviene de la genetica y fue popularizado por Sir Francis Galton a finales del siglo XIX con la publicacion de Regression towards mediocrity in hereditary stature 7 Galton observo que las caracteristicas extremas por ejemplo la altura de los padres no se transmiten por completo a su descendencia Mas bien las caracteristicas de la descendencia retroceden hacia un punto mediocre un punto que desde entonces ha sido identificado como la media Al medir las alturas de cientos de personas fue capaz de cuantificar la regresion a la media y estimar el tamano del efecto Galton escribio que la regresion media de la descendencia es una fraccion constante de sus respectivos mediados de los padres desviaciones Esto significa que la diferencia entre un nino y sus padres para algunas caracteristicas es proporcional a la desviacion de sus padres de las personas tipicas de la poblacion Si sus padres son dos pulgadas mas altos que el promedio para los hombres y las mujeres en promedio sera mas corta que sus padres por algun factor que en la actualidad llamariamos uno menos el coeficiente de regresion veces dos pulgadas Para la altura Galton estimo que este coeficiente era aproximadamente 2 3 la altura de un individuo medira alrededor de un punto medio que es dos tercios de la desviacion de los padres del promedio de la poblacion Galton acuno el termino regresion para describir un hecho observable en la herencia de rasgos geneticos cuantitativos multifactoriales a saber que el descendiente de los padres que se encuentran en las colas de la distribucion tiende a estar mas cerca del centro la media de la distribucion El cuantifico esta tendencia y al hacerlo invento el analisis de regresion lineal sentando asi las bases para gran parte del modelado estadistico moderno Desde entonces el termino regresion ha tomado una variedad de significados y puede ser utilizado por los estadisticos modernos para describir fenomenos de sesgo de muestreo que tienen poco que ver con las observaciones originales de Galton en el campo de la genetica La explicacion de Galton para el fenomeno de regresion que observo se sabe ahora que es incorrecta El declaro Un nino hereda en parte de sus padres en parte de sus antepasados Hablando en general cuanto mas se remonta su genealogia mas numerosos y variados seran sus ancestros hasta que dejen de diferir de cualquier muestra igualmente numerosa tomada al azar de la raza en general 7 Esto es incorrecto ya que un nino recibe su constitucion genetica exclusivamente de sus padres No hay generacion de saltos en el material genetico cualquier material genetico de antepasados anteriores que los padres deben haber pasado a traves de los padres pero puede no haber sido expresado en ellos El fenomeno se entiende mejor si asumimos que el rasgo heredado por ejemplo la altura es controlado por un gran numero de genes recesivos Los individuos excepcionalmente altos deben ser homocigoticos para las mutaciones aumentadas de la altura en una porcion grande de estos loci Pero los loci que llevan estas mutaciones no son necesariamente compartidos entre dos individuos altos y si estos individuos se aparean su descendencia sera en promedio homocigotica para mutaciones altas en menos loci que cualquiera de sus padres Ademas la altura no esta totalmente determinada geneticamente sino que tambien esta sujeta a influencias ambientales durante el desarrollo lo que hace que los hijos de padres excepcionales sean aun mas propensos a estar mas cerca del promedio que sus padres Referencias Editar Everitt B S 2002 The Cambridge Dictionary of Statistics CUP ISBN 0 521 81099 X Upton G Cook I 2006 Oxford Dictionary of Statistics OUP ISBN 978 0 19 954145 4 Stigler Stephen M 1997 Regression toward the mean historically considered Statistical Methods in Medical Research 6 2 103 114 PMID 9261910 doi 10 1191 096228097676361431 Chiolero A Paradis G Rich B Hanley JA 2013 Assessing the Relationship between the Baseline Value of a Continuous Variable and Subsequent Change Over Time Frontiers in Public Health 1 29 PMC 3854983 PMID 24350198 doi 10 3389 fpubh 2013 00029 Samuels 1991 Jeremy Siegel 2007 Stocks for the Long Run 4th edition McGraw Hill ISBN 978 0071494700 p 13 pp 28 9 a b Galton F 1886 Regression towards mediocrity in hereditary stature The Journal of the Anthropological Institute of Great Britain and Ireland 15 246 263 JSTOR 2841583 doi 10 2307 2841583 Datos Q1135405 Multimedia Category Regression toward the mean Obtenido de https es wikipedia org w index php title Regresion a la media amp oldid 125276079, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos