fbpx
Wikipedia

Análisis de la varianza

En estadística, el análisis de la varianza (ANOVA por sus sigloides en inglés, ANalysis Of VAriance) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza está particionada en ciertos componentes debidos a diferentes variables explicativas. Se utiliza de forma intensiva en el análisis y diseño de experimentos para evaluar el efecto de tratamientos en la variabilidad de la variable respuesta.

Desarrollada por el genetista R. A. Fisher en los años 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "análisis de varianza de Fisher", debido al uso de la distribución F de Fisher como parte del contraste de hipótesis.

Introducción

El análisis de la varianza parte del concepto de regresión lineal, cuya funcionalidad amplía. Así, un análisis de la varianza permite determinar, por ejemplo, si diferentes tratamientos médicos (es decir, un grupo de más de dos tratamientos) muestran diferencias significativas en sus resultados o si por el contrario puede suponerse que sus medias poblacionales no difieren. De este modo el análisis de la varianza permite superar las limitaciones de hacer contrastes bilaterales por parejas entre todos los tratamientos posibles, lo que sería un mal método para determinar si un conjunto de variables con n > 2 difieren entre sí. El primer concepto fundamental es asumir que todo valor observado puede expresarse mediante la siguiente función:

 

Donde:

  sería el valor observado (variable dependiente) [valor j-ésimo del tratamiento i-ésimo], y   es el efecto del tratamiento i.
  sería una constante que en la recta de regresión equivale a la ordenada en el origen,
  es una variable que varía de tratamiento a tratamiento.
  es una variable aleatoria que añade a la función cierto error que desvía la puntuación observada de la puntuación pronosticada.

Por tanto, a la función de pronóstico la podemos llamar "media del tratamiento i":

 

Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, más el error aleatorio ( ). A partir de esa idea, se puede operar:

  1. Restamos a ambos lados de la ecuación (para mantener la igualdad) la media de la variable dependiente:

 

  1. Operando se llega finalmente a que:

 

Esta ecuación se reescribe frecuentemente como:

 

de un factor, que es el caso más sencillo, la idea básica del análisis de la varianza es comparar la variación total de un conjunto de muestras y descomponerla como:

 

Donde:

  es un número real relacionado con la varianza, que mide la variación debida al "factor", "tratamiento" o tipo de situación estudiado.
  es un número real relacionado con la varianza, que mide la variación dentro de cada "factor", "tratamiento" o tipo de situación.

En el caso de que la diferencia debida al factor o tratamiento no sea estadísticamente significativa puede probarse que las varianzas muestrales son iguales:

 

Donde:

  es el número de situaciones diferentes o valores del factor se están comparando.
  es el número de mediciones en cada situación se hacen o número de valores disponibles para cada valor del factor.

Así lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadísticamente significativo.

Visión general

Existen tres clases conceptuales de estos modelos:

  1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podrían diferir únicamente en sus medias. (Modelo 1)
  2. El Modelo de efectos aleatorios asume que los datos describen una jerarquía de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarquía. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento sólo tres de muchos más métodos posibles, el método de enseñanza es un factor aleatorio en el experimento. (Modelo 2)
  3. El Modelo de efectos mixtos describen situaciones que éste puede tomar. Ejemplo: Si el método de enseñanza es analizado como un factor que puede influir donde están presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3)

Supuestos previos

El ANOVA parte de algunos supuestos o hipótesis que han de cumplirse:

La técnica fundamental consiste en la separación de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un análisis de regresión lineal)

 

El número de grados de libertad (gl) puede separarse de forma similar y corresponde con la forma en que la distribución chi-cuadrado (χ² o Ji-cuadrada) describe la suma de cuadrados asociada.

 

Tipos de modelo

Modelo I: Efectos fijos

El modelo de efectos fijos de análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta sólo a la media, permaneciendo la "variable respuesta" con una distribución normal.

Este modelo se supone cuando el investigador se interesa únicamente por los niveles del factor presentes en el experimento, por lo que cualquier variación observada en las puntuaciones se deberá al error experimental.

Modelo II: Efectos aleatorios (componentes de varianza)

Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo más simple es el de estimar la media desconocida de una población compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medición.

Este modelo se supone cuando el investigador está interesado en una población de niveles, teóricamente infinitos, del factor de estudio, de los que únicamente una muestra al azar (t niveles) están presentes en el experimento.

Grados de libertad

Los grados de libertad pueden descomponerse al igual que la suma de cuadrados. Así, GLtotal = GLentre + GLdentro. Los GLentre se calculan como: a - 1, donde a es el número de tratamientos o niveles del factor. Los GLdentro se calculan como N - a, donde N es el número total de observaciones o valores de la variable medida (la variable respuesta).

Pruebas de significación

El análisis de varianza lleva a la realización de pruebas de significación estadística, usando la denominada distribución F de Snedecor.

Tablas ANOVA

Una vez que se han calculado las sumas de cuadrados, las medias cuadráticas, los grados de libertad y la F, se procede a elaborar una tabla que reúna la información, denominada "Tabla de Análisis de varianza o ANOVA", que adopta la siguiente forma:

Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio F
Intergrupo   t - 1    
Intragrupo o Error   N - t  
Total   N - 1

Bibliografía

  • M.R. Spiegel; J. Schiller; R. A. Srinivasan (2007). «9. Análisis de la varianza». Probabilidad y Estadística [Schaum's Outline of Theory and Problems of Probability and Statistics]. Schaum (2ª edición). México D.F.: McGraw-Hill. pp. 335-371. ISBN 978-970-10-4231-1. 
  • F. J. Tejedor Tejedor (1999). Análisis de varianza. Schaum. Madrid: La Muralla S.A. ISBN 84-7635-388-X. 


  •   Datos: Q42297
  •   Multimedia: Analysis of variance

análisis, varianza, estadística, análisis, varianza, anova, sigloides, inglés, analysis, variance, colección, modelos, estadísticos, procedimientos, asociados, cual, varianza, está, particionada, ciertos, componentes, debidos, diferentes, variables, explicativ. En estadistica el analisis de la varianza ANOVA por sus sigloides en ingles ANalysis Of VAriance es una coleccion de modelos estadisticos y sus procedimientos asociados en el cual la varianza esta particionada en ciertos componentes debidos a diferentes variables explicativas Se utiliza de forma intensiva en el analisis y diseno de experimentos para evaluar el efecto de tratamientos en la variabilidad de la variable respuesta Desarrollada por el genetista R A Fisher en los anos 1920 y 1930 y es algunas veces conocido como Anova de Fisher o analisis de varianza de Fisher debido al uso de la distribucion F de Fisher como parte del contraste de hipotesis Indice 1 Introduccion 1 1 Vision general 1 2 Supuestos previos 2 Tipos de modelo 2 1 Modelo I Efectos fijos 2 2 Modelo II Efectos aleatorios componentes de varianza 3 Grados de libertad 4 Pruebas de significacion 5 Tablas ANOVA 6 BibliografiaIntroduccion EditarEl analisis de la varianza parte del concepto de regresion lineal cuya funcionalidad amplia Asi un analisis de la varianza permite determinar por ejemplo si diferentes tratamientos medicos es decir un grupo de mas de dos tratamientos muestran diferencias significativas en sus resultados o si por el contrario puede suponerse que sus medias poblacionales no difieren De este modo el analisis de la varianza permite superar las limitaciones de hacer contrastes bilaterales por parejas entre todos los tratamientos posibles lo que seria un mal metodo para determinar si un conjunto de variables con n gt 2 difieren entre si El primer concepto fundamental es asumir que todo valor observado puede expresarse mediante la siguiente funcion y i j m t i ϵ i j displaystyle y ij mu tau i epsilon ij Donde y i j displaystyle y ij seria el valor observado variable dependiente valor j esimo del tratamiento i esimo y t i displaystyle tau i es el efecto del tratamiento i m displaystyle mu seria una constante que en la recta de regresion equivale a la ordenada en el origen t i displaystyle tau i es una variable que varia de tratamiento a tratamiento ϵ i j displaystyle epsilon ij es una variable aleatoria que anade a la funcion cierto error que desvia la puntuacion observada de la puntuacion pronosticada Por tanto a la funcion de pronostico la podemos llamar media del tratamiento i y i m t i displaystyle y i mu tau i Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas mas el error aleatorio y i j y i e i j displaystyle y ij y i e ij A partir de esa idea se puede operar Restamos a ambos lados de la ecuacion para mantener la igualdad la media de la variable dependiente y i j y y i e i j y displaystyle y ij overline y y i e ij overline y Operando se llega finalmente a que i j y i j y 2 n i y i y 2 i j y i j y i 2 displaystyle sum i sum j y ij overline y 2 n sum i y i overline y 2 sum i sum j y ij y i 2 Esta ecuacion se reescribe frecuentemente como S S t o t a l S S f a c t S S e r r o r displaystyle SS total SS fact SS error de un factor que es el caso mas sencillo la idea basica del analisis de la varianza es comparar la variacion total de un conjunto de muestras y descomponerla como S S t o t a l S S f a c t S S i n t displaystyle SS total SS fact SS int Donde S S f a c t displaystyle SS fact es un numero real relacionado con la varianza que mide la variacion debida al factor tratamiento o tipo de situacion estudiado S S i n t displaystyle SS int es un numero real relacionado con la varianza que mide la variacion dentro de cada factor tratamiento o tipo de situacion En el caso de que la diferencia debida al factor o tratamiento no sea estadisticamente significativa puede probarse que las varianzas muestrales son iguales s f a c t S S f a c t a 1 s i n t S S i n t a b 1 displaystyle hat s fact frac SS fact a 1 qquad hat s int frac SS int a b 1 Donde a displaystyle a es el numero de situaciones diferentes o valores del factor se estan comparando b displaystyle b es el numero de mediciones en cada situacion se hacen o numero de valores disponibles para cada valor del factor Asi lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadisticamente significativo Vision general Editar Existen tres clases conceptuales de estos modelos El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podrian diferir unicamente en sus medias Modelo 1 El Modelo de efectos aleatorios asume que los datos describen una jerarquia de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarquia Ejemplo El experimentador ha aprendido y ha considerado en el experimento solo tres de muchos mas metodos posibles el metodo de ensenanza es un factor aleatorio en el experimento Modelo 2 El Modelo de efectos mixtos describen situaciones que este puede tomar Ejemplo Si el metodo de ensenanza es analizado como un factor que puede influir donde estan presentes ambos tipos de factores fijos y aleatorios Modelo 3 Supuestos previos Editar El ANOVA parte de algunos supuestos o hipotesis que han de cumplirse La variable dependiente debe medirse al menos a nivel de intervalo Independencia de las observaciones La distribucion de los residuales debe ser normal Homocedasticidad homogeneidad de las varianzas La tecnica fundamental consiste en la separacion de la suma de cuadrados SS sum of squares en componentes relativos a los factores contemplados en el modelo Como ejemplo mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles Si los niveles son cuantitativos y los efectos son lineales puede resultar apropiado un analisis de regresion lineal S S Total S S Error S S Factores displaystyle SS hbox Total SS hbox Error SS hbox Factores El numero de grados de libertad gl puede separarse de forma similar y corresponde con la forma en que la distribucion chi cuadrado x o Ji cuadrada describe la suma de cuadrados asociada g l Total g l Error g l Factores displaystyle gl hbox Total gl hbox Error gl hbox Factores Tipos de modelo EditarModelo I Efectos fijos Editar El modelo de efectos fijos de analisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores cada uno de los cuales le afecta solo a la media permaneciendo la variable respuesta con una distribucion normal Este modelo se supone cuando el investigador se interesa unicamente por los niveles del factor presentes en el experimento por lo que cualquier variacion observada en las puntuaciones se debera al error experimental Modelo II Efectos aleatorios componentes de varianza Editar Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental El ejemplo mas simple es el de estimar la media desconocida de una poblacion compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medicion Este modelo se supone cuando el investigador esta interesado en una poblacion de niveles teoricamente infinitos del factor de estudio de los que unicamente una muestra al azar t niveles estan presentes en el experimento Grados de libertad EditarLos grados de libertad pueden descomponerse al igual que la suma de cuadrados Asi GLtotal GLentre GLdentro Los GLentre se calculan como a 1 donde a es el numero de tratamientos o niveles del factor Los GLdentro se calculan como N a donde N es el numero total de observaciones o valores de la variable medida la variable respuesta Pruebas de significacion EditarEl analisis de varianza lleva a la realizacion de pruebas de significacion estadistica usando la denominada distribucion F de Snedecor Tablas ANOVA EditarUna vez que se han calculado las sumas de cuadrados las medias cuadraticas los grados de libertad y la F se procede a elaborar una tabla que reuna la informacion denominada Tabla de Analisis de varianza o ANOVA que adopta la siguiente forma Fuente de variacion Suma de cuadrados Grados de libertad Cuadrado medio FIntergrupo S S Factores displaystyle SS hbox Factores t 1 T S S Factores t 1 displaystyle T frac SS hbox Factores t 1 F T E displaystyle F frac T E Intragrupo o Error S S Error displaystyle SS hbox Error N t E S S Error N t displaystyle E frac SS hbox Error N t Total S S Total displaystyle SS hbox Total N 1Bibliografia EditarM R Spiegel J Schiller R A Srinivasan 2007 9 Analisis de la varianza Probabilidad y Estadistica Schaum s Outline of Theory and Problems of Probability and Statistics Schaum 2ª edicion Mexico D F McGraw Hill pp 335 371 ISBN 978 970 10 4231 1 fechaacceso requiere url ayuda F J Tejedor Tejedor 1999 Analisis de varianza Schaum Madrid La Muralla S A ISBN 84 7635 388 X Datos Q42297 Multimedia Analysis of variance Obtenido de https es wikipedia org w index php title Analisis de la varianza amp oldid 139221233, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos