fbpx
Wikipedia

Varianza

En teoría de probabilidad, la varianza o variancia (que suele representarse como ) de una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La varianza tiene como valor mínimo 0. La desviación estándar (raíz cuadrada positiva de la varianza) es una medida de dispersión alternativa, expresada en las mismas unidades que los datos de la variable objeto de estudio.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

El término varianza fue acuñado por Ronald Fisher en un artículo publicado en enero de 1919 con el título The Correlation Between Relatives on the Supposition of Mendelian Inheritance.[1]

A continuación se hará un repaso de las fórmulas, hay que tener en cuenta que la fórmula de la varianza para una población (σ2) difiere de la fórmula de la varianza para una muestra (s2).

Definición

Sea   una variable aleatoria con media  , se define la varianza de la variable aleatoria  , denotada por  ,   o simplemente   como

 

Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y equivalente):

 

Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su índice   satisface  .

Caso continuo

Si la variable aleatoria   es continua con función de densidad   entonces

 

donde

 

y las integrales están definidas sobre el soporte de la variable aleatoria  , es decir,  .

Caso discreto

Si la variable aleatoria   es discreta con función de probabilidad   entonces

 

donde

 

Propiedades

Sean   y   dos variables aleatorias con varianza finita y  

  1.  
  2.  
  3.  
  4.  , donde   denota la covarianza de   e  
  5.   si   y   son variables aleatorias independientes.
  6.   cálculo de la Varianza por Pitágoras, dónde   es la variable aleatoria condicional   dado  .

Ejemplos

Distribución exponencial

Si una variable aleatoria continua   tiene una distribución exponencial con parámetro   entonces su función de densidad está dada por

 

para  .

No es difícil ver que la media de   es  , por lo que para hallar su varianza calculamos

 

Después de integrar se puede concluir que

 

Dado perfecto

Un dado de seis caras puede representarse como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidad igual a 1/6. El valor esperado es (1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:

 

Varianza muestral

En muchas situaciones es preciso estimar la varianza poblacional a partir de una muestra. Si se toma una muestra con reemplazo   de   valores de ella, de entre todos los estimadores posibles de la varianza de la población de partida, existen dos de uso corriente

El primero de ellos

 

que puede ser escrito como

 

pues

 

y el segundo de ellos es

 

que puede ser escrito como

 

pues

 

A ambos se los denomina varianza muestral, difieren ligeramente y, para valores grandes de  , la diferencia es irrelevante. El primero traslada directamente la varianza de la muestra al de la población y el segundo es un estimador insesgado de la varianza poblacional pues

 

mientras que

 

Propiedades de la varianza muestral

Como consecuencia de la igualdad  ,   es un estadístico insesgado de  . Además, si se cumplen las condiciones necesarias para la ley de los grandes números, s2 es un estimador consistente de  .

Más aún, cuando las muestras siguen una distribución normal, por el teorema de Cochran,   tiene la distribución chi-cuadrado:

 

Interpretaciones de la varianza muestral

Dejamos tres fórmulas equivalentes para el cálculo de la varianza muestral  

 

Esta última igualdad tiene interés para interpretar los estimadores   y  , pues si se quiere evaluar la desviación de unos datos o sus diferencias, se puede optar por calcular el promedio de los cuadrados de las diferencias de cada par de datos:

 . Nótese que el número de sumandos es  .

O se puede considerar el promedio de los cuadrados de las diferencias de cada par de datos sin tener en cuenta cada dato consigo mismo, ahora el número de sumandos es  .

 

Véase también

Referencias

  1. Fisher, R. A. (1919). «The Correlation Between Relatives on the Supposition of Mendelian Inheritance» Transactions of the Royal Society of Edinburgh Vol. 52, 02, pp 399-433.

Enlaces externos

  •   Datos: Q175199
  •   Multimedia: Variance

varianza, teoría, probabilidad, varianza, variancia, suele, representarse, como, displaystyle, sigma, variable, aleatoria, medida, dispersión, definida, como, esperanza, cuadrado, desviación, dicha, variable, respecto, media, unidad, medida, corresponde, cuadr. En teoria de probabilidad la varianza o variancia que suele representarse como s 2 displaystyle sigma 2 de una variable aleatoria es una medida de dispersion definida como la esperanza del cuadrado de la desviacion de dicha variable respecto a su media Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable por ejemplo si la variable mide una distancia en metros la varianza se expresa en metros al cuadrado La varianza tiene como valor minimo 0 La desviacion estandar raiz cuadrada positiva de la varianza es una medida de dispersion alternativa expresada en las mismas unidades que los datos de la variable objeto de estudio Hay que tener en cuenta que la varianza puede verse muy influida por los valores atipicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas En tales casos se recomienda el uso de otras medidas de dispersion mas robustas El termino varianza fue acunado por Ronald Fisher en un articulo publicado en enero de 1919 con el titulo The Correlation Between Relatives on the Supposition of Mendelian Inheritance 1 A continuacion se hara un repaso de las formulas hay que tener en cuenta que la formula de la varianza para una poblacion s2 difiere de la formula de la varianza para una muestra s2 Indice 1 Definicion 1 1 Caso continuo 1 2 Caso discreto 2 Propiedades 3 Ejemplos 3 1 Distribucion exponencial 3 2 Dado perfecto 4 Varianza muestral 4 1 Propiedades de la varianza muestral 4 2 Interpretaciones de la varianza muestral 5 Vease tambien 6 Referencias 7 Enlaces externosDefinicion EditarSea X displaystyle X una variable aleatoria con media m E X displaystyle mu operatorname E X se define la varianza de la variable aleatoria X displaystyle X denotada por Var X displaystyle operatorname Var X s X 2 displaystyle sigma X 2 o simplemente s 2 displaystyle sigma 2 como Var X E X m 2 displaystyle operatorname Var X operatorname E X mu 2 Desarrollando la definicion anterior se obtiene la siguiente definicion alternativa y equivalente Var X E X m 2 E X 2 2 X m m 2 E X 2 2 m E X m 2 E X 2 2 m 2 m 2 E X 2 m 2 E X 2 E X 2 displaystyle begin aligned operatorname Var X amp operatorname E X mu 2 amp operatorname E X 2 2X mu mu 2 amp operatorname E X 2 2 mu operatorname E X mu 2 amp operatorname E X 2 2 mu 2 mu 2 amp operatorname E X 2 mu 2 amp operatorname E X 2 operatorname E X 2 end aligned Si una distribucion no tiene esperanza como ocurre con la de Cauchy tampoco tiene varianza Existen otras distribuciones que aun teniendo esperanza carecen de varianza Un ejemplo de ellas es la de Pareto cuando su indice k displaystyle k satisface 1 lt k 2 displaystyle 1 lt k leq 2 Caso continuo Editar Si la variable aleatoria X displaystyle X es continua con funcion de densidad f x displaystyle f x entonces Var X R X x m 2 f x d x displaystyle operatorname Var X int R X x mu 2 f x dx donde m E X R X x f x d x displaystyle mu operatorname E X int R X xf x dx y las integrales estan definidas sobre el soporte de la variable aleatoria X displaystyle X es decir R X displaystyle R X Caso discreto Editar Si la variable aleatoria X displaystyle X es discreta con funcion de probabilidad P X x displaystyle operatorname P X x entonces Var X x R X x m 2 P X x displaystyle operatorname Var X sum x in R X x mu 2 operatorname P X x donde m E X x R X x P X x displaystyle mu operatorname E X sum x in R X x operatorname P X x Propiedades EditarSean X displaystyle X y Y displaystyle Y dos variables aleatorias con varianza finita y a R displaystyle a in mathbb R Var X 0 displaystyle operatorname Var X geq 0 Var a 0 displaystyle operatorname Var a 0 Var a X a 2 Var X displaystyle operatorname Var aX a 2 operatorname Var X Var X Y Var X Var Y 2 Cov X Y displaystyle operatorname Var X Y operatorname Var X operatorname Var Y 2 operatorname Cov X Y donde Cov X Y displaystyle operatorname Cov X Y denota la covarianza de X displaystyle X e Y displaystyle Y Var X Y Var X Var Y displaystyle operatorname Var X Y operatorname Var X operatorname Var Y si X displaystyle X y Y displaystyle Y son variables aleatorias independientes Var Y E Var Y X Var E Y X displaystyle operatorname Var Y operatorname E operatorname Var Y X operatorname Var operatorname E Y X calculo de la Varianza por Pitagoras donde Y X displaystyle Y X es la variable aleatoria condicional Y displaystyle Y dado X displaystyle X Ejemplos EditarDistribucion exponencial Editar Si una variable aleatoria continua X displaystyle X tiene una distribucion exponencial con parametro l displaystyle lambda entonces su funcion de densidad esta dada por f X x l e l x displaystyle f X x lambda e lambda x para x 0 displaystyle x geq 0 No es dificil ver que la media de X displaystyle X es E X 1 l displaystyle operatorname E X 1 lambda por lo que para hallar su varianza calculamos Var X 0 x 1 l 2 l e l x d x displaystyle begin aligned operatorname Var X amp int 0 infty left x frac 1 lambda right 2 lambda e lambda x dx end aligned Despues de integrar se puede concluir que Var X 1 l 2 displaystyle operatorname Var X frac 1 lambda 2 Dado perfecto Editar Un dado de seis caras puede representarse como una variable aleatoria discreta que toma valores del 1 al 6 con probabilidad igual a 1 6 El valor esperado es 1 2 3 4 5 6 6 3 5 Por lo tanto su varianza es i 1 6 1 6 i 3 5 2 1 6 2 5 2 1 5 2 0 5 2 0 5 2 1 5 2 2 5 2 1 6 17 50 35 12 2 92 displaystyle sum i 1 6 tfrac 1 6 i 3 5 2 tfrac 1 6 left 2 5 2 1 5 2 0 5 2 0 5 2 1 5 2 2 5 2 right tfrac 1 6 cdot 17 50 tfrac 35 12 approx 2 92 Varianza muestral EditarEn muchas situaciones es preciso estimar la varianza poblacional a partir de una muestra Si se toma una muestra con reemplazo x 1 x 2 x n displaystyle x 1 x 2 dots x n de n displaystyle n valores de ella de entre todos los estimadores posibles de la varianza de la poblacion de partida existen dos de uso corrienteEl primero de ellos s n 2 1 n i 1 n x i x 2 displaystyle s n 2 frac 1 n sum i 1 n left x i bar x right 2 que puede ser escrito como s n 2 1 n i 1 n x i 2 x 2 displaystyle s n 2 frac 1 n sum i 1 n x i 2 bar x 2 pues s n 2 1 n i 1 n x i x 2 1 n i 1 n x i 2 2 x i x x 2 1 n i 1 n x i 2 2 x n i 1 n x i x 2 1 n i 1 n 1 1 n i 1 n x i 2 2 x 2 x 2 1 n i 1 n x i 2 x 2 displaystyle begin aligned s n 2 amp frac 1 n sum i 1 n left x i overline x right 2 amp frac 1 n sum i 1 n left x i 2 2x i overline x overline x 2 right amp frac 1 n sum i 1 n x i 2 frac 2 overline x n sum i 1 n x i overline x 2 frac 1 n sum i 1 n 1 amp frac 1 n sum i 1 n x i 2 2 overline x 2 overline x 2 amp frac 1 n sum i 1 n x i 2 overline x 2 end aligned y el segundo de ellos es s 2 1 n 1 i 1 n x i x 2 displaystyle s 2 frac 1 n 1 sum i 1 n left x i overline x right 2 que puede ser escrito como s 2 i 1 n x i 2 n x 2 n 1 displaystyle s 2 frac sum i 1 n x i 2 n overline x 2 n 1 pues s 2 1 n 1 i 1 n x i x 2 1 n 1 i 1 n x i 2 2 x i x x 2 1 n 1 i 1 n x i 2 2 x n 1 i 1 n x i x 2 n 1 i 1 n 1 1 n 1 i 1 n x i 2 2 x n n 1 1 n i 1 n x i x 2 n n 1 1 n 1 i 1 n x i 2 2 x 2 n n 1 x 2 n n 1 1 n 1 i 1 n x i 2 x 2 n n 1 i 1 n x i 2 n x 2 n 1 displaystyle begin aligned s 2 amp frac 1 n 1 sum i 1 n left x i overline x right 2 amp frac 1 n 1 sum i 1 n left x i 2 2x i overline x overline x 2 right amp frac 1 n 1 sum i 1 n x i 2 frac 2 overline x n 1 sum i 1 n x i frac overline x 2 n 1 sum i 1 n 1 amp frac 1 n 1 sum i 1 n x i 2 frac 2 overline x n n 1 frac 1 n sum i 1 n x i frac overline x 2 n n 1 amp frac 1 n 1 sum i 1 n x i 2 frac 2 overline x 2 n n 1 frac overline x 2 n n 1 amp frac 1 n 1 sum i 1 n x i 2 frac overline x 2 n n 1 amp frac sum i 1 n x i 2 n overline x 2 n 1 end aligned A ambos se los denomina varianza muestral difieren ligeramente y para valores grandes de n displaystyle n la diferencia es irrelevante El primero traslada directamente la varianza de la muestra al de la poblacion y el segundo es un estimador insesgado de la varianza poblacional pues E s 2 E 1 n 1 i 1 n x i 2 n n 1 x 2 1 n 1 i 1 n E x i 2 n E x 2 1 n 1 n E x 1 2 n E x 2 n n 1 Var x 1 E x 1 2 Var x E x 2 n n 1 Var x 1 m 2 1 n Var x 1 m 2 n n 1 n 1 n Var x 1 Var x 1 s 2 displaystyle begin aligned operatorname E s 2 amp operatorname E left frac 1 n 1 sum i 1 n x i 2 frac n n 1 overline x 2 right amp frac 1 n 1 left sum i 1 n operatorname E x i 2 n operatorname E bar x 2 right amp frac 1 n 1 left n operatorname E x 1 2 n operatorname E overline x 2 right amp frac n n 1 left operatorname Var x 1 operatorname E x 1 2 operatorname Var overline x operatorname E overline x 2 right amp frac n n 1 left operatorname Var x 1 mu 2 frac 1 n operatorname Var x 1 mu 2 right amp frac n n 1 left frac n 1 n operatorname Var x 1 right amp operatorname Var x 1 amp sigma 2 end aligned mientras que E s n 2 n 1 n s 2 displaystyle E s n 2 frac n 1 n sigma 2 Propiedades de la varianza muestral Editar Como consecuencia de la igualdad E s 2 s 2 displaystyle operatorname E s 2 sigma 2 s 2 displaystyle s 2 es un estadistico insesgado de s 2 displaystyle sigma 2 Ademas si se cumplen las condiciones necesarias para la ley de los grandes numeros s2 es un estimador consistente de s 2 displaystyle sigma 2 Mas aun cuando las muestras siguen una distribucion normal por el teorema de Cochran s 2 displaystyle s 2 tiene la distribucion chi cuadrado n s 2 s 2 x n 1 2 displaystyle n frac s 2 sigma 2 sim chi n 1 2 Interpretaciones de la varianza muestral Editar Dejamos tres formulas equivalentes para el calculo de la varianza muestral s n displaystyle s n s n 2 1 n i 1 n y i y 2 1 n i 1 n y i 2 y 2 1 n 2 i lt j y i y j 2 displaystyle s n 2 frac 1 n sum i 1 n left y i overline y right 2 left frac 1 n sum i 1 n y i 2 right overline y 2 frac 1 n 2 sum i lt j left y i y j right 2 Esta ultima igualdad tiene interes para interpretar los estimadores s 2 displaystyle s 2 y s n 2 displaystyle s n 2 pues si se quiere evaluar la desviacion de unos datos o sus diferencias se puede optar por calcular el promedio de los cuadrados de las diferencias de cada par de datos 2 s n 2 i n j n y i y j 2 n 2 displaystyle 2s n 2 frac sum left i leqslant n j leqslant n right left y i y j right 2 n 2 Notese que el numero de sumandos es n 2 displaystyle n 2 O se puede considerar el promedio de los cuadrados de las diferencias de cada par de datos sin tener en cuenta cada dato consigo mismo ahora el numero de sumandos es n n 1 displaystyle n left n 1 right 2 s 2 i j y i y j 2 n n 1 displaystyle 2s 2 frac sum i neq j left y i y j right 2 n left n 1 right Vease tambien EditarDesviacion tipica o desviacion estandar Esperanza matematica o valor esperado Covarianza Analisis de varianzaReferencias Editar Fisher R A 1919 The Correlation Between Relatives on the Supposition of Mendelian Inheritance Transactions of the Royal Society of Edinburgh Vol 52 02 pp 399 433 Enlaces externos Editar 1 Simulacion de la varianza de una variable discreta con R lenguaje de programacion www solin 16mb com estadistica js MediayDesviacion htm Un triangulo rectangulo Datos Q175199 Multimedia Variance Obtenido de https es wikipedia org w index php title Varianza amp oldid 138995100, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos