fbpx
Wikipedia

Corrección de Bessel

En estadística, la corrección de Bessel — así llamada por su creador, el astrónomo y matemático alemán Friedrich Bessel (1784-1846) — consiste en el uso de (n − 1) en lugar de n en las fórmulas de la varianza muestral y de la desviación típica muestral (siendo n el número de observaciones de una muestra). Corrige el sesgo estadístico en la estimación de la varianza poblacional, y algunos (pero no todos) los sesgos en la estimación de la desviación estándar poblacional.

Conceptos clave: población y muestra

Cuando se quiere estimar la desviación estándar como indicador estadístico de una población a partir de una muestra (lógicamente, porque no se dispone de datos sobre la población completa), es importante distinguir los conceptos de población (un conjunto, generalmente muy amplio de datos, como por ejemplo, "la estatura de todas las alumnas de una determinada edad de un país"), y de muestra (un subconjunto, generalmente pequeño, formado por algunos elementos pertenecientes a la población total, como por ejemplo, "las estaturas de las alumnas de la edad considerada de un determinado colegio"). Los términos poblacional y muestral se asocian a su vez a los conceptos anteriormente citados de población y de muestra.

Bessel se dedicaba a la astronomía, y una parte importante de su trabajo era estimar las órbitas de distintos objetos astronómicos (es decir, necesitaba conocer los parámetros de una población formada por las posiciones que definen la trayectoria de uno de estos objetos astronómicos), generalmente a partir de muy pocas observaciones (una pequeña muestra de posiciones del objeto), que generalmente tenía que tratar estadísticamente para reducir el efecto de los errores asociados a la toma de datos.

La varianza muestral se estima como la media aritmética de los cuadrados de las desviaciones de los valores de la muestra respecto a la media muestral. En este cálculo se usa el factor multiplicador 1/n (correspondiente al concepto de media aritmética)— que como se analiza más adelante, es un estimador sesgado a la baja de la varianza poblacional. Para corregir este efecto, Bessel multiplicaba por n/(n − 1) (equivalentemente, usando 1/(n − 1) en lugar de  1/n en la fórmula del estimador). El costo de esta corrección es que el estimador insesgado es uniformemente mayor que el sesgado. A veces[1][2]​ el factor n/(n − 1) es llamado Corrección de Bessel.

Un aspecto sutil de esta corrección implica que, mientras que la varianza muestral (usando la corrección de Bessel) es un estimador insesgado de la varianza poblacional, su raíz cuadrada (o sea, la desviación estándar muestral) sigue siendo un estimador sesgado de la desviación estándar poblacional. Ya que la raíz cuadrada es una función cóncava, se produce un sesgo por defecto debido a la desigualdad de Jensen. No hay una fórmula general para evitar el sesgo de la estimación de la desviación estándar poblacional, aunque hay varios factores correctores para distribuciones particulares, como en el caso de la distribución normal. Una aproximación del factor corrector exacto en la distribución normal se da usando el factor (n −  1.5) en la fórmula. El sesgo decae cuadráticamente (en lugar de linealmente, como en la forma que no usa la corrección de Bessel).

Puede entenderse la Corrección de Bessel intuitivamente, a partir de los grados de libertad del vector de residuos

 

donde   es la media muestral. Mientras que hay n muestras independientes, hay solamente n − 1 residuos independientes, que suman 0. Es decir, calculados n − 1 residuos, es inmediato conocer el residuo restante, cuyo valor es la suma de los otros residuos cambiado de signo. Esta circunstancia es debida a la propiedad de la media aritmética que se utiliza en el cálculo de los residuos, que hace que estos siempre sumen 0.

Por último, debe resaltarse que a medida que el número de elementos de las muestras utilizadas es mayor, la diferencia entre las estimaciones corregidas y sin corregir (es decir, la diferencia entre la raíz de 1/n y la raíz de 1/(n-1)), es cada vez más pequeña. Sin embargo, el efecto de la corrección es especialmente relevante para muestras pequeñas (formadas por 10 o menos observaciones), como las que Bessel manejaba habitualmente.

La fuente del sesgo

Supóngase que la media de cierta población es 2050, pero el estadístico no la conoce. Por lo tanto, la estima basado en una pequeña muestra elegida al azar de entre la población:

 

Se puede calcular la media muestral:

 

Este valor puede servir como un estimador insesgado de la media poblacional, que es desconocida. Ahora, hay que enfrentarse al problema de estimar la varianza poblacional. O sea, de estimar el promedio entre el cuadrado de las desviaciones respecto a  2050. Si el estadístico supiera que la media poblacional es de 2050, entonces podría proceder de la siguiente forma:

 

Pero el estimador de la media poblacional del que dispone el estadístico es la media muestral 2052, no 2050. En consecuencia, solo puede calcular:

 

La estimación es substancialmente menor. Por lo tanto surge el interrogante: el estimador de la varianza poblacional calculado usando la media muestral, ¿es siempre menor que la verdadera varianza poblacional? La respuesta es que sí, excepto cuando la media muestral sea igual a la media poblacional.

En términos intuitivos, se busca la suma de los cuadrados de las diferencias respecto a la media poblacional, pero el estadístico termina calculando la suma de los cuadrados de las diferencias de los valores de cada observación respecto a la media muestral, que es, como se verá a continuación, el valor que minimiza la suma de las diferencias al cuadrado. Por lo tanto, a menos que la muestra tenga como media un valor igual al de la media poblacional, su estimador siempre subestimará la varianza poblacional.

Para ver cómo se produce esta circunstancia, se usa una identidad simple en álgebra:

 

Con   se representa la desviación de una observación individual con respecto a la media muestral, y con   se representa la diferencia entre la media muestral y la media poblacional. Nótese que lo que se ha hecho ha sido simplemente descomponer la desviación respecto a la media poblacional (que es desconocida) en dos componentes: la desviación respecto a la media muestral -que se conoce- y la desviación adicional respecto a la media poblacional -que se desconoce-. Ahora, aplicando esta identidad, se descompone:

 

Operando los cuadrados:

 

Ahora se aplica esta fórmula desarrollada a las 5 observaciones, y se analiza el patrón resultante:

 

La suma de los valores de la columna del medio debe ser cero, porque la suma de las desviaciones respecto a la media muestral debe ser cero. Dado que la columna del medio se anula, entonces se observa que

  • La suma de los valores en la primera columna (a2) es la suma de los cuadrados de las diferencias entre los valores de la variable y la media muestral.
  • La suma de todos los valores de las dos columnas que quedan, (a2 y b2) es la suma de los cuadrados de las diferencias entre los valores de la variable y su media poblacional, debido a la forma en que se comenzó con la primera observación,  [2053 − 2050]2, haciéndose lo mismo con las siguientes cuatro observaciones.
  • La suma de todas las columnas debe ser mayor que la suma de los valores de la primera columna, ya que todos los valores que no se eliminaron son positivos (excepto cuando la media poblacional y la media muestral coinciden, en cuyo caso todos los números de la última columna serán 0).

Por lo tanto, la suma de los cuadrados de las diferencias respecto a la media poblacional siempre será mayor que la suma de las desviaciones al cuadrado respecto a la media muestral (excepto cuando la media poblacional y la media muestral coincidan, en cuyo caso ambas son iguales). Es por esto que la suma de los cuadrados de las desviaciones respecto a la media muestral resulta ser un estimador sesgado a la baja de la varianza poblacional.

Notación y terminología

Esta corrección es tan común, que los términos "varianza muestral" y "desvío estándar muestral" se refieren frecuentemente al estimador corregido, usando n − 1. Sin embargo se debe ser cauto: algunas calculadoras y paquetes estadísticos pueden dar la opción de usar ambos estimadores, o solamente la versión menos usual. Para mayor precisión, en este artículo se denomina "desviación estándar muestral" a la desviación estándar muestral, que por definición usa n, y está sesgado con respecto a la desviación estándar poblacional.

Este artículo usa los siguientes símbolos y definiciones:

μ es la media poblacional
  es la media muestral
σ2 es la varianza poblacional
sn2 es el estimador sesgado de la varianza (sin la corrección de Bessel)
s2 es el estimador insesgado de la varianza poblacional (con la corrección de Bessel)

Las desviaciones estándar se obtienen aplicando la raíz cuadrada a sus varianzas respectivas. Ya que las desviaciones estándar producen sesgo, la terminología "no corregido" o "corregido" se prefiere para los estimadores de la varianza poblacional.

sn es la desviación estándar muestral no corregida (sin la corrección de Bessel)
s es la desviación estándar muestral corregida (con el estimador de Bessel), que está menos sesgado, pero sigue estando sesgado

Fórmulas

La media muestral se calcula como:

 

La varianza muestral sesgada tiene la fórmula:

 

Y la varianza muestral no sesgada se escribe como:

 

Pruebas de consistencia

A continuación se incluyen dos pruebas de la consistencia de la corrección de Bessel como factor apropiado para evitar el sesgo de la varianza muestral:

Véase también

Referencias

  1. W.J. Reichmann, W.J. (1961) Use and abuse of statistics, Methuen. Reprinted 1964–1970 by Pelican. Appendix 8.
  2. Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4 (entry for "Variance (data)")

Enlaces externos

  •   Datos: Q526938

corrección, bessel, estadística, corrección, bessel, así, llamada, creador, astrónomo, matemático, alemán, friedrich, bessel, 1784, 1846, consiste, lugar, fórmulas, varianza, muestral, desviación, típica, muestral, siendo, número, observaciones, muestra, corri. En estadistica la correccion de Bessel asi llamada por su creador el astronomo y matematico aleman Friedrich Bessel 1784 1846 consiste en el uso de n 1 en lugar de n en las formulas de la varianza muestral y de la desviacion tipica muestral siendo n el numero de observaciones de una muestra Corrige el sesgo estadistico en la estimacion de la varianza poblacional y algunos pero no todos los sesgos en la estimacion de la desviacion estandar poblacional Indice 1 Conceptos clave poblacion y muestra 2 La fuente del sesgo 3 Notacion y terminologia 4 Formulas 5 Pruebas de consistencia 6 Vease tambien 7 Referencias 8 Enlaces externosConceptos clave poblacion y muestra EditarCuando se quiere estimar la desviacion estandar como indicador estadistico de una poblacion a partir de una muestra logicamente porque no se dispone de datos sobre la poblacion completa es importante distinguir los conceptos de poblacion un conjunto generalmente muy amplio de datos como por ejemplo la estatura de todas las alumnas de una determinada edad de un pais y de muestra un subconjunto generalmente pequeno formado por algunos elementos pertenecientes a la poblacion total como por ejemplo las estaturas de las alumnas de la edad considerada de un determinado colegio Los terminos poblacional y muestral se asocian a su vez a los conceptos anteriormente citados de poblacion y de muestra Bessel se dedicaba a la astronomia y una parte importante de su trabajo era estimar las orbitas de distintos objetos astronomicos es decir necesitaba conocer los parametros de una poblacion formada por las posiciones que definen la trayectoria de uno de estos objetos astronomicos generalmente a partir de muy pocas observaciones una pequena muestra de posiciones del objeto que generalmente tenia que tratar estadisticamente para reducir el efecto de los errores asociados a la toma de datos La varianza muestral se estima como la media aritmetica de los cuadrados de las desviaciones de los valores de la muestra respecto a la media muestral En este calculo se usa el factor multiplicador 1 n correspondiente al concepto de media aritmetica que como se analiza mas adelante es un estimador sesgado a la baja de la varianza poblacional Para corregir este efecto Bessel multiplicaba por n n 1 equivalentemente usando 1 n 1 en lugar de 1 n en la formula del estimador El costo de esta correccion es que el estimador insesgado es uniformemente mayor que el sesgado A veces 1 2 el factor n n 1 es llamado Correccion de Bessel Un aspecto sutil de esta correccion implica que mientras que la varianza muestral usando la correccion de Bessel es un estimador insesgado de la varianza poblacional su raiz cuadrada o sea la desviacion estandar muestral sigue siendo un estimador sesgado de la desviacion estandar poblacional Ya que la raiz cuadrada es una funcion concava se produce un sesgo por defecto debido a la desigualdad de Jensen No hay una formula general para evitar el sesgo de la estimacion de la desviacion estandar poblacional aunque hay varios factores correctores para distribuciones particulares como en el caso de la distribucion normal Una aproximacion del factor corrector exacto en la distribucion normal se da usando el factor n 1 5 en la formula El sesgo decae cuadraticamente en lugar de linealmente como en la forma que no usa la correccion de Bessel Puede entenderse la Correccion de Bessel intuitivamente a partir de los grados de libertad del vector de residuos x 1 x x n x displaystyle x 1 overline x dots x n overline x donde x displaystyle overline x es la media muestral Mientras que hay n muestras independientes hay solamente n 1 residuos independientes que suman 0 Es decir calculados n 1 residuos es inmediato conocer el residuo restante cuyo valor es la suma de los otros residuos cambiado de signo Esta circunstancia es debida a la propiedad de la media aritmetica que se utiliza en el calculo de los residuos que hace que estos siempre sumen 0 Por ultimo debe resaltarse que a medida que el numero de elementos de las muestras utilizadas es mayor la diferencia entre las estimaciones corregidas y sin corregir es decir la diferencia entre la raiz de 1 n y la raiz de 1 n 1 es cada vez mas pequena Sin embargo el efecto de la correccion es especialmente relevante para muestras pequenas formadas por 10 o menos observaciones como las que Bessel manejaba habitualmente La fuente del sesgo EditarSupongase que la media de cierta poblacion es 2050 pero el estadistico no la conoce Por lo tanto la estima basado en una pequena muestra elegida al azar de entre la poblacion 2051 2053 2055 2050 2051 displaystyle 2051 quad 2053 quad 2055 quad 2050 quad 2051 Se puede calcular la media muestral 1 5 2051 2053 2055 2050 2051 2052 displaystyle frac 1 5 left 2051 2053 2055 2050 2051 right 2052 Este valor puede servir como un estimador insesgado de la media poblacional que es desconocida Ahora hay que enfrentarse al problema de estimar la varianza poblacional O sea de estimar el promedio entre el cuadrado de las desviaciones respecto a 2050 Si el estadistico supiera que la media poblacional es de 2050 entonces podria proceder de la siguiente forma 1 5 2051 2050 2 2053 2050 2 2055 2050 2 2050 2050 2 2051 2050 2 36 5 7 2 displaystyle begin aligned amp frac 1 5 left 2051 2050 2 2053 2050 2 2055 2050 2 2050 2050 2 2051 2050 2 right amp frac 36 5 7 2 end aligned Pero el estimador de la media poblacional del que dispone el estadistico es la media muestral 2052 no 2050 En consecuencia solo puede calcular 1 5 2051 2052 2 2053 2052 2 2055 2052 2 2050 2052 2 2051 2052 2 16 5 3 2 displaystyle begin aligned amp frac 1 5 left 2051 2052 2 2053 2052 2 2055 2052 2 2050 2052 2 2051 2052 2 right amp frac 16 5 3 2 end aligned La estimacion es substancialmente menor Por lo tanto surge el interrogante el estimador de la varianza poblacional calculado usando la media muestral es siempre menor que la verdadera varianza poblacional La respuesta es que si excepto cuando la media muestral sea igual a la media poblacional En terminos intuitivos se busca la suma de los cuadrados de las diferencias respecto a la media poblacional pero el estadistico termina calculando la suma de los cuadrados de las diferencias de los valores de cada observacion respecto a la media muestral que es como se vera a continuacion el valor que minimiza la suma de las diferencias al cuadrado Por lo tanto a menos que la muestra tenga como media un valor igual al de la media poblacional su estimador siempre subestimara la varianza poblacional Para ver como se produce esta circunstancia se usa una identidad simple en algebra a b 2 a 2 2 a b b 2 displaystyle a b 2 a 2 2ab b 2 Con a displaystyle a se representa la desviacion de una observacion individual con respecto a la media muestral y con b displaystyle b se representa la diferencia entre la media muestral y la media poblacional Notese que lo que se ha hecho ha sido simplemente descomponer la desviacion respecto a la media poblacional que es desconocida en dos componentes la desviacion respecto a la media muestral que se conoce y la desviacion adicional respecto a la media poblacional que se desconoce Ahora aplicando esta identidad se descompone 2053 2050 Desviacion de la media poblacional 2 2053 2052 desviacion de la media muestral Esto es a 2052 2050 Esto es b 2 displaystyle begin aligned underbrace 2053 2050 begin smallmatrix text Desviacion de text la media text poblacional end smallmatrix 2 amp overbrace underbrace 2053 2052 begin smallmatrix text desviacion de text la media muestral end smallmatrix text Esto es a overbrace 2052 2050 text Esto es b 2 end aligned Operando los cuadrados 2053 2052 2 Esto es a 2 2 2053 2052 2052 2050 Esto es 2 a b 2052 2050 2 Esto es b 2 displaystyle begin aligned amp overbrace 2053 2052 2 text Esto es a 2 overbrace 2 2053 2052 2052 2050 text Esto es 2ab overbrace 2052 2050 2 text Esto es b 2 end aligned Ahora se aplica esta formula desarrollada a las 5 observaciones y se analiza el patron resultante 2051 2052 2 Esto es a 2 2 2051 2052 2052 2050 Esto es 2 a b 2052 2050 2 Esto es b 2 2053 2052 2 2 2053 2052 2052 2050 2052 2050 2 2055 2052 2 2 2055 2052 2052 2050 2052 2050 2 2050 2052 2 2 2050 2052 2052 2050 2052 2050 2 2051 2052 2 2 2051 2052 2052 2050 La suma de los valores en esta columna del medio debe ser 0 2052 2050 2 displaystyle begin aligned overbrace 2051 2052 2 text Esto es a 2 overbrace 2 2051 2052 2052 2050 text Esto es 2ab overbrace 2052 2050 2 text Esto es b 2 2053 2052 2 2 2053 2052 2052 2050 2052 2050 2 2055 2052 2 2 2055 2052 2052 2050 2052 2050 2 2050 2052 2 2 2050 2052 2052 2050 2052 2050 2 2051 2052 2 underbrace 2 2051 2052 2052 2050 begin smallmatrix text La suma de los valores en esta text columna del medio debe ser 0 end smallmatrix 2052 2050 2 end aligned La suma de los valores de la columna del medio debe ser cero porque la suma de las desviaciones respecto a la media muestral debe ser cero Dado que la columna del medio se anula entonces se observa que La suma de los valores en la primera columna a2 es la suma de los cuadrados de las diferencias entre los valores de la variable y la media muestral La suma de todos los valores de las dos columnas que quedan a2 y b2 es la suma de los cuadrados de las diferencias entre los valores de la variable y su media poblacional debido a la forma en que se comenzo con la primera observacion 2053 2050 2 haciendose lo mismo con las siguientes cuatro observaciones La suma de todas las columnas debe ser mayor que la suma de los valores de la primera columna ya que todos los valores que no se eliminaron son positivos excepto cuando la media poblacional y la media muestral coinciden en cuyo caso todos los numeros de la ultima columna seran 0 Por lo tanto la suma de los cuadrados de las diferencias respecto a la media poblacional siempre sera mayor que la suma de las desviaciones al cuadrado respecto a la media muestral excepto cuando la media poblacional y la media muestral coincidan en cuyo caso ambas son iguales Es por esto que la suma de los cuadrados de las desviaciones respecto a la media muestral resulta ser un estimador sesgado a la baja de la varianza poblacional Notacion y terminologia EditarEsta correccion es tan comun que los terminos varianza muestral y desvio estandar muestral se refieren frecuentemente al estimador corregido usando n 1 Sin embargo se debe ser cauto algunas calculadoras y paquetes estadisticos pueden dar la opcion de usar ambos estimadores o solamente la version menos usual Para mayor precision en este articulo se denomina desviacion estandar muestral a la desviacion estandar muestral que por definicion usa n y esta sesgado con respecto a la desviacion estandar poblacional Este articulo usa los siguientes simbolos y definiciones m es la media poblacionalx displaystyle overline x es la media muestrals2 es la varianza poblacionalsn2 es el estimador sesgado de la varianza sin la correccion de Bessel s2 es el estimador insesgado de la varianza poblacional con la correccion de Bessel Las desviaciones estandar se obtienen aplicando la raiz cuadrada a sus varianzas respectivas Ya que las desviaciones estandar producen sesgo la terminologia no corregido o corregido se prefiere para los estimadores de la varianza poblacional sn es la desviacion estandar muestral no corregida sin la correccion de Bessel s es la desviacion estandar muestral corregida con el estimador de Bessel que esta menos sesgado pero sigue estando sesgadoFormulas EditarLa media muestral se calcula como x 1 n i 1 n x i displaystyle overline x frac 1 n sum i 1 n x i La varianza muestral sesgada tiene la formula s n 2 1 n i 1 n x i x 2 i 1 n x i 2 n i 1 n x i 2 n 2 displaystyle s n 2 frac 1 n sum i 1 n left x i overline x right 2 frac sum i 1 n left x i 2 right n frac left sum i 1 n x i right 2 n 2 Y la varianza muestral no sesgada se escribe como s 2 1 n 1 i 1 n x i x 2 i 1 n x i 2 n 1 i 1 n x i 2 n 1 n n n 1 s n 2 displaystyle s 2 frac 1 n 1 sum i 1 n left x i overline x right 2 frac sum i 1 n left x i 2 right n 1 frac left sum i 1 n x i right 2 n 1 n left frac n n 1 right s n 2 Pruebas de consistencia EditarA continuacion se incluyen dos pruebas de la consistencia de la correccion de Bessel como factor apropiado para evitar el sesgo de la varianza muestral Prueba de consistencia 1 Como dato de partida se usa la identidad E x 2 m 2 s 2 displaystyle E x 2 mu 2 sigma 2 que se sirve de las definiciones de la desviacion estandar y de la esperanza matematica Una observacion muy util es que para cualquier distribucion la varianza es igual a la mitad del valor esperado de x 1 x 2 2 displaystyle x 1 x 2 2 cuando x 1 x 2 displaystyle x 1 x 2 son muestras independientes Para probar esta observacion basta saber que E x 1 x 2 E x 1 E x 2 displaystyle E x 1 x 2 E x 1 E x 2 lo que se deduce del hecho de que son variables independientes asi como de la linealidad del valor esperado E x 1 x 2 2 E x 1 2 E 2 x 1 x 2 E x 2 2 s 2 m 2 2 m 2 s 2 m 2 2 s 2 displaystyle E x 1 x 2 2 E x 1 2 E 2x 1 x 2 E x 2 2 sigma 2 mu 2 2 mu 2 sigma 2 mu 2 2 sigma 2 Entonces se demuestra que la diferencia cuadratica esperada de dos muestras de la poblacion x 1 x n displaystyle x 1 ldots x n es igual a n 1 n displaystyle n 1 n multiplicada por la diferencia cuadratica esperada de dos muestras de la distribucion original Para ver esto se debe tener en cuenta que cuando se selecciona x u displaystyle x u y x v displaystyle x v a traves de u v siendo numeros enteros seleccionados de manera independiente y uniforme de 1 a n una fraccion n n 2 1 n displaystyle n n 2 1 n de veces se tendra que u v y por lo tanto la diferencia cuadratica muestral es cero independientemente de la distribucion original En el 1 1 n displaystyle 1 1 n restante de ocasiones el valor de E x u x v 2 displaystyle E x u x v 2 es la diferencia cuadratica esperada entre dos muestras no relacionadas de la distribucion original Por lo tanto al dividir la diferencia cuadratica esperada de la muestra por 1 1 n displaystyle 1 1 n o multiplicar de manera equivalente por 1 1 1 n n n 1 displaystyle 1 1 1 n n n 1 se obtiene una estimacion insesgada de la diferencia cuadratica esperada original Prueba de consistencia 2 Utilizando la identidad para la varianza i 1 n x i x 2 i 1 n x i 1 n j 1 n x j 2 i 1 n x i 2 n 1 n j 1 n x j 2 i 1 n x i 2 n x 2 displaystyle begin aligned sum i 1 n left x i overline x right 2 amp sum i 1 n left x i frac 1 n sum j 1 n x j right 2 amp sum i 1 n x i 2 n left frac 1 n sum j 1 n x j right 2 amp sum i 1 n x i 2 n overline x 2 end aligned entonces E i 1 n x i m x m 2 E i 1 n x i m 2 n x m 2 i 1 n E x i m 2 n E x m 2 i 1 n Var x i n Var x displaystyle begin aligned operatorname E left sum i 1 n left x i mu left overline x mu right right 2 right amp operatorname E left sum i 1 n x i mu 2 n overline x mu 2 right amp sum i 1 n operatorname E left x i mu 2 right n operatorname E left overline x mu 2 right amp sum i 1 n operatorname Var left x i right n operatorname Var left overline x right end aligned y por definicion E s 2 E i 1 n x i x 2 n 1 1 n 1 E i 1 n x i m x m 2 1 n 1 i 1 n Var x i n Var x displaystyle begin aligned operatorname E s 2 amp operatorname E left sum i 1 n frac x i overline x 2 n 1 right amp frac 1 n 1 operatorname E left sum i 1 n left x i mu left overline x mu right right 2 right amp frac 1 n 1 left sum i 1 n operatorname Var left x i right n operatorname Var left overline x right right end aligned Teniendo en cuenta que dado que x1 x2 xn son una muestra aleatoria de una distribucion con variacion s2 se deduce que para cada i 1 2 n Var x i s 2 displaystyle operatorname Var x i sigma 2 y tambien Var x s 2 n displaystyle operatorname Var overline x sigma 2 n Esta es una propiedad de la varianza de las variables no correlacionadas que surge de la formula de Bienayme El resultado requerido se obtiene sustituyendo estas dos formulas E s 2 1 n 1 i 1 n s 2 n s 2 n 1 n 1 n s 2 s 2 s 2 displaystyle operatorname E s 2 frac 1 n 1 left sum i 1 n sigma 2 n sigma 2 n right frac 1 n 1 n sigma 2 sigma 2 sigma 2 Vease tambien EditarSesgo estadistico Desviacion estandar Estimacion de la desviacion estandar no sesgadaReferencias Editar W J Reichmann W J 1961 Use and abuse of statistics Methuen Reprinted 1964 1970 by Pelican Appendix 8 Upton G Cook I 2008 Oxford Dictionary of Statistics OUP ISBN 978 0 19 954145 4 entry for Variance data Enlaces externos EditarWeisstein Eric W Bessel s Correction En Weisstein Eric W ed MathWorld en ingles Wolfram Research Datos Q526938 Obtenido de https es wikipedia org w index php title Correccion de Bessel amp oldid 135054074, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos