fbpx
Wikipedia

Distribución beta-binomial

En la teoría de la probabilidad y la estadística, la distribución beta-binomial es una familia de distribuciones discretas de probabilidad sobre un dominio finito de enteros no negativos que surgen cuando la probabilidad de éxito en cada uno de un número fijo o conocido de ensayos de Bernoulli es desconocida o aleatoria. La distribución beta-binomial es la distribución binomial en la que la probabilidad de éxito en cada ensayo no es fija sino aleatoria y sigue la distribución beta. Se utiliza con frecuencia en la estadística bayesiana, métodos empíricos de Bayes y estadísticas clásicas para capturar la sobredispersión en datos distribuidos de tipo binomial.

Se reduce a la distribución de Bernoulli como un caso especial cuando n = 1. Para α = β = 1, es la distribución uniforme discreta de 0 a n. También se aproxima arbitrariamente a la distribución binomial para α y β grandes. El beta-binomial es una versión unidimensional de la distribución Dirichlet-multinomial, ya que las distribuciones binomial y beta son versiones univariadas de las distribuciones multinomial y Dirichlet, respectivamente.

Motivación y derivación

Distribución Beta-binomial como una distribución compuesta

La distribución Beta es una distribución conjugada de la distribución binomial. Este hecho conduce a una distribución compositiva analíticamente manejable donde se puede pensar en el parámetro   en la distribución binomial como siendo aleatoriamente extraído de una distribución beta. A saber, si

 

entonces

 

Donde Bin (n, p) representa la distribución binomial, y donde p es una variable aleatoria con una distribución beta.

 

entonces la distribución del compuesto está dada por

 

Utilizando las propiedades de la función beta, esto puede escribirse alternativamente

 

Beta-binomial como un modelo de urna

La distribución beta-binomial también puede ser motivada a través de un modelo de urna para valores enteros positivos de α y β, conocido como el modelo de urna Polya. Específicamente, imagine una urna que contiene bolas rojas α y bolas negras β, donde se hacen sorteos al azar. Si se observa una bola roja, entonces dos bolas rojas se devuelven a la urna. Del mismo modo, si se observa una bola negra, dos bolas negras se devuelven a la urna. Si esto se repite n veces, entonces la probabilidad de observar k bolas rojas sigue una distribución beta-binomial con los parámetros n, α y β.

Tenga en cuenta que si los sorteos aleatorios son con sustitución simple (no se añaden bolas por encima de la bola observada a la urna), entonces la distribución sigue una distribución binomial y si los sorteos al azar se hacen sin reemplazo, la distribución sigue una distribución hipergeométrica.

Estimación por puntos

Momentos y propiedades

Los tres momentos en crudo son:

 

Y la curtosis es:

 

Siendo   podemos notar, que la media puede ser escrito como:

 

y la variación como:

 

donde  . El parámetro   es conocido como "Clase interna" o "Grupo interno". Es ésta la correlación positiva la cual da alcance a la sobredepresión.

La siguiente relación recurrente afirma que:

 

Estimación de máxima verosimilitud

Mientras que las formas cerradas de estimaciones de máxima verosimilitud no son prácticas, dado que un pdf está formado por funciones comunes, las cuales pueden ser fácilmente encontradas por la vía de la optimización numérica. La estimación de máxima verosimilitud estima mediante datos empíricos que pueden ser computados usando métodos generales para adaptar las distribuciones multinomiales Pòlya, métodos descritos en Minka 2003. El paquete de R VGAM, a través de la función vglm, con estimación de máxima verosimilitud, facilita la adecuación de modelos tipo glm con respuestas distribuidas de acuerdo con la distribución beta-binomial. Nótese también que no hay requerimientos, que n está ajustado a través de las observaciones.

Ejemplo

Los datos siguientes indican el número de niños entre los 12 primeros jóvenes de familias de 13 integrantes en 6115 familias cogidas de los historiales médicos del siglo XIX en Saxony. El 13º joven es ignorado para mitigar el efecto de familias no aleatoriamente escogidas, parando cuando el género deseado es alcanzado.

Males 0 1 2 3 4 5 6 7 8 9 10 11 12
Families 3 24 104 286 670 1033 1343 1112 829 478 181 45 7

Podemos observar que los primeros dos momentos de muestra son:

 

y que por lo tanto el método de estimaciones de momentos es:

 

La estimación de máxima verosimilitud es encontrada numéricamente:

 

y que el logaritmo de máxima verosimilitud maximizado es:

 

de lo cual podemos deducir que el AIC

 

El AIC para concurrir el modelo binomial es AIC = 25070.34 y por lo cual podemos ver que el modelo beta-binomial provee un ajuste superior al de los datos. P.E. hay una evidencia para sobre-depresión. Trivers and Willard publicó una justificación teórica para heterogeneidad (también conocida como "explosividad") en la propensión de género entre los mamíferos descendientes, es decir, la sobre-depresión. P.E.

El ajuste superior es evidente sobre todo en las colas:

Males 0 1 2 3 4 5 6 7 8 9 10 11 12
Observed Families 3 24 104 286 670 1033 1343 1112 829 478 181 45 7
Fitted Expected (Beta-Binomial) 2.3 22.6 104.8 310.9 655.7 1036.2 1257.9 1182.1 853.6 461.9 177.9 43.8 5.2
Fitted Expected (Binomial p = 0.519215) 0.9 12.1 71.8 258.5 628.1 1085.2 1367.3 1265.6 854.2 410.0 132.8 26.1 2.3


  •   Datos: Q307557

distribución, beta, binomial, teoría, probabilidad, estadística, distribución, beta, binomial, familia, distribuciones, discretas, probabilidad, sobre, dominio, finito, enteros, negativos, surgen, cuando, probabilidad, éxito, cada, número, fijo, conocido, ensa. En la teoria de la probabilidad y la estadistica la distribucion beta binomial es una familia de distribuciones discretas de probabilidad sobre un dominio finito de enteros no negativos que surgen cuando la probabilidad de exito en cada uno de un numero fijo o conocido de ensayos de Bernoulli es desconocida o aleatoria La distribucion beta binomial es la distribucion binomial en la que la probabilidad de exito en cada ensayo no es fija sino aleatoria y sigue la distribucion beta Se utiliza con frecuencia en la estadistica bayesiana metodos empiricos de Bayes y estadisticas clasicas para capturar la sobredispersion en datos distribuidos de tipo binomial Se reduce a la distribucion de Bernoulli como un caso especial cuando n 1 Para a b 1 es la distribucion uniforme discreta de 0 a n Tambien se aproxima arbitrariamente a la distribucion binomial para a y b grandes El beta binomial es una version unidimensional de la distribucion Dirichlet multinomial ya que las distribuciones binomial y beta son versiones univariadas de las distribuciones multinomial y Dirichlet respectivamente Indice 1 Motivacion y derivacion 1 1 Distribucion Beta binomial como una distribucion compuesta 1 2 Beta binomial como un modelo de urna 1 3 Estimacion por puntos 2 Momentos y propiedades 3 Estimacion de maxima verosimilitud 4 EjemploMotivacion y derivacion EditarDistribucion Beta binomial como una distribucion compuesta Editar La distribucion Beta es una distribucion conjugada de la distribucion binomial Este hecho conduce a una distribucion compositiva analiticamente manejable donde se puede pensar en el parametro p displaystyle p en la distribucion binomial como siendo aleatoriamente extraido de una distribucion beta A saber si X Bin n p displaystyle begin aligned X amp sim operatorname Bin n p end aligned entonces P X k p n L p k n k p k 1 p n k displaystyle begin aligned P X k p n amp L p k n choose k p k 1 p n k end aligned Donde Bin n p representa la distribucion binomial y donde p es una variable aleatoria con una distribucion beta p p a b B e t a a b p a 1 1 p b 1 B a b displaystyle begin aligned pi p alpha beta amp mathrm Beta alpha beta amp frac p alpha 1 1 p beta 1 mathrm B alpha beta end aligned entonces la distribucion del compuesto esta dada por f k n a b 0 1 L p k p p a b d p n k 1 B a b 0 1 p k a 1 1 p n k b 1 d p n k B k a n k b B a b displaystyle begin aligned f k n alpha beta amp int 0 1 L p k pi p alpha beta dp amp n choose k frac 1 mathrm B alpha beta int 0 1 p k alpha 1 1 p n k beta 1 dp amp n choose k frac mathrm B k alpha n k beta mathrm B alpha beta end aligned Utilizando las propiedades de la funcion beta esto puede escribirse alternativamente f k n a b G n 1 G k 1 G n k 1 G k a G n k b G n a b G a b G a G b displaystyle f k n alpha beta frac Gamma n 1 Gamma k 1 Gamma n k 1 frac Gamma k alpha Gamma n k beta Gamma n alpha beta frac Gamma alpha beta Gamma alpha Gamma beta Beta binomial como un modelo de urna Editar La distribucion beta binomial tambien puede ser motivada a traves de un modelo de urna para valores enteros positivos de a y b conocido como el modelo de urna Polya Especificamente imagine una urna que contiene bolas rojas a y bolas negras b donde se hacen sorteos al azar Si se observa una bola roja entonces dos bolas rojas se devuelven a la urna Del mismo modo si se observa una bola negra dos bolas negras se devuelven a la urna Si esto se repite n veces entonces la probabilidad de observar k bolas rojas sigue una distribucion beta binomial con los parametros n a y b Tenga en cuenta que si los sorteos aleatorios son con sustitucion simple no se anaden bolas por encima de la bola observada a la urna entonces la distribucion sigue una distribucion binomial y si los sorteos al azar se hacen sin reemplazo la distribucion sigue una distribucion hipergeometrica Estimacion por puntos EditarMomentos y propiedades EditarLos tres momentos en crudo son m 1 n a a b m 2 n a n 1 a b a b 1 a b m 3 n a n 2 1 a 2 a 3 n 1 a b b b a a b 1 a b 2 a b displaystyle begin aligned mu 1 amp frac n alpha alpha beta 8pt mu 2 amp frac n alpha n 1 alpha beta alpha beta 1 alpha beta 8pt mu 3 amp frac n alpha n 2 1 alpha 2 alpha 3n 1 alpha beta beta beta alpha alpha beta 1 alpha beta 2 alpha beta end aligned dd Y la curtosis es b 2 a b 2 1 a b n a b a b 2 a b 3 a b n a b a b 1 6 n 3 a b n 2 6 n 2 3 a b n 6 n a b 18 a b n 2 a b 2 displaystyle beta 2 frac alpha beta 2 1 alpha beta n alpha beta alpha beta 2 alpha beta 3 alpha beta n left alpha beta alpha beta 1 6n 3 alpha beta n 2 6n 2 frac 3 alpha beta n 6 n alpha beta frac 18 alpha beta n 2 alpha beta 2 right dd Siendo p a a b displaystyle pi frac alpha alpha beta podemos notar que la media puede ser escrito como m n a a b n p displaystyle mu frac n alpha alpha beta n pi dd y la variacion como s 2 n a b a b n a b 2 a b 1 n p 1 p a b n a b 1 n p 1 p 1 n 1 r displaystyle sigma 2 frac n alpha beta alpha beta n alpha beta 2 alpha beta 1 n pi 1 pi frac alpha beta n alpha beta 1 n pi 1 pi 1 n 1 rho dd donde r 1 a b 1 displaystyle rho tfrac 1 alpha beta 1 El parametro r displaystyle rho es conocido como Clase interna o Grupo interno Es esta la correlacion positiva la cual da alcance a la sobredepresion La siguiente relacion recurrente afirma que a k n k p k k 1 p k 1 b k n 1 0 p 0 b n a b n displaystyle left begin array l alpha k n k p k k 1 p k 1 beta k n 1 0 10pt p 0 frac beta n alpha beta n end array right Estimacion de maxima verosimilitud EditarMientras que las formas cerradas de estimaciones de maxima verosimilitud no son practicas dado que un pdf esta formado por funciones comunes las cuales pueden ser facilmente encontradas por la via de la optimizacion numerica La estimacion de maxima verosimilitud estima mediante datos empiricos que pueden ser computados usando metodos generales para adaptar las distribuciones multinomiales Polya metodos descritos en Minka 2003 El paquete de R VGAM a traves de la funcion vglm con estimacion de maxima verosimilitud facilita la adecuacion de modelos tipo glm con respuestas distribuidas de acuerdo con la distribucion beta binomial Notese tambien que no hay requerimientos que n esta ajustado a traves de las observaciones Ejemplo EditarLos datos siguientes indican el numero de ninos entre los 12 primeros jovenes de familias de 13 integrantes en 6115 familias cogidas de los historiales medicos del siglo XIX en Saxony El 13º joven es ignorado para mitigar el efecto de familias no aleatoriamente escogidas parando cuando el genero deseado es alcanzado Males 0 1 2 3 4 5 6 7 8 9 10 11 12Families 3 24 104 286 670 1033 1343 1112 829 478 181 45 7Podemos observar que los primeros dos momentos de muestra son m 1 6 23 m 2 42 31 n 12 displaystyle begin aligned m 1 amp 6 23 m 2 amp 42 31 n amp 12 end aligned dd y que por lo tanto el metodo de estimaciones de momentos es a 34 1350 b 31 6085 displaystyle begin aligned hat alpha amp 34 1350 hat beta amp 31 6085 end aligned dd La estimacion de maxima verosimilitud es encontrada numericamente a m l e 34 09558 b m l e 31 5715 displaystyle begin aligned hat alpha mathrm mle amp 34 09558 hat beta mathrm mle amp 31 5715 end aligned dd y que el logaritmo de maxima verosimilitud maximizado es log L 12492 9 displaystyle log mathcal L 12492 9 dd de lo cual podemos deducir que el AIC A I C 24989 74 displaystyle mathit AIC 24989 74 dd El AIC para concurrir el modelo binomial es AIC 25070 34 y por lo cual podemos ver que el modelo beta binomial provee un ajuste superior al de los datos P E hay una evidencia para sobre depresion Trivers and Willard publico una justificacion teorica para heterogeneidad tambien conocida como explosividad en la propension de genero entre los mamiferos descendientes es decir la sobre depresion P E El ajuste superior es evidente sobre todo en las colas Males 0 1 2 3 4 5 6 7 8 9 10 11 12Observed Families 3 24 104 286 670 1033 1343 1112 829 478 181 45 7Fitted Expected Beta Binomial 2 3 22 6 104 8 310 9 655 7 1036 2 1257 9 1182 1 853 6 461 9 177 9 43 8 5 2Fitted Expected Binomial p 0 519215 0 9 12 1 71 8 258 5 628 1 1085 2 1367 3 1265 6 854 2 410 0 132 8 26 1 2 3 Datos Q307557Obtenido de https es wikipedia org w index php title Distribucion beta binomial amp oldid 127730167, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos