En estadística la distribución T² (T-cuadrado) de Hotelling es importante porque se presenta como la distribución de un conjunto de estadísticas que son una generalización natural de las estadísticas subayacentes distribución t de Student. En particular, la distribución se presenta en estadísticas multivariadas en pruebas de diferencias entre las medias (multivariadas) de diferentes poblaciones, donde las pruebas para problemas univariados usarían la Prueba t. Es proporcional a la distribución F.
La distribución recibe su nombre de Harold Hotelling, quien la desarrollo[1] como una generalización de la distribución t de Student.
Definición
Si el vector tiene distribución normal multivariada con media cero y matriz de covarianza unitaria y es una matriz de tamaño con matriz unitaria escalada y los grados de libertad con distribución de Wishart entonces la forma cuadrática tiene distribución de Hotelling con parámetros y :
Si la variable aleatoria tiene distribución T-cuadrado de Hotelling con parámetros y , , entonces
La estadística T-cuadrado de Hotelling es una generalización de la estadística t de Student que se usa en las pruebas de hipótesis multivariadas, y se define como sigue:[1]
donde es una distribución ji-cuadrado con p grados de libertad. Para demostrar eso se usa el hecho que y entonces, al derivar la función característica de la variable aleatoria
Sin embargo, es por lo general desconocida y se busca hacer una prueba de hipótesis sobre el vector de medias .
Defínase
como la covarianza muestral. La traspuesta se ha denotado con un apóstrofo. Se demuestra que es una matriz definida positiva y sigue una distribución Wishart p-variada con n−1 grados de libertad.[2] La estadística T-cuadrado de Hotelling se define entonces como
donde es una distribución con parámetros y . Para calcular un p-valor, multiplique la estadística t2 y la constante anterior y use la distribución .
Estadística T-cuadrado de Hotelling para dos muestras
Si y , con the samples independently drawn from two independent multivariate normal distributions con la misma media y covarianza, y definimos
como las medias muestrales, y
como el estinador de la matriz de covarianza pooled insesgado the unbiased pooled covariance matrix estimate, then Hotelling's two-sample T-squared statistic is
and it can be related to the F-distribution by[2]
The non-null distribution of this statistic is the noncentral F-distribution (the ratio of a non-central Chi-squared random variable and an independent central Chi-squared random variable)
with
where is the difference vector between the population means.
Véase también
Student's t-test in univariate statistics
Student's t-distribution in univariate probability theory
Multivariate Student distribution.
F-distribution (commonly tabulated or available in software libraries, and hence used for testing the T-squared statistic using the relationship given above)
Wilks' lambda distribution (in multivariate statistics Wilks's Λ is to Hotelling's T2 as Snedecor'sF is to Student'st in univariate statistics).
Referencias
↑ Hotelling, H. (1931). «The generalization of Student's ratio». Annals of Mathematical Statistics2 (3): 360-378. doi:10.1214/aoms/1177732979.
Plantilla:ProbDistributions Plantilla:Common univariate probability distributions
Datos:Q1393230
Septiembre 09, 2021
distribución, hotelling, estadística, distribución, cuadrado, hotelling, importante, porque, presenta, como, distribución, conjunto, estadísticas, generalización, natural, estadísticas, subayacentes, distribución, student, particular, distribución, presenta, e. En estadistica la distribucion T T cuadrado de Hotelling es importante porque se presenta como la distribucion de un conjunto de estadisticas que son una generalizacion natural de las estadisticas subayacentes distribucion t de Student En particular la distribucion se presenta en estadisticas multivariadas en pruebas de diferencias entre las medias multivariadas de diferentes poblaciones donde las pruebas para problemas univariados usarian la Prueba t Es proporcional a la distribucion F La distribucion recibe su nombre de Harold Hotelling quien la desarrollo 1 como una generalizacion de la distribucion t de Student Indice 1 Definicion 2 Estadistica T cuadrado de Hotelling 3 Estadistica T cuadrado de Hotelling para dos muestras 4 Vease tambien 5 Referencias 6 Enlaces externosDefinicion EditarSi el vector d displaystyle d tiene distribucion normal multivariada con media cero y matriz de covarianza unitaria N 0 p I p p displaystyle N boldsymbol 0 p boldsymbol I p p y M displaystyle M es una matriz de tamano p p displaystyle p times p con matriz unitaria escalada y m displaystyle m los grados de libertad con distribucion de Wishart W I p p m displaystyle W boldsymbol I p p m entonces la forma cuadratica X displaystyle X tiene distribucion de Hotelling con parametros p displaystyle p y m displaystyle m X m d T M 1 d T 2 p m displaystyle X md T M 1 d sim T 2 p m Si la variable aleatoria X displaystyle X tiene distribucion T cuadrado de Hotelling con parametros p displaystyle p y m displaystyle m X T p m 2 displaystyle X sim T p m 2 entonces m p 1 p m X F p m p 1 displaystyle frac m p 1 pm X sim F p m p 1 donde F p m p 1 displaystyle F p m p 1 es la distribucion F con parametros p displaystyle ce p y m p 1 displaystyle m p 1 Estadistica T cuadrado de Hotelling EditarLa estadistica T cuadrado de Hotelling es una generalizacion de la estadistica t de Student que se usa en las pruebas de hipotesis multivariadas y se define como sigue 1 Sea N p m S displaystyle mathcal N p boldsymbol mu mathbf Sigma que denota una distribucion normal p variada con vector de medias m displaystyle boldsymbol mu y covarianza S displaystyle mathbf Sigma Sean x 1 x n N p m S displaystyle mathbf x 1 dots mathbf x n sim mathcal N p boldsymbol mu mathbf Sigma n displaystyle n variables aleatorias independientes las cuales pueden representarse como un vector columna de orden p 1 displaystyle p times 1 de numeros reales Definase x x 1 x n n displaystyle overline mathbf x frac mathbf x 1 cdots mathbf x n n como la media muestral Puede demostrarse que n x m S 1 x m x p 2 displaystyle n overline mathbf x boldsymbol mu mathbf Sigma 1 overline mathbf x boldsymbol mathbf mu sim chi p 2 donde x p 2 displaystyle chi p 2 es una distribucion ji cuadrado con p grados de libertad Para demostrar eso se usa el hecho que x N p m S n displaystyle overline mathbf x sim mathcal N p boldsymbol mu mathbf Sigma n y entonces al derivar la funcion caracteristica de la variable aleatoria y n x m S 1 x m displaystyle mathbf y n overline mathbf x boldsymbol mu mathbf Sigma 1 overline mathbf x boldsymbol mathbf mu ϕ y 8 E e i 8 y E e i 8 n x m S 1 x m e i 8 n x m S 1 x m 2 p p 2 S n 1 2 e 1 2 n x m S 1 x m d x 1 d x p 2 p p 2 S n 1 2 e 1 2 n x m S 1 2 i 8 S 1 x m d x 1 d x p S 1 2 i 8 S 1 1 n 1 2 S n 1 2 2 p p 2 S 1 2 i 8 S 1 1 n 1 2 e 1 2 n x m S 1 2 i 8 S 1 x m d x 1 d x p I p 2 i 8 I p 1 2 1 2 i 8 p 2 displaystyle begin aligned phi mathbf y theta amp operatorname E e i theta mathbf y amp operatorname E e i theta n overline mathbf x boldsymbol mu mathbf Sigma 1 overline mathbf x boldsymbol mathbf mu amp int e i theta n overline mathbf x boldsymbol mu mathbf Sigma 1 overline mathbf x boldsymbol mathbf mu 2 pi frac p 2 boldsymbol Sigma n frac 1 2 e frac 1 2 n overline mathbf x boldsymbol mu boldsymbol Sigma 1 overline mathbf x boldsymbol mu dx 1 dx p amp int 2 pi frac p 2 boldsymbol Sigma n frac 1 2 e frac 1 2 n overline mathbf x boldsymbol mu boldsymbol Sigma 1 2i theta boldsymbol Sigma 1 overline mathbf x boldsymbol mu dx 1 dx p amp boldsymbol Sigma 1 2i theta boldsymbol Sigma 1 1 n frac 1 2 boldsymbol Sigma n frac 1 2 int 2 pi frac p 2 boldsymbol Sigma 1 2i theta boldsymbol Sigma 1 1 n frac 1 2 e frac 1 2 n overline mathbf x boldsymbol mu boldsymbol Sigma 1 2i theta boldsymbol Sigma 1 overline mathbf x boldsymbol mu dx 1 dx p amp mathbf I p 2i theta mathbf I p frac 1 2 amp 1 2i theta frac p 2 end aligned Sin embargo S displaystyle mathbf Sigma es por lo general desconocida y se busca hacer una prueba de hipotesis sobre el vector de medias m displaystyle boldsymbol mu Definase W 1 n 1 i 1 n x i x x i x displaystyle mathbf W frac 1 n 1 sum i 1 n mathbf x i overline mathbf x mathbf x i overline mathbf x como la covarianza muestral La traspuesta se ha denotado con un apostrofo Se demuestra que W displaystyle mathbf W es una matriz definida positiva y n 1 W displaystyle n 1 mathbf W sigue una distribucion Wishart p variada con n 1 grados de libertad 2 La estadistica T cuadrado de Hotelling se define entonces como t 2 n x m W 1 x m displaystyle t 2 n overline mathbf x boldsymbol mu mathbf W 1 overline mathbf x boldsymbol mathbf mu porque se demuestra que cita requerida t 2 T p n 1 2 displaystyle t 2 sim T p n 1 2 es decir n p p n 1 t 2 F p n p displaystyle frac n p p n 1 t 2 sim F p n p donde F p n p displaystyle F p n p es una distribucion F displaystyle F con parametros p displaystyle p y n p displaystyle n p Para calcular un p valor multiplique la estadistica t2 y la constante anterior y use la distribucion F displaystyle F Estadistica T cuadrado de Hotelling para dos muestras EditarSi x 1 x n x N p m V displaystyle mathbf x 1 dots mathbf x n x sim N p boldsymbol mu mathbf V y y 1 y n y N p m V displaystyle mathbf y 1 dots mathbf y n y sim N p boldsymbol mu mathbf V con the samples independently drawn from two independent multivariate normal distributions con la misma media y covarianza y definimos x 1 n x i 1 n x x i y 1 n y i 1 n y y i displaystyle overline mathbf x frac 1 n x sum i 1 n x mathbf x i qquad overline mathbf y frac 1 n y sum i 1 n y mathbf y i como las medias muestrales y W i 1 n x x i x x i x i 1 n y y i y y i y n x n y 2 displaystyle mathbf W frac sum i 1 n x mathbf x i overline mathbf x mathbf x i overline mathbf x sum i 1 n y mathbf y i overline mathbf y mathbf y i overline mathbf y n x n y 2 como el estinador de la matriz de covarianza pooled insesgado the unbiased pooled covariance matrix estimate then Hotelling s two sample T squared statistic is t 2 n x n y n x n y x y W 1 x y T 2 p n x n y 2 displaystyle t 2 frac n x n y n x n y overline mathbf x overline mathbf y mathbf W 1 overline mathbf x overline mathbf y sim T 2 p n x n y 2 and it can be related to the F distribution by 2 n x n y p 1 n x n y 2 p t 2 F p n x n y 1 p displaystyle frac n x n y p 1 n x n y 2 p t 2 sim F p n x n y 1 p The non null distribution of this statistic is the noncentral F distribution the ratio of a non central Chi squared random variable and an independent central Chi squared random variable n x n y p 1 n x n y 2 p t 2 F p n x n y 1 p d displaystyle frac n x n y p 1 n x n y 2 p t 2 sim F p n x n y 1 p delta with d n x n y n x n y n V 1 n displaystyle delta frac n x n y n x n y boldsymbol nu mathbf V 1 boldsymbol nu where n displaystyle boldsymbol nu is the difference vector between the population means Vease tambien EditarStudent s t test in univariate statistics Student s t distribution in univariate probability theory Multivariate Student distribution F distribution commonly tabulated or available in software libraries and hence used for testing the T squared statistic using the relationship given above Wilks lambda distribution in multivariate statistics Wilks s L is to Hotelling s T2 as Snedecor s F is to Student s t in univariate statistics Referencias Editar a b Hotelling H 1931 The generalization of Student s ratio Annals of Mathematical Statistics 2 3 360 378 doi 10 1214 aoms 1177732979 a b K V Mardia J T Kent and J M Bibby 1979 Multivariate Analysis Academic Press Enlaces externos EditarPlantilla SpringerEOMPlantilla ProbDistributions Plantilla Common univariate probability distributions Datos Q1393230Obtenido de https es wikipedia org w index php title Distribucion T de Hotelling amp oldid 134699143, wikipedia, wiki, leyendo, leer, libro, biblioteca,