fbpx
Wikipedia

Contraste de hipótesis

Dentro de la inferencia estadística, un contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es un procedimiento para juzgar si una propiedad que se supone en una población estadística es compatible con lo observado en una muestra de dicha población. Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson.

Mediante esta teoría, se aborda el problema estadístico considerando una hipótesis determinada y una hipótesis alternativa , y se intenta dirimir cuál de las dos es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto número de experimentos.

Está fuertemente asociada al concepto estadístico de potencia y a los conceptos de errores de tipo I y II, que definen respectivamente, la posibilidad de tomar un suceso verdadero como falso, o uno falso como verdadero.

Los tipos más importantes son los test centrados, de hipótesis y alternativa simple, aleatorizados, etc. Dentro de los tests no paramétricos, el más extendido es probablemente el test de la U de Mann-Whitney.

Introducción

Si sospechamos que una moneda ha sido trucada para que se produzcan más caras que cruces al lanzarla al aire, podríamos realizar 30 lanzamientos, tomando nota del número de caras obtenidas. Si obtenemos un valor demasiado alto, por ejemplo 25 o más, consideraríamos que el resultado es poco compatible con la hipótesis de que la moneda no está trucada, y concluiríamos que las observaciones contradicen dicha hipótesis.

La aplicación de cálculos probabilísticos permite determinar a partir de qué valor debemos rechazar la hipótesis garantizando que la probabilidad de cometer un error es un valor conocido a priori. Las hipótesis pueden clasificarse en dos grupos, según:

  1. Especifiquen un valor concreto o un intervalo para los parámetros del modelo.
  2. Determinen el tipo de distribución de probabilidad que ha generado los datos.

Un ejemplo del primer grupo es la hipótesis de que la media de una variable es 10, y del segundo que la distribución de probabilidad es la distribución normal.

Aunque la metodología para realizar el contraste de hipótesis es análoga en ambos casos, distinguir ambos tipos de hipótesis es importante puesto que muchos problemas de contraste de hipótesis respecto a un parámetro son, en realidad, problemas de estimación, que tienen una respuesta complementaria dando un intervalo de confianza (o conjunto de intervalos de confianza) para dicho parámetro. Sin embargo, las hipótesis respecto a la forma de la distribución se suelen utilizar para validar un modelo estadístico para un fenómeno aleatorio que se está estudiando.

Planteamiento clásico del contraste de hipótesis

Se denomina hipótesis nula   a la hipótesis que se desea contrastar. El nombre de "nula" significa “sin valor, efecto o consecuencia”, lo cual sugiere que   debe identificarse con la hipótesis de no cambio (a partir de la opinión actual); no diferencia, no mejora, etc.   representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto, en el sentido de “neutra”. La hipótesis   nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hipótesis de que dos poblaciones tienen la misma media puede ser rechazada fácilmente cuando ambas difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser "demostrada" mediante muestreo, puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad   lo suficientemente pequeña para que no pueda ser detectada, aunque la muestra sea muy grande.

A partir de una muestra de la población en estudio, se extrae un estadístico (esto es, un valor que es función de la muestra) cuya distribución de probabilidad esté relacionada con la hipótesis en estudio y sea conocida. Se toma entonces como región de rechazo al conjunto de valores que es más improbable bajo la hipótesis, esto es, el conjunto de valores para el que rechazaremos la hipótesis nula si el valor del estadístico observado entra dentro de él.

La probabilidad de que se obtenga un valor del estadístico que entre en la región de rechazo aun siendo cierta la hipótesis puede calcularse. De esta manera, se puede escoger dicha región de tal forma que la probabilidad de cometer este error sea suficientemente pequeña.

Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la población es el conjunto de los treinta lanzamientos a realizar, el estadístico escogido es el número total de caras obtenidas, y la región de rechazo está constituida por los números totales de caras iguales o superiores a 25. La probabilidad de cometer el error de admitir que la moneda está trucada a pesar de que no lo está es igual a la probabilidad binomial de tener 25 "éxitos" o más en una serie de 30 ensayos de Bernoulli con probabilidad de "éxito" 0,5 en cada uno, entonces: 0,0002, pues existe la posibilidad, aunque poco probable, que la muestra nos dé más de 25 caras sin haber sido la moneda trucada.

Procedimientos de prueba

Un procedimiento de prueba es una regla con base en datos muestrales, para determinar si se rechaza  .

Ejemplo
Una prueba de  : p = 0.10 contra  : p < 0.10, podría estar basada en el examen de una muestra aleatoria de n = 200 objetos. Representamos con X el número de objetos defectuosos de la muestra, una variable aleatoria binomial; x representa el valor observado de X. Si   es verdadera, E(X) = np = 200*(0.10) = 20, mientras, podemos esperar menos de 20 objetos defectuosos si   es verdadera. Un valor de x ligeramente debajo de 20 no contradice de manera contundente a   así que es razonable rechazar   solo si x es considerablemente menor que 20. Un procedimiento de prueba es rechazar   si x≤15 y no rechazar   de otra forma. En este caso, la región de rechazo está formada por x = 0, 1, 2, …, y 15.   no será rechazada si x= 16, 17,…, 199 o 200.

Un procedimiento de prueba se especifica por lo siguiente:

  1. Un estadístico de prueba: una función de los datos muestrales en los cuales se basa la decisión de rechazar   o no rechazar  .
  2. Una región de rechazo, el conjunto de todos los valores del estadístico de prueba para los cuales   será rechazada.

Entonces, la hipótesis nula será rechazada si y solo si el valor observado o calculado del estadístico de prueba se ubica en la región de rechazo

En el mejor de los casos podrían desarrollarse procedimientos de prueba para los cuales ningún tipo de error es posible. Pero esto puede alcanzarse solo si una decisión se basa en un examen de toda la población, lo que casi nunca es práctico. La dificultad al usar un procedimiento basado en datos muestrales es que debido a la variabilidad en el muestreo puede resultar una muestra no representativa.

Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error es pequeña. La elección de un valor particular de corte de la región de rechazo fija las probabilidades de errores tipo I y II. Estas probabilidades de error son representadas por α y β, respectivamente.

Enfoque actual de los contrastes de hipótesis

El enfoque actual considera siempre una hipótesis alternativa a la hipótesis nula. De manera explícita o implícita, la hipótesis nula, a la que se denota habitualmente por  , se enfrenta a otra hipótesis que denominaremos hipótesis alternativa y que se denota  . En los casos en los que no se especifica   de manera explícita, podemos considerar que ha quedado definida implícitamente como “  es falsa”.

Si por ejemplo deseamos comprobar la hipótesis de que dos distribuciones tienen la misma media, estamos implícitamente considerando como hipótesis alternativa “ambas poblaciones tienen distinta media”. Podemos, sin embargo considerar casos en los que   no es la simple negación de  . Supongamos por ejemplo que sospechamos que en un juego de azar con un dado, este está trucado para obtener 6. Nuestra hipótesis nula podría ser “el dado no está trucado” que intentaremos contrastar, a partir de una muestra de lanzamientos realizados, contra la hipótesis alternativa “el dado ha sido trucado a favor del 6”. Cabría realizar otras hipótesis, pero, a los efectos del estudio que se pretende realizar, no se consideran relevantes.

Un test de hipótesis se entiende, en el enfoque moderno, como una función de la muestra, corrientemente basada en un estadístico. Supongamos que se tiene una muestra   de una población en estudio y que se han formulado hipótesis sobre un parámetro   relacionado con la distribución estadística de la población. Supongamos que se dispone de un estadístico   cuya distribución con respecto a  ,   se conoce. Supongamos, también, que las hipótesis nula y alternativa tienen la formulación siguiente:

 

Un contraste, prueba o test para dichas hipótesis sería una función de la muestra de la siguiente forma:

 

Donde   significa que debemos rechazar la hipótesis nula,   (aceptar  ) y  , que debemos aceptar   (o que no hay evidencia estadística contra  ). A   se la denomina región de rechazo. En esencia, para construir el test deseado, basta con escoger el estadístico del contraste   y la región de rechazo  .

Se escoge   de tal manera que la probabilidad de que T(X) caiga en su interior sea baja cuando se da  .

Errores en el contraste

Una vez realizado el contraste de hipótesis, se habrá optado por una de las dos hipótesis,   o  , y la decisión escogida coincidirá o no con la que en realidad es cierta. Se pueden dar los cuatro casos que se exponen en el siguiente cuadro:

  es cierta   es cierta
Se escogió   No hay error Error de tipo II
Se escogió   Error de tipo I No hay error

Si la probabilidad de cometer un error de tipo I está unívocamente determinada, su valor se suele denotar por la letra griega α, y en las mismas condiciones, se denota por β la probabilidad de cometer el error de tipo II, esto es:

 

En este caso, se denomina Potencia del contraste al valor 1-β, esto es, a la probabilidad de escoger   cuando ésta es cierta

 .

Cuando es necesario diseñar un contraste de hipótesis, sería deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequeñas como fuera posible. Sin embargo, con una muestra de tamaño prefijado, disminuir la probabilidad del error de tipo I, α, conduce a incrementar la probabilidad del error de tipo II, β.

Usualmente, se diseñan los contrastes de tal manera que la probabilidad α sea el 5% (0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones más relajadas o más estrictas. El recurso para aumentar la potencia del contraste, esto es, disminuir β, probabilidad de error de tipo II, es aumentar el tamaño muestral, lo que en la práctica conlleva un incremento de los costes del estudio que se quiere realizar.

Contraste más potente

El concepto de potencia nos permite valorar cual entre dos contrastes con la misma probabilidad de error de tipo I, α, es preferible. Si se trata de contrastar dos hipótesis sencillas sobre un parámetro desconocido, θ, del tipo:

 

Se trata de escoger entre todos los contrastes posibles con α prefijado aquel que tiene mayor potencia, esto es, menor probabilidad β de incurrir en el error de tipo II.

En este caso el Lema de Neyman-Pearson garantiza la existencia de un contraste de máxima potencia y determina cómo construirlo.

Contraste uniformemente más potente

En el caso de que las hipótesis sean compuestas, esto es, que no se limiten a especificar un único posible valor del parámetro, sino que sean del tipo:

 

donde   y   son conjuntos de varios posibles valores, las probabilidades α y β ya no están unívocamente determinadas, sino que tomarán diferentes valores según los distintos valores posibles de θ. En este caso se dice que un contraste   tiene tamaño α si

 

esto es, si la máxima probabilidad de cometer un error de tipo I cuando la hipótesis nula es cierta es α. En estas circunstancias, se puede considerar β como una función de θ, puesto que para cada posible valor de θ en la hipótesis alternativa se tendría una probabilidad distinta de cometer un error de tipo II. Se define

 

la función de potencia del contraste, y la probabilidad de error tipo II es entonces

 

esto es, la probabilidad de aceptar la hipótesis nula para cada valor posible de θ dentro de los valores posibles para la hipótesis alternativa.g

Se dice que un contraste es uniformemente más potente de tamaño α cuando, para todo valor     es mayor o igual que el de cualquier otro contraste del mismo tamaño. En resumen, se trata de un contraste que garantiza la máxima potencia para todos los valores de θ en la hipótesis alternativa.

Es claro que el caso del contraste uniformemente más potente para hipótesis compuestas exige el cumplimiento de condiciones más exigentes que en el caso del contraste más potente para hipótesis simples. Por ello, no existe un equivalente al Lema de Neyman-Pearson para el caso general.

Sin embargo, sí existen muchas condiciones en las que, cumpliéndose determinadas propiedades de las distribuciones de probabilidad implicadas y para ciertos tipos de hipótesis, se puede extender el Lema para obtener el contraste uniformemente más potente del tamaño que se desee.

Aplicaciones de los contrastes de hipótesis

Los contrastes de hipótesis, como la inferencia estadística en general, son herramientas de amplio uso en la ciencia en general. En particular, la moderna Filosofía de la ciencia desarrolla el concepto de falsabilidad de las teorías científicas basándose en los conceptos de la inferencia estadística en general y de los contrastes de hipótesis. En este contexto, cuando se desea optar entre dos posibles teorías científicas para un mismo fenómeno (dos hipótesis) se debe realizar un contraste estadístico a partir de los datos disponibles sobre el fenómeno que permitan optar por una u otra.

Las técnicas de contraste de hipótesis son también de amplia aplicación en muchos otros casos, como ensayos clínicos de nuevos medicamentos, control de calidad, encuestas, etcétera.

Test estadísticos

Nombre Fórmula Notas
Test-z para una muestra   (Población distribuida normal o n > 30) y σ conocida.

(z es la distancia desde la media en relación con la desviación estándar de la media). Para distribuciones no normales es posible calcular una proporción mínima de una población que cae dentro de k desviaciones estándar para cualquier k.

Test-z para dos muestras   Población normal y observaciones independientes con σ1 y σ2 conocidas
Una muestra t-test  

 

(Población normal o n > 30) y   desconocida
t-test parejado  

 

(Población normal de diferencias o n > 30) y   desconocida o pequeña muestra de tamaño n < 30
Dos muestras combinadas t-test, varianzas iguales  

 
 [1]

(Poblaciones normales o n1 + n2 > 40) y observaciones independientes y σ1 = σ2 desconocido
Dos muestras no combinadas t-test, varianzas desiguales  

 [1]

(Poblaciones normales o n1 + n2 > 40) y observaciones independientes y σ1 ≠ σ2 ambas desconocidas
Una proporción z-test   n .p0 > 10 and n (1 − p0) > 10 y es una muestra aleatoria simple, véase distribución binomial.
Dos proporciones z-test, combinadas por    

 

n1 p1 > 5 y n1(1 − p1) > 5 y n2 p2 > 5 y n2(1 − p2) > 5 y observaciones independientes, véase la aproximación normal de la distribución binomial.
Dos proporciones z-test, descombinadas por     n1 p1 > 5 y n1(1 − p1) > 5 y n2 p2 > 5 y n2(1 − p2) > 5 y observaciones independientes, véase la aproximación normal de la distribución binomial.
Test de la chi cuadrado para la varianza   Población normal
Test de la chi cuadrado para la bondad de ajuste   df = k - 1 - # parámetros estimados, y uno de ellos debe tenerse.
Test de la F de Snedecor para dos muestras para la igualdad de varianzas   Poblaciones normales
Cumpla que   y rechace H0 para  [2]
Test de la regresión t-test de     *Restar 1 por variable dependiente; k es el número de variables independientes.
Reject H0 for  [3]
En general, el subíndice 0 indica un valor dado de la hipótesis nula, H0, la cual debe ser usada tanto como sea posible en la construcción del test estadístico. ... Definiciones de otros símbolos:
  •  , la probabilidad del erro tipo I (rechazando una hipótesis nula cuando es en realidad cierta)
  •   = tamaño de la muestra
  •   = tamaño de la muestra 1
  •   = tamaño de la muestra 2
  •   = media de la muestra
  •   = media de la población hipotética
  •   = media de la población 1
  •   = media de la población 2
  •   = desviación de la población
  •   = varianza poblacional
  •   = Desviación estándar de la muestra
  •   = Suma (de números k)
  •   = Varianza de la muestra
  •   = Desviación estándar de la muestra 1
  •   = Desviación estándar de la muestra 2
  •   = t de Student
  •   = Grados de libertad
  •   = Diferencias de las medias de las muestras
  •   = Diferencia de las medias poblacionales hipotéticas
  •   = Diferencias de las desviaciones estándares
  •   = Estadístico chi-cuadrado
  •   = x/n = proporción muestra/proporción, a menos que se especifique otra manera
  •   = proporción de la población hipotética
  •   = proporción 1
  •   = proporción 2
  •   = Diferencia hipotética en la proporción
  •   = Mínimo de n1 y n2
  •  
  •  
  •   = Estadístico F

Véase también

Referencias

  1. NIST handbook: Two-Sample t-Test for Equal Means
  2. NIST handbook: F-Test for Equality of Two Standard Deviations (Testing standard deviations the same as testing variances)
  3. Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill, 1960, page 288.)

Enlaces externos

  • HESTADIS - Cálculo del contraste de hipótesis para la media con varianza poblacional conocida (gratuito)
  • Carlos Reynoso - Atolladeros del pensamiento aleatorio: Batallas en torno de la prueba estadística.
  •   Datos: Q210832
  •   Multimedia: Hypothesis testing

contraste, hipótesis, dentro, inferencia, estadística, contraste, hipótesis, también, denominado, test, hipótesis, prueba, significación, procedimiento, para, juzgar, propiedad, supone, población, estadística, compatible, observado, muestra, dicha, población, . Dentro de la inferencia estadistica un contraste de hipotesis tambien denominado test de hipotesis o prueba de significacion es un procedimiento para juzgar si una propiedad que se supone en una poblacion estadistica es compatible con lo observado en una muestra de dicha poblacion Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson Mediante esta teoria se aborda el problema estadistico considerando una hipotesis determinada H 0 displaystyle H 0 y una hipotesis alternativa H 1 displaystyle H 1 y se intenta dirimir cual de las dos es la hipotesis verdadera tras aplicar el problema estadistico a un cierto numero de experimentos Esta fuertemente asociada al concepto estadistico de potencia y a los conceptos de errores de tipo I y II que definen respectivamente la posibilidad de tomar un suceso verdadero como falso o uno falso como verdadero Los tipos mas importantes son los test centrados de hipotesis y alternativa simple aleatorizados etc Dentro de los tests no parametricos el mas extendido es probablemente el test de la U de Mann Whitney Indice 1 Introduccion 2 Planteamiento clasico del contraste de hipotesis 3 Procedimientos de prueba 4 Enfoque actual de los contrastes de hipotesis 5 Errores en el contraste 5 1 Contraste mas potente 5 2 Contraste uniformemente mas potente 6 Aplicaciones de los contrastes de hipotesis 7 Test estadisticos 8 Vease tambien 9 Referencias 10 Enlaces externosIntroduccion EditarSi sospechamos que una moneda ha sido trucada para que se produzcan mas caras que cruces al lanzarla al aire podriamos realizar 30 lanzamientos tomando nota del numero de caras obtenidas Si obtenemos un valor demasiado alto por ejemplo 25 o mas considerariamos que el resultado es poco compatible con la hipotesis de que la moneda no esta trucada y concluiriamos que las observaciones contradicen dicha hipotesis La aplicacion de calculos probabilisticos permite determinar a partir de que valor debemos rechazar la hipotesis garantizando que la probabilidad de cometer un error es un valor conocido a priori Las hipotesis pueden clasificarse en dos grupos segun Especifiquen un valor concreto o un intervalo para los parametros del modelo Determinen el tipo de distribucion de probabilidad que ha generado los datos Un ejemplo del primer grupo es la hipotesis de que la media de una variable es 10 y del segundo que la distribucion de probabilidad es la distribucion normal Aunque la metodologia para realizar el contraste de hipotesis es analoga en ambos casos distinguir ambos tipos de hipotesis es importante puesto que muchos problemas de contraste de hipotesis respecto a un parametro son en realidad problemas de estimacion que tienen una respuesta complementaria dando un intervalo de confianza o conjunto de intervalos de confianza para dicho parametro Sin embargo las hipotesis respecto a la forma de la distribucion se suelen utilizar para validar un modelo estadistico para un fenomeno aleatorio que se esta estudiando Planteamiento clasico del contraste de hipotesis EditarSe denomina hipotesis nula H 0 displaystyle H 0 a la hipotesis que se desea contrastar El nombre de nula significa sin valor efecto o consecuencia lo cual sugiere que H 0 displaystyle H 0 debe identificarse con la hipotesis de no cambio a partir de la opinion actual no diferencia no mejora etc H 0 displaystyle H 0 representa la hipotesis que mantendremos a no ser que los datos indiquen su falsedad y puede entenderse por tanto en el sentido de neutra La hipotesis H 0 displaystyle H 0 nunca se considera probada aunque puede ser rechazada por los datos Por ejemplo la hipotesis de que dos poblaciones tienen la misma media puede ser rechazada facilmente cuando ambas difieren mucho analizando muestras suficientemente grandes de ambas poblaciones pero no puede ser demostrada mediante muestreo puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad d displaystyle delta lo suficientemente pequena para que no pueda ser detectada aunque la muestra sea muy grande A partir de una muestra de la poblacion en estudio se extrae un estadistico esto es un valor que es funcion de la muestra cuya distribucion de probabilidad este relacionada con la hipotesis en estudio y sea conocida Se toma entonces como region de rechazo al conjunto de valores que es mas improbable bajo la hipotesis esto es el conjunto de valores para el que rechazaremos la hipotesis nula si el valor del estadistico observado entra dentro de el La probabilidad de que se obtenga un valor del estadistico que entre en la region de rechazo aun siendo cierta la hipotesis puede calcularse De esta manera se puede escoger dicha region de tal forma que la probabilidad de cometer este error sea suficientemente pequena Siguiendo con el anterior ejemplo de la moneda trucada la muestra de la poblacion es el conjunto de los treinta lanzamientos a realizar el estadistico escogido es el numero total de caras obtenidas y la region de rechazo esta constituida por los numeros totales de caras iguales o superiores a 25 La probabilidad de cometer el error de admitir que la moneda esta trucada a pesar de que no lo esta es igual a la probabilidad binomial de tener 25 exitos o mas en una serie de 30 ensayos de Bernoulli con probabilidad de exito 0 5 en cada uno entonces 0 0002 pues existe la posibilidad aunque poco probable que la muestra nos de mas de 25 caras sin haber sido la moneda trucada Procedimientos de prueba EditarUn procedimiento de prueba es una regla con base en datos muestrales para determinar si se rechaza H 0 displaystyle H 0 Ejemplo Una prueba de H 0 displaystyle H 0 p 0 10 contra H 1 displaystyle H 1 p lt 0 10 podria estar basada en el examen de una muestra aleatoria de n 200 objetos Representamos con X el numero de objetos defectuosos de la muestra una variable aleatoria binomial x representa el valor observado de X Si H 0 displaystyle H 0 es verdadera E X np 200 0 10 20 mientras podemos esperar menos de 20 objetos defectuosos si H 1 displaystyle H 1 es verdadera Un valor de x ligeramente debajo de 20 no contradice de manera contundente a H 0 displaystyle H 0 asi que es razonable rechazar H 0 displaystyle H 0 solo si x es considerablemente menor que 20 Un procedimiento de prueba es rechazar H 0 displaystyle H 0 si x 15 y no rechazar H 0 displaystyle H 0 de otra forma En este caso la region de rechazo esta formada por x 0 1 2 y 15 H 0 displaystyle H 0 no sera rechazada si x 16 17 199 o 200 Un procedimiento de prueba se especifica por lo siguiente Un estadistico de prueba una funcion de los datos muestrales en los cuales se basa la decision de rechazar H 0 displaystyle H 0 o no rechazar H 0 displaystyle H 0 Una region de rechazo el conjunto de todos los valores del estadistico de prueba para los cuales H 0 displaystyle H 0 sera rechazada Entonces la hipotesis nula sera rechazada si y solo si el valor observado o calculado del estadistico de prueba se ubica en la region de rechazoEn el mejor de los casos podrian desarrollarse procedimientos de prueba para los cuales ningun tipo de error es posible Pero esto puede alcanzarse solo si una decision se basa en un examen de toda la poblacion lo que casi nunca es practico La dificultad al usar un procedimiento basado en datos muestrales es que debido a la variabilidad en el muestreo puede resultar una muestra no representativa Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error es pequena La eleccion de un valor particular de corte de la region de rechazo fija las probabilidades de errores tipo I y II Estas probabilidades de error son representadas por a y b respectivamente Enfoque actual de los contrastes de hipotesis EditarEl enfoque actual considera siempre una hipotesis alternativa a la hipotesis nula De manera explicita o implicita la hipotesis nula a la que se denota habitualmente por H 0 displaystyle H 0 se enfrenta a otra hipotesis que denominaremos hipotesis alternativa y que se denota H 1 displaystyle H 1 En los casos en los que no se especifica H 1 displaystyle H 1 de manera explicita podemos considerar que ha quedado definida implicitamente como H 0 displaystyle H 0 es falsa Si por ejemplo deseamos comprobar la hipotesis de que dos distribuciones tienen la misma media estamos implicitamente considerando como hipotesis alternativa ambas poblaciones tienen distinta media Podemos sin embargo considerar casos en los que H 1 displaystyle H 1 no es la simple negacion de H 0 displaystyle H 0 Supongamos por ejemplo que sospechamos que en un juego de azar con un dado este esta trucado para obtener 6 Nuestra hipotesis nula podria ser el dado no esta trucado que intentaremos contrastar a partir de una muestra de lanzamientos realizados contra la hipotesis alternativa el dado ha sido trucado a favor del 6 Cabria realizar otras hipotesis pero a los efectos del estudio que se pretende realizar no se consideran relevantes Un test de hipotesis se entiende en el enfoque moderno como una funcion de la muestra corrientemente basada en un estadistico Supongamos que se tiene una muestra X X 1 X 2 X n t displaystyle X left X 1 X 2 X n right t de una poblacion en estudio y que se han formulado hipotesis sobre un parametro 8 displaystyle theta relacionado con la distribucion estadistica de la poblacion Supongamos que se dispone de un estadistico T X displaystyle T X cuya distribucion con respecto a 8 displaystyle theta F 8 t displaystyle F theta t se conoce Supongamos tambien que las hipotesis nula y alternativa tienen la formulacion siguiente H 0 8 8 0 H 1 8 8 1 displaystyle left begin matrix H 0 theta in Theta 0 H 1 theta in Theta 1 end matrix right Un contraste prueba o test para dichas hipotesis seria una funcion de la muestra de la siguiente forma ϕ X 1 si T X W 0 si T X W displaystyle phi X left begin matrix 1 mbox si T X in Omega 0 mbox si T X notin Omega end matrix right Donde ϕ X 1 displaystyle phi X 1 significa que debemos rechazar la hipotesis nula H 0 displaystyle H 0 aceptar H 1 displaystyle H 1 y ϕ X 0 displaystyle phi X 0 que debemos aceptar H 0 displaystyle H 0 o que no hay evidencia estadistica contra H 0 displaystyle H 0 A W displaystyle Omega se la denomina region de rechazo En esencia para construir el test deseado basta con escoger el estadistico del contraste T X displaystyle T X y la region de rechazo W displaystyle Omega Se escoge W displaystyle Omega de tal manera que la probabilidad de que T X caiga en su interior sea baja cuando se da H 0 displaystyle H 0 Errores en el contraste EditarArticulo principal Errores de tipo I y de tipo II Una vez realizado el contraste de hipotesis se habra optado por una de las dos hipotesis H 0 displaystyle H 0 o H 1 displaystyle H 1 y la decision escogida coincidira o no con la que en realidad es cierta Se pueden dar los cuatro casos que se exponen en el siguiente cuadro H 0 displaystyle H 0 es cierta H 1 displaystyle H 1 es ciertaSe escogio H 0 displaystyle H 0 No hay error Error de tipo IISe escogio H 1 displaystyle H 1 Error de tipo I No hay errorSi la probabilidad de cometer un error de tipo I esta univocamente determinada su valor se suele denotar por la letra griega a y en las mismas condiciones se denota por b la probabilidad de cometer el error de tipo II esto es P escoger H 1 H 0 es cierta a P escoger H 0 H 1 es cierta b displaystyle begin matrix P mbox escoger H 1 H 0 mbox es cierta alpha P mbox escoger H 0 H 1 mbox es cierta beta end matrix En este caso se denomina Potencia del contraste al valor 1 b esto es a la probabilidad de escoger H 1 displaystyle H 1 cuando esta es cierta P escoger H 1 H 1 es cierta 1 b displaystyle P mbox escoger H 1 H 1 mbox es cierta 1 beta Cuando es necesario disenar un contraste de hipotesis seria deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequenas como fuera posible Sin embargo con una muestra de tamano prefijado disminuir la probabilidad del error de tipo I a conduce a incrementar la probabilidad del error de tipo II b Usualmente se disenan los contrastes de tal manera que la probabilidad a sea el 5 0 05 aunque a veces se usan el 10 0 1 o 1 0 01 para adoptar condiciones mas relajadas o mas estrictas El recurso para aumentar la potencia del contraste esto es disminuir b probabilidad de error de tipo II es aumentar el tamano muestral lo que en la practica conlleva un incremento de los costes del estudio que se quiere realizar Contraste mas potente Editar El concepto de potencia nos permite valorar cual entre dos contrastes con la misma probabilidad de error de tipo I a es preferible Si se trata de contrastar dos hipotesis sencillas sobre un parametro desconocido 8 del tipo H 0 8 8 0 H 1 8 8 1 displaystyle left begin matrix H 0 theta theta 0 H 1 theta theta 1 end matrix right Se trata de escoger entre todos los contrastes posibles con a prefijado aquel que tiene mayor potencia esto es menor probabilidad b de incurrir en el error de tipo II En este caso el Lema de Neyman Pearson garantiza la existencia de un contraste de maxima potencia y determina como construirlo Contraste uniformemente mas potente Editar En el caso de que las hipotesis sean compuestas esto es que no se limiten a especificar un unico posible valor del parametro sino que sean del tipo H 0 8 8 0 H 1 8 8 1 displaystyle left begin matrix H 0 theta in Theta 0 H 1 theta in Theta 1 end matrix right donde 8 0 displaystyle Theta 0 y 8 1 displaystyle Theta 1 son conjuntos de varios posibles valores las probabilidades a y b ya no estan univocamente determinadas sino que tomaran diferentes valores segun los distintos valores posibles de 8 En este caso se dice que un contraste ϕ X displaystyle phi X tiene tamano a si a max 8 8 0 P 8 ϕ X 1 displaystyle alpha max theta in Theta 0 P theta phi X 1 esto es si la maxima probabilidad de cometer un error de tipo I cuando la hipotesis nula es cierta es a En estas circunstancias se puede considerar b como una funcion de 8 puesto que para cada posible valor de 8 en la hipotesis alternativa se tendria una probabilidad distinta de cometer un error de tipo II Se define Pot 8 P 8 ϕ X 1 8 8 1 displaystyle operatorname Pot theta P theta phi X 1 quad forall theta in Theta 1 la funcion de potencia del contraste y la probabilidad de error tipo II es entonces b 8 1 Pot 8 8 8 1 displaystyle beta theta 1 operatorname Pot theta quad forall theta in Theta 1 esto es la probabilidad de aceptar la hipotesis nula para cada valor posible de 8 dentro de los valores posibles para la hipotesis alternativa gSe dice que un contraste es uniformemente mas potente de tamano a cuando para todo valor 8 8 1 displaystyle theta in Theta 1 Pot 8 displaystyle operatorname Pot theta es mayor o igual que el de cualquier otro contraste del mismo tamano En resumen se trata de un contraste que garantiza la maxima potencia para todos los valores de 8 en la hipotesis alternativa Es claro que el caso del contraste uniformemente mas potente para hipotesis compuestas exige el cumplimiento de condiciones mas exigentes que en el caso del contraste mas potente para hipotesis simples Por ello no existe un equivalente al Lema de Neyman Pearson para el caso general Sin embargo si existen muchas condiciones en las que cumpliendose determinadas propiedades de las distribuciones de probabilidad implicadas y para ciertos tipos de hipotesis se puede extender el Lema para obtener el contraste uniformemente mas potente del tamano que se desee Aplicaciones de los contrastes de hipotesis EditarLos contrastes de hipotesis como la inferencia estadistica en general son herramientas de amplio uso en la ciencia en general En particular la moderna Filosofia de la ciencia desarrolla el concepto de falsabilidad de las teorias cientificas basandose en los conceptos de la inferencia estadistica en general y de los contrastes de hipotesis En este contexto cuando se desea optar entre dos posibles teorias cientificas para un mismo fenomeno dos hipotesis se debe realizar un contraste estadistico a partir de los datos disponibles sobre el fenomeno que permitan optar por una u otra Las tecnicas de contraste de hipotesis son tambien de amplia aplicacion en muchos otros casos como ensayos clinicos de nuevos medicamentos control de calidad encuestas etcetera Test estadisticos EditarNombre Formula NotasTest z para una muestra z x m 0 s n displaystyle z frac overline x mu 0 sigma sqrt n Poblacion distribuida normal o n gt 30 y s conocida z es la distancia desde la media en relacion con la desviacion estandar de la media Para distribuciones no normales es posible calcular una proporcion minima de una poblacion que cae dentro de k desviaciones estandar para cualquier k Test z para dos muestras z x 1 x 2 d 0 s 1 2 n 1 s 2 2 n 2 displaystyle z frac overline x 1 overline x 2 d 0 sqrt frac sigma 1 2 n 1 frac sigma 2 2 n 2 Poblacion normal y observaciones independientes con s1 y s2 conocidasUna muestra t test t x m 0 s n displaystyle t frac overline x mu 0 s sqrt n d f n 1 displaystyle df n 1 Poblacion normal o n gt 30 y s displaystyle sigma desconocidat test parejado t d d 0 s d n displaystyle t frac overline d d 0 s d sqrt n d f n 1 displaystyle df n 1 Poblacion normal de diferencias o n gt 30 y s displaystyle sigma desconocida o pequena muestra de tamano n lt 30Dos muestras combinadas t test varianzas iguales t x 1 x 2 d 0 s p 1 n 1 1 n 2 displaystyle t frac overline x 1 overline x 2 d 0 s p sqrt frac 1 n 1 frac 1 n 2 s p 2 n 1 1 s 1 2 n 2 1 s 2 2 n 1 n 2 2 displaystyle s p 2 frac n 1 1 s 1 2 n 2 1 s 2 2 n 1 n 2 2 d f n 1 n 2 2 displaystyle df n 1 n 2 2 1 Poblaciones normales o n1 n2 gt 40 y observaciones independientes y s1 s2 desconocidoDos muestras no combinadas t test varianzas desiguales t x 1 x 2 d 0 s 1 2 n 1 s 2 2 n 2 displaystyle t frac overline x 1 overline x 2 d 0 sqrt frac s 1 2 n 1 frac s 2 2 n 2 d f s 1 2 n 1 s 2 2 n 2 2 s 1 2 n 1 2 n 1 1 s 2 2 n 2 2 n 2 1 displaystyle df frac left frac s 1 2 n 1 frac s 2 2 n 2 right 2 frac left frac s 1 2 n 1 right 2 n 1 1 frac left frac s 2 2 n 2 right 2 n 2 1 1 Poblaciones normales o n1 n2 gt 40 y observaciones independientes y s1 s2 ambas desconocidasUna proporcion z test z p p 0 p 0 1 p 0 n displaystyle z frac hat p p 0 sqrt p 0 1 p 0 sqrt n n p0 gt 10 and n 1 p0 gt 10 y es una muestra aleatoria simple vease distribucion binomial Dos proporciones z test combinadas por H 0 p 1 p 2 displaystyle H 0 colon p 1 p 2 z p 1 p 2 p 1 p 1 n 1 1 n 2 displaystyle z frac hat p 1 hat p 2 sqrt hat p 1 hat p frac 1 n 1 frac 1 n 2 p x 1 x 2 n 1 n 2 displaystyle hat p frac x 1 x 2 n 1 n 2 n1 p1 gt 5 y n1 1 p1 gt 5 y n2 p2 gt 5 y n2 1 p2 gt 5 y observaciones independientes vease la aproximacion normal de la distribucion binomial Dos proporciones z test descombinadas por d 0 gt 0 displaystyle d 0 gt 0 z p 1 p 2 d 0 p 1 1 p 1 n 1 p 2 1 p 2 n 2 displaystyle z frac hat p 1 hat p 2 d 0 sqrt frac hat p 1 1 hat p 1 n 1 frac hat p 2 1 hat p 2 n 2 n1 p1 gt 5 y n1 1 p1 gt 5 y n2 p2 gt 5 y n2 1 p2 gt 5 y observaciones independientes vease la aproximacion normal de la distribucion binomial Test de la chi cuadrado para la varianza x 2 n 1 s 2 s 0 2 displaystyle chi 2 n 1 frac s 2 sigma 0 2 Poblacion normalTest de la chi cuadrado para la bondad de ajuste x 2 k observed expected 2 expected displaystyle chi 2 sum k frac text observed text expected 2 text expected df k 1 parametros estimados y uno de ellos debe tenerse Test de la F de Snedecor para dos muestras para la igualdad de varianzas F s 1 2 s 2 2 displaystyle F frac s 1 2 s 2 2 Poblaciones normalesCumpla que s 1 2 s 2 2 displaystyle s 1 2 geq s 2 2 y rechace H0 para F gt F a 2 n 1 1 n 2 1 displaystyle F gt F alpha 2 n 1 1 n 2 1 2 Test de la regresion t test de H 0 r 2 0 displaystyle H 0 colon r 2 0 t r 2 n k 1 1 r 2 displaystyle t sqrt frac r 2 n k 1 1 r 2 Restar 1 por variable dependiente k es el numero de variables independientes Reject H0 for t gt t a 2 n k 1 displaystyle t gt t alpha 2 n k 1 3 En general el subindice 0 indica un valor dado de la hipotesis nula H0 la cual debe ser usada tanto como sea posible en la construccion del test estadistico Definiciones de otros simbolos a displaystyle alpha la probabilidad del erro tipo I rechazando una hipotesis nula cuando es en realidad cierta n displaystyle n tamano de la muestra n 1 displaystyle n 1 tamano de la muestra 1 n 2 displaystyle n 2 tamano de la muestra 2 x displaystyle overline x media de la muestra m 0 displaystyle mu 0 media de la poblacion hipotetica m 1 displaystyle mu 1 media de la poblacion 1 m 2 displaystyle mu 2 media de la poblacion 2 s displaystyle sigma desviacion de la poblacion s 2 displaystyle sigma 2 varianza poblacional s displaystyle s Desviacion estandar de la muestra k displaystyle sum k Suma de numeros k s 2 displaystyle s 2 Varianza de la muestra s 1 displaystyle s 1 Desviacion estandar de la muestra 1 s 2 displaystyle s 2 Desviacion estandar de la muestra 2 t displaystyle t t de Student d f displaystyle df Grados de libertad d displaystyle overline d Diferencias de las medias de las muestras d 0 displaystyle d 0 Diferencia de las medias poblacionales hipoteticas s d displaystyle s d Diferencias de las desviaciones estandares x 2 displaystyle chi 2 Estadistico chi cuadrado p displaystyle hat p x n proporcion muestra proporcion a menos que se especifique otra manera p 0 displaystyle p 0 proporcion de la poblacion hipotetica p 1 displaystyle p 1 proporcion 1 p 2 displaystyle p 2 proporcion 2 d p displaystyle d p Diferencia hipotetica en la proporcion min n 1 n 2 displaystyle min n 1 n 2 Minimo de n1 y n2 x 1 n 1 p 1 displaystyle x 1 n 1 p 1 x 2 n 2 p 2 displaystyle x 2 n 2 p 2 F displaystyle F Estadistico FVease tambien EditarErrores de tipo I y de tipo II Estadistica Estadistico muestral Falso negativo Falso positivo Intervalo de confianza Muestreo estadistico Prueba de Kolmogorov Smirnov Prueba de x Chi cuadrado Test de la t de Student o t test Significacion estadistica Diseno experimentalReferencias Editar a b NIST handbook Two Sample t Test for Equal Means NIST handbook F Test for Equality of Two Standard Deviations Testing standard deviations the same as testing variances Steel R G D and Torrie J H Principles and Procedures of Statistics with Special Reference to the Biological Sciences McGraw Hill 1960 page 288 Enlaces externos EditarInferencia estadistica apuntes del Departamento de Matematicas de la Universidad de La Coruna HESTADIS Calculo del contraste de hipotesis para la media con varianza poblacional conocida gratuito Carlos Reynoso Atolladeros del pensamiento aleatorio Batallas en torno de la prueba estadistica Datos Q210832 Multimedia Hypothesis testingObtenido de https es wikipedia org w index php title Contraste de hipotesis amp oldid 134476363, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos