fbpx
Wikipedia

Valor p

En estadística general y contrastes de hipótesis, el valor p (conocido también como p, p-valor, valor de p consignado, o directamente en inglés p-value) se define como la probabilidad de que un valor estadístico calculado sea posible dada una hipótesis nula cierta. En términos simples, el valor p ayuda a diferenciar resultados que son producto del azar del muestreo, de resultados que son estadísticamente significativos.

Si el valor p cumple con la condición de ser menor que un nivel de significancia impuesto arbitrariamente, este se considera como un resultado estadísticamente significativo y, por lo tanto, permite rechazar la hipótesis nula.

Es fundamental reforzar que el valor p está basado en la presunción de que una hipótesis nula (o hipótesis de partida) es cierta. El valor p es por tanto una medida de significación estadística.

Interpretación

 
El valor p es la probabilidad de que el siguiente valor observado sea igual o más extremo que un cierto valor, asumiendo que la hipótesis nula es cierta.

El valor p es un valor de probabilidad, por lo que oscila entre 0 y 1. El valor p nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido suponiendo que la hipótesis nula H0 es cierta. Se suele decir que valores altos de p no permiten rechazar la H0, mientras que valores bajos de p sí permiten rechazar la H0.

En una prueba estadística, se rechaza la hipótesis nula H0 si el valor p asociado al resultado observado es igual o menor que un nivel de significación   establecido arbitrariamente, convencionalmente 0,05 o 0,01. En otras palabras, si el resultado obtenido es más inusual que el rango esperado de resultados dada una hipótesis nula H0 cierta y el nivel de significación   elegido, es decir si p es menor que  , podemos decir que tenemos un resultado estadísticamente significativo que permite rechazar H0.

Es importante recalcar que un contraste de hipótesis no permite aceptar una hipótesis; simplemente la rechaza o no la rechaza, es decir que la tacha de verosímil (lo que no significa obligatoriamente que sea cierta, simplemente que es más probable de serlo) o inverosímil.

Advertencia sobre error por observación atípica

Aunque cuando el valor de p es inferior al nivel de significación  , lo más verosímil es que la hipótesis de partida sea falsa, también es posible que estemos ante una observación atípica. Por eso, estaríamos cometiendo el error estadístico de rechazar la hipótesis nula cuando ésta es cierta, basándonos en que hemos tenido la mala suerte de encontrar una observación atípica. Este tipo de errores se puede subsanar siendo más estrictos y rebajando el máximo valor p esperado; un   de 0,05 es usado en investigaciones habituales sociológicas mientras que un   más bajo de 0,01 se utiliza en investigaciones médicas, en las que cometer un error puede acarrear consecuencias más graves. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida, lo que reduce la posibilidad de que el dato obtenido sea casualmente raro.

Ejemplos

Ejemplo con monedas

Se puede hacer un experimento estadístico para determinar si una moneda es justa (es decir, que la probabilidad de caer en cara o sello sea igual) o injusta (es decir, que la moneda esté arreglada para que uno de los dos resultados sea mucho más frecuente que el otro). Supongamos que lanzamos al aire una moneda 20 veces seguidas, y los resultados experimentales muestran que la moneda cae en cara 14 veces de las 20 lanzadas. ¿Es la moneda justa o injusta?

Para determinarlo, definimos como hipótesis nula «la moneda es justa», y como estadístico de prueba el «número de caras». La probabilidad de que una moneda justa caiga al menos 14 veces en cara si es lanzada 20 veces es el valor p de este experimento. Esta probabilidad puede ser calculada usando coeficientes binomiales, así:[1]


 


Esta probabilidad de 0.058 es el valor p, considerando solo resultados extremos que favorecen las caras, obtenido al aplicar una prueba unilateral. Sin embargo, en una moneda la desviación puede favorecer a caras o cruces. Por esto, usamos una prueba bilateral que simplemente considera la desviación posible en ambas direcciones. Como una moneda justa tiene una distribución binomial simétrica, el valor p bilateral es simplemente el doble del valor p unilateral. Es decir, 0.115.[2]

De esta forma, tenemos que

  • Hipótesis nula (H0): la moneda es justa, con Prob(cara) = 0.5
  • Estadística de prueba: número de caras
  • Observación O: 14 caras en 20 lanzamientos;
  • Nivel de significación   elegido arbitrariamente: 0.05
  • Un valor p bilateral para la observación O dado H0: 0.115

Así, el valor p calculado, 0.115, es mayor que el nivel de significación 0.05, que elegimos. Eso significa que el resultado de 14 caras en 20 lanzamientos no es inverosímil para una moneda justa, estando este resultado dentro del rango de resultados que se obtendría el 95% de las veces que se repita el experimento con una moneda justa. Por esta razón, no se rechaza la hipótesis nula; es decir, asumimos que la moneda es justa.

Nótese que, de obtenerse una sola cara más, es decir, 15 en 20 lanzamientos, el valor p resultante (bilateral) habría sido 0.0414 (4.14%); en este caso, la hipótesis nula tendría que ser rechazada para el nivel de significación elegido de 0.05; es decir, en tal caso asumiríamos que la moneda es injusta.

Ejemplo de situación cotidiana

Supongamos que dos amigos están en un bar y uno le dice a otro que es capaz de distinguir un whisky barato de uno caro. Como el otro amigo no lo cree, deciden hacer una prueba. El amigo bravucón dice que acierta qué tipo de whisky está tomando al menos el 90% de las veces, ya que a veces los hielos le distorsionan la cata. Deciden hacerle probar 20 whiskies (en noches distintas) y obtienen el resultado de que acertó sobre el contenido del vaso que estaba probando en 14 noches.

Dado que nuestro amigo dijo que acertaría el 90% de las veces y solo acertó el 70% de ellas (14 de 20 noches), ¿podemos creer a nuestro amigo o nos está engañando? ¿es posible que fallara por mala suerte, pero si le dejamos seguir intentándolo a la larga acertará el 90%? Está claro que si hubiera acertado todas las noches, o 19 de ellas, le creeríamos sin lugar a dudas; también si hubiera fallado todas, o casi todas, sabríamos que nos está engañando, pero con 14 sobre 20 es algo dudoso. Esto es lo que podemos medir con el valor de p.

Si suponemos que la hipótesis nula es cierta, es decir, que las catas de nuestro amigo se distribuyen según una binomial de parámetro 0,90, esto es, como una moneda que saliera cara el 90% de las veces y sello el 10%. ¿Cuál es la probabilidad de que una distribución binomial de parámetro 0,9 repetida 20 veces nos dé como resultado 14 caras y 6 sellos? Calculando esa probabilidad nos queda p = 0,008867 ≃ 0,89%. Si a este valor le sumamos la probabilidad de que acierte solo 13 veces, más la probabilidad de que acierte solo 12 veces y así hasta la probabilidad de que no acierte ninguna vez, es decir, la probabilidad de que acierte 14 o menos veces, esto nos da p = 0,011253 ≃ 1,13%. Este es el valor de p.

¿Qué significa esto? Pues significa que si realmente suponemos que nuestro amigo acierta el 90% de las veces que prueba una copa y ha probado 20 copas, la probabilidad de que acierte menos de 15 copas es del 1,13%. Por tanto, si elegimos un nivel de significación usual de 0,05, que significa que aceptamos equivocarnos el 5% de las veces si repitiéramos el experimento, como el valor de p es inferior al nivel de significación, rechazamos la hipótesis nula, y declaramos que nuestro amigo es un fanfarrón. Estadísticamente, esto lo hacemos porque el resultado observado (14 aciertos de 20 intentos) es muy poco probable si suponemos que acierta el 90% de las veces, por lo tanto asumimos que no era cierta la hipótesis nula.

¿Qué hubiera pasado si hubiera acertado las 20 veces? En ese caso el valor de p saldría muy alto, ya que es muy probable que una distribución binomial de parámetro 0,90 repetida 20 veces nos dé 20. Por tanto no rechazaríamos la hipótesis nula. Es decir, diríamos que es verosímil que acierte el 90% de las veces, es posible que lleve razón, no tenemos evidencias significativas en contra de ello ya que el valor de p nos ha resultado muy favorable.

El valor de p es la probabilidad de que de la población propuesta por la hipótesis nula se obtenga la muestra observada o una aún más alejada. El valor de p está relacionado con la probabilidad de error de tipo I.

Principios para el correcto uso e interpretación del valor de p

En 2016, la American Statistical Association publicó seis principios para el correcto uso e interpretación del valor de p. Muchos de estos principios abordan concepciones equivocadas y empleos erróneos. Los seis principios son los siguientes:[3][4][5]

  1. Los valores de p pueden indicar cómo son los datos de incompatibles con cierto modelo estadístico.
  2. Los valores de p no miden la probabilidad de que la hipótesis nula sea cierta, ni tampoco la probabilidad de que los datos hayan sido producidos enteramente al azar.[6]
  3. Conclusiones científicas y decisiones políticas o empresariales no deberían basarse únicamente en el hecho de que un valor de p supere un umbral especificado.
  4. Una inferencia apropiada implica un informe completo y transparencia.
  5. Ni el valor de p ni la significación estadística miden el tamaño de un efecto o la importancia de un resultado.
  6. En sí mismo, un valor de p no es una medida apropiada de la evidencia de un modelo o hipótesis.

Referencias

  1. Este cálculo es válido para una prueba unilateral.
  2. Nótese que estamos duplicando el valor exacto 60460 / 1048576 = 0.057659+. Este valor, duplicado, es 0.115318+.
  3. Wasserstein RL, Lazar NA (2016). «The ASA's statement on p-values: context, process, and purpose». The American Statistician. doi:10.1080/00031305.2016.1154108. 
  4. Sterne JAC, Smith GD (2001). «Sifting the evidence — what's wrong with significance tests?». BMJ 322 (7280): 226-231. PMID 11159626. doi:10.1136/bmj.322.7280.226. 
  5. Schervish MJ (1996). «P Values: What They Are and What They Are Not». The American Statistician 50 (3): 203-206. doi:10.2307/2684655. 
  6. Lo cuál es diferente al azar del muestreo.
  •   Datos: Q253255
  •   Multimedia: P-value

valor, estadística, general, contrastes, hipótesis, valor, conocido, también, como, valor, valor, consignado, directamente, inglés, value, define, como, probabilidad, valor, estadístico, calculado, posible, dada, hipótesis, nula, cierta, términos, simples, val. En estadistica general y contrastes de hipotesis el valor p conocido tambien como p p valor valor de p consignado o directamente en ingles p value se define como la probabilidad de que un valor estadistico calculado sea posible dada una hipotesis nula cierta En terminos simples el valor p ayuda a diferenciar resultados que son producto del azar del muestreo de resultados que son estadisticamente significativos Si el valor p cumple con la condicion de ser menor que un nivel de significancia impuesto arbitrariamente este se considera como un resultado estadisticamente significativo y por lo tanto permite rechazar la hipotesis nula valor p Probabilidad resultado tan extremo o mas hipotesis nula P resultado tan extremo o mas H 0 displaystyle text valor p text Probabilidad text resultado tan extremo o mas mid text hipotesis nula mathbb P text resultado tan extremo o mas mid H 0 Es fundamental reforzar que el valor p esta basado en la presuncion de que una hipotesis nula o hipotesis de partida es cierta El valor p es por tanto una medida de significacion estadistica Indice 1 Interpretacion 1 1 Advertencia sobre error por observacion atipica 2 Ejemplos 2 1 Ejemplo con monedas 2 2 Ejemplo de situacion cotidiana 3 Principios para el correcto uso e interpretacion del valor de p 4 ReferenciasInterpretacion Editar El valor p es la probabilidad de que el siguiente valor observado sea igual o mas extremo que un cierto valor asumiendo que la hipotesis nula es cierta El valor p es un valor de probabilidad por lo que oscila entre 0 y 1 El valor p nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido suponiendo que la hipotesis nula H0 es cierta Se suele decir que valores altos de p no permiten rechazar la H0 mientras que valores bajos de p si permiten rechazar la H0 En una prueba estadistica se rechaza la hipotesis nula H0 si el valor p asociado al resultado observado es igual o menor que un nivel de significacion a displaystyle alpha establecido arbitrariamente convencionalmente 0 05 o 0 01 En otras palabras si el resultado obtenido es mas inusual que el rango esperado de resultados dada una hipotesis nula H0 cierta y el nivel de significacion a displaystyle alpha elegido es decir si p es menor que a displaystyle alpha podemos decir que tenemos un resultado estadisticamente significativo que permite rechazar H0 Es importante recalcar que un contraste de hipotesis no permite aceptar una hipotesis simplemente la rechaza o no la rechaza es decir que la tacha de verosimil lo que no significa obligatoriamente que sea cierta simplemente que es mas probable de serlo o inverosimil Advertencia sobre error por observacion atipica Editar Aunque cuando el valor de p es inferior al nivel de significacion a displaystyle alpha lo mas verosimil es que la hipotesis de partida sea falsa tambien es posible que estemos ante una observacion atipica Por eso estariamos cometiendo el error estadistico de rechazar la hipotesis nula cuando esta es cierta basandonos en que hemos tenido la mala suerte de encontrar una observacion atipica Este tipo de errores se puede subsanar siendo mas estrictos y rebajando el maximo valor p esperado un a displaystyle alpha de 0 05 es usado en investigaciones habituales sociologicas mientras que un a displaystyle alpha mas bajo de 0 01 se utiliza en investigaciones medicas en las que cometer un error puede acarrear consecuencias mas graves Tambien se puede tratar de subsanar dicho error aumentando el tamano de la muestra obtenida lo que reduce la posibilidad de que el dato obtenido sea casualmente raro Ejemplos EditarEjemplo con monedas Editar Se puede hacer un experimento estadistico para determinar si una moneda es justa es decir que la probabilidad de caer en cara o sello sea igual o injusta es decir que la moneda este arreglada para que uno de los dos resultados sea mucho mas frecuente que el otro Supongamos que lanzamos al aire una moneda 20 veces seguidas y los resultados experimentales muestran que la moneda cae en cara 14 veces de las 20 lanzadas Es la moneda justa o injusta Para determinarlo definimos como hipotesis nula la moneda es justa y como estadistico de prueba el numero de caras La probabilidad de que una moneda justa caiga al menos 14 veces en cara si es lanzada 20 veces es el valor p de este experimento Esta probabilidad puede ser calculada usando coeficientes binomiales asi 1 Prob 14 caras Prob 15 caras Prob 20 caras 1 2 20 20 14 20 15 20 20 60 460 1 048 576 0 058 displaystyle begin aligned amp operatorname Prob 14 text caras operatorname Prob 15 text caras cdots operatorname Prob 20 text caras amp frac 1 2 20 left binom 20 14 binom 20 15 cdots binom 20 20 right frac 60 460 1 048 576 approx 0 058 end aligned Esta probabilidad de 0 058 es el valor p considerando solo resultados extremos que favorecen las caras obtenido al aplicar una prueba unilateral Sin embargo en una moneda la desviacion puede favorecer a caras o cruces Por esto usamos una prueba bilateral que simplemente considera la desviacion posible en ambas direcciones Como una moneda justa tiene una distribucion binomial simetrica el valor p bilateral es simplemente el doble del valor p unilateral Es decir 0 115 2 De esta forma tenemos que Hipotesis nula H0 la moneda es justa con Prob cara 0 5 Estadistica de prueba numero de caras Observacion O 14 caras en 20 lanzamientos Nivel de significacion a displaystyle alpha elegido arbitrariamente 0 05 Un valor p bilateral para la observacion O dado H0 0 115Asi el valor p calculado 0 115 es mayor que el nivel de significacion 0 05 que elegimos Eso significa que el resultado de 14 caras en 20 lanzamientos no es inverosimil para una moneda justa estando este resultado dentro del rango de resultados que se obtendria el 95 de las veces que se repita el experimento con una moneda justa Por esta razon no se rechaza la hipotesis nula es decir asumimos que la moneda es justa Notese que de obtenerse una sola cara mas es decir 15 en 20 lanzamientos el valor p resultante bilateral habria sido 0 0414 4 14 en este caso la hipotesis nula tendria que ser rechazada para el nivel de significacion elegido de 0 05 es decir en tal caso asumiriamos que la moneda es injusta Ejemplo de situacion cotidiana Editar Supongamos que dos amigos estan en un bar y uno le dice a otro que es capaz de distinguir un whisky barato de uno caro Como el otro amigo no lo cree deciden hacer una prueba El amigo bravucon dice que acierta que tipo de whisky esta tomando al menos el 90 de las veces ya que a veces los hielos le distorsionan la cata Deciden hacerle probar 20 whiskies en noches distintas y obtienen el resultado de que acerto sobre el contenido del vaso que estaba probando en 14 noches Dado que nuestro amigo dijo que acertaria el 90 de las veces y solo acerto el 70 de ellas 14 de 20 noches podemos creer a nuestro amigo o nos esta enganando es posible que fallara por mala suerte pero si le dejamos seguir intentandolo a la larga acertara el 90 Esta claro que si hubiera acertado todas las noches o 19 de ellas le creeriamos sin lugar a dudas tambien si hubiera fallado todas o casi todas sabriamos que nos esta enganando pero con 14 sobre 20 es algo dudoso Esto es lo que podemos medir con el valor de p Si suponemos que la hipotesis nula es cierta es decir que las catas de nuestro amigo se distribuyen segun una binomial de parametro 0 90 esto es como una moneda que saliera cara el 90 de las veces y sello el 10 Cual es la probabilidad de que una distribucion binomial de parametro 0 9 repetida 20 veces nos de como resultado 14 caras y 6 sellos Calculando esa probabilidad nos queda p 0 008867 0 89 Si a este valor le sumamos la probabilidad de que acierte solo 13 veces mas la probabilidad de que acierte solo 12 veces y asi hasta la probabilidad de que no acierte ninguna vez es decir la probabilidad de que acierte 14 o menos veces esto nos da p 0 011253 1 13 Este es el valor de p Que significa esto Pues significa que si realmente suponemos que nuestro amigo acierta el 90 de las veces que prueba una copa y ha probado 20 copas la probabilidad de que acierte menos de 15 copas es del 1 13 Por tanto si elegimos un nivel de significacion usual de 0 05 que significa que aceptamos equivocarnos el 5 de las veces si repitieramos el experimento como el valor de p es inferior al nivel de significacion rechazamos la hipotesis nula y declaramos que nuestro amigo es un fanfarron Estadisticamente esto lo hacemos porque el resultado observado 14 aciertos de 20 intentos es muy poco probable si suponemos que acierta el 90 de las veces por lo tanto asumimos que no era cierta la hipotesis nula Que hubiera pasado si hubiera acertado las 20 veces En ese caso el valor de p saldria muy alto ya que es muy probable que una distribucion binomial de parametro 0 90 repetida 20 veces nos de 20 Por tanto no rechazariamos la hipotesis nula Es decir diriamos que es verosimil que acierte el 90 de las veces es posible que lleve razon no tenemos evidencias significativas en contra de ello ya que el valor de p nos ha resultado muy favorable El valor de p es la probabilidad de que de la poblacion propuesta por la hipotesis nula se obtenga la muestra observada o una aun mas alejada El valor de p esta relacionado con la probabilidad de error de tipo I Principios para el correcto uso e interpretacion del valor de p EditarEn 2016 la American Statistical Association publico seis principios para el correcto uso e interpretacion del valor de p Muchos de estos principios abordan concepciones equivocadas y empleos erroneos Los seis principios son los siguientes 3 4 5 Los valores de p pueden indicar como son los datos de incompatibles con cierto modelo estadistico Los valores de p no miden la probabilidad de que la hipotesis nula sea cierta ni tampoco la probabilidad de que los datos hayan sido producidos enteramente al azar 6 Conclusiones cientificas y decisiones politicas o empresariales no deberian basarse unicamente en el hecho de que un valor de p supere un umbral especificado Una inferencia apropiada implica un informe completo y transparencia Ni el valor de p ni la significacion estadistica miden el tamano de un efecto o la importancia de un resultado En si mismo un valor de p no es una medida apropiada de la evidencia de un modelo o hipotesis Referencias Editar Este calculo es valido para una prueba unilateral Notese que estamos duplicando el valor exacto 60460 1048576 0 057659 Este valor duplicado es 0 115318 Wasserstein RL Lazar NA 2016 The ASA s statement on p values context process and purpose The American Statistician doi 10 1080 00031305 2016 1154108 Sterne JAC Smith GD 2001 Sifting the evidence what s wrong with significance tests BMJ 322 7280 226 231 PMID 11159626 doi 10 1136 bmj 322 7280 226 Schervish MJ 1996 P Values What They Are and What They Are Not The American Statistician 50 3 203 206 doi 10 2307 2684655 Lo cual es diferente al azar del muestreo Datos Q253255 Multimedia P valueObtenido de https es wikipedia org w index php title Valor p amp oldid 134383859, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos