fbpx
Wikipedia

Tamaño de la muestra

En estadística el tamaño de la muestra se le conoce como aquel número determinado de sujetos o cosas que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población.

Objetivos de la determinación del tamaño adecuado de una muestra

  1. Estimar un parámetro determinado con el nivel de confianza deseado.
  2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mínimo de garantía.
  3. Reducir costes o aumentar la rapidez del estudio.

Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño adecuado de la muestra tendría como objetivo su factibilidad. Así:

  1. Si el número de sujetos es insuficiente habría que modificar los criterios de selección, solicitar la colaboración de otros centros o ampliar el período de reclutamiento. Los estudios con tamaños muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusión errónea de que no existe tal diferencia.
  2. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista económico y humano. Además es poco ético al someter a más individuos a una intervención que puede ser menos eficaz o incluso perjudicial.

El tamaño de una muestra es el número de individuos que contiene.

Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente:[1]


 

N: es el tamaño de la población o universo (número total de posibles encuestados).

Zα: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de Zα se obtienen de la tabla de la distribución normal estándar N(0,1).

Los valores de Zα más utilizados y sus niveles de confianza son:
Valor de Zα 1.28 1.65 1.69 1.75 1.81 1.88 1.96
Nivel de confianza 80% 90% 91% 92% 93% 94% 95%

(Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la fórmula Zα=1.96)

e: es el error muestral deseado, en tanto por ciento. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la población y el que obtendríamos si preguntáramos al total de ella. Ejemplos:

Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas.
Ejemplo 2: si hacemos una encuesta de satisfacción a los empleados con un error muestral del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarán.
Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estará en el intervalo 52-58% (55% +/- 3%).

p: proporción de individuos que poseen en la población la característica de estudio. Este dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opción más segura.

q: proporción de individuos que no poseen esa característica, es decir, es 1-p.

n: tamaño de la muestra (número de encuestas que vamos a hacer).

Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o esté más libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos.

Otra fórmula para calcular el tamaño de la muestra es:

 

Donde: n = el tamaño de la muestra.

N = tamaño de la población.

 = Desviación estándar de la población, que generalmente cuando no se tiene su valor, suele utilizarse un valor estimado a ojo o a partir de una pequeña muestra o muestra piloto. Para ser conservador (prudente), mejor errar estimando por exceso que por defecto.

Zα: Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador.

e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.

La fórmula anterior se obtiene de la fórmula para calcular la estimación del intervalo de confianza para la media:

 

De donde el error es:

 

Elevando al cuadrado ambos miembros de la ecuación se tiene:

 
 

Multiplicando fracciones:

 

Eliminando denominadores:

 

Eliminando paréntesis:

 

Transponiendo n a la izquierda:

 

Factor común n:

 

Despejando n:

 

Ordenando se obtiene la fórmula para calcular el tamaño de la muestra:

 

Ejemplo ilustrativo: Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de confianza del 95%

Solución: Se tiene N=500, para el 95% de confianza Zα=1.96, y como no se tienen los demás valores se usará σ=0.5, y e=0.05.

Reemplazando valores en la fórmula se obtiene:


 

Lo cual se aproxima a 218

Estimación de parámetros

La estimación de parámetros consiste en el cálculo aproximado del valor de un parámetro en la población, utilizando la inferencia estadística, a partir de los valores observados en la muestra estudiada. Para el cálculo del tamaño de la muestra en una estimación de parámetros son necesarios los conceptos de Intervalo de confianza, variabilidad del parámetro, error, nivel de confianza, valor crítico y valor α (véase estimación por intervalos).

Estimación de una proporción

Los datos que tenemos que incluir en la fórmula para calcular el número de sujetos necesarios de la muestra (N) son:

  1. Zα/2: valor de Z correspondiente al riesgo α fijado. El riesgo α fijado suele ser 0,05 y Zα/2 de 1,96.
  2. P: Valor de la proporción que se supone existe en la población.
  3. i: Precisión con que se desea estimar el parámetro (  es la amplitud del intervalo de confianza).

Estimación de una media

Los datos que tenemos que incluir en la fórmula para calcular el número de sujetos necesarios en la muestra (N) son:

  1. Zα/2: valor de Z correspondiente al riesgo α fijado. El riesgo α fijado suele ser 0,05 y Zα/2 de 1,96.
  2.  : Varianza de la distribución de la variable cuantitativa que se supone que existe en la población.
  3.  : Precisión con que se desea estimar el parámetro (  es la amplitud del intervalo de confianza).

Contraste de hipótesis

Para conocer el tamaño de la muestra en un estudio de investigación en el que queremos conocer las diferencias existentes entre dos hipótesis, debemos conocer previamente:

  • error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de tipo I que se está dispuesto a aceptar. Normalmente de forma arbitraria se acepta un riesgo del 5%. Además hay que establecer el riesgo que se acepta de cometer un error tipo II, que suele ser entre el 5 y el 20%.
  • Si la hipótesis es unilateral o bilateral: El planteamiento de una hipótesis bilateral o "de dos colas" requiere mayor tamaño muestral.
  • Definir la Magnitud de la diferencia efecto o asociación que se desea detectar: A mayores diferencias preestablecidas en el planteamiento de la hipótesis, menor tamaño muestral, y a menor diferencia, mayor espacio muestral.
  • Conocer la variabilidad del criterio de evaluación en la población.

Comparación de dos proporciones

Para calcular el número de sujetos necesarios en cada una de las muestras (n), debemos prefijar:

  • 1,645 = Valor Z correspondiente al riesgo deseado (⍺ = 0,05 unilateral).
  • 1,96 = Valor Z correspondiente al riesgo deseado (⍺ = 0,05 bilateral).
  • 0,13 = Valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual.
  • 0,44 = Valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica.
  • 0,29 = Media de las dos proporciones   y  .


Coeficiente de correlación

La asociación entre dos variables cuantitativas necesita normalmente la utilización del coeficiente de correlación r de Pearson.

Véase también

Referencias

  1. Tamaño de una muestra para una investigación de mercado Trabajo de dos profesoras de la Universidad Rafael Landívar.
  •   Datos: Q2564360

tamaño, muestra, este, artículo, sobre, matemáticas, detectaron, varios, problemas, favor, edítalo, para, mejorarlo, carece, fuentes, referencias, aparezcan, fuente, acreditada, existen, dudas, desacuerdos, sobre, exactitud, redacción, favor, debate, este, pro. En este articulo sobre matematicas se detectaron varios problemas Por favor editalo para mejorarlo Carece de fuentes o referencias que aparezcan en una fuente acreditada Existen dudas o desacuerdos sobre la exactitud de su redaccion Por favor debate este problema en la pagina de discusion Este aviso fue puesto el 14 de agosto de 2011 En estadistica el tamano de la muestra se le conoce como aquel numero determinado de sujetos o cosas que componen la muestra extraida de una poblacion necesarios para que los datos obtenidos sean representativos de la poblacion Indice 1 Objetivos de la determinacion del tamano adecuado de una muestra 1 1 Estimacion de parametros 1 1 1 Estimacion de una proporcion 1 1 2 Estimacion de una media 1 2 Contraste de hipotesis 1 2 1 Comparacion de dos proporciones 1 2 2 Coeficiente de correlacion 2 Vease tambien 3 ReferenciasObjetivos de la determinacion del tamano adecuado de una muestra EditarEstimar un parametro determinado con el nivel de confianza deseado Detectar una determinada diferencia si realmente existe entre los grupos de estudio con un minimo de garantia Reducir costes o aumentar la rapidez del estudio Por ejemplo en un estudio de investigacion epidemiologico la determinacion de un tamano adecuado de la muestra tendria como objetivo su factibilidad Asi Si el numero de sujetos es insuficiente habria que modificar los criterios de seleccion solicitar la colaboracion de otros centros o ampliar el periodo de reclutamiento Los estudios con tamanos muestrales insuficientes no son capaces de detectar diferencias entre grupos llegando a la conclusion erronea de que no existe tal diferencia Si el numero de sujetos es excesivo el estudio se encarece desde el punto de vista economico y humano Ademas es poco etico al someter a mas individuos a una intervencion que puede ser menos eficaz o incluso perjudicial El tamano de una muestra es el numero de individuos que contiene Una formula muy extendida que orienta sobre el calculo del tamano de la muestra para datos globales es la siguiente 1 n Z a 2 N p q e 2 N 1 Z a 2 p q displaystyle n frac Z alpha 2 Npq e 2 N 1 Z alpha 2 pq N es el tamano de la poblacion o universo numero total de posibles encuestados Za es una constante que depende del nivel de confianza que asignemos El nivel de confianza indica la probabilidad de que los resultados de nuestra investigacion sean ciertos un 95 5 de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4 5 Los valores de Za se obtienen de la tabla de la distribucion normal estandar N 0 1 Los valores de Za mas utilizados y sus niveles de confianza son Valor de Za 1 28 1 65 1 69 1 75 1 81 1 88 1 96Nivel de confianza 80 90 91 92 93 94 95 Por tanto si pretendemos obtener un nivel de confianza del 95 necesitamos poner en la formula Za 1 96 e es el error muestral deseado en tanto por ciento El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la poblacion y el que obtendriamos si preguntaramos al total de ella Ejemplos Ejemplo 1 si los resultados de una encuesta dicen que 100 personas comprarian un producto y tenemos un error muestral del 5 compraran entre 95 y 105 personas Ejemplo 2 si hacemos una encuesta de satisfaccion a los empleados con un error muestral del 3 y el 60 de los encuestados se muestran satisfechos significa que entre el 57 y el 63 60 3 del total de los empleados de la empresa lo estaran Ejemplo 3 si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55 de los votos y el error estimado fuera del 3 se estima que el porcentaje real de votos estara en el intervalo 52 58 55 3 p proporcion de individuos que poseen en la poblacion la caracteristica de estudio Este dato es generalmente desconocido y se suele suponer que p q 0 5 que es la opcion mas segura q proporcion de individuos que no poseen esa caracteristica es decir es 1 p n tamano de la muestra numero de encuestas que vamos a hacer Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o este mas libre de error necesariamente antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos Otra formula para calcular el tamano de la muestra es n N s 2 Z a 2 e 2 N 1 s 2 Z a 2 displaystyle n N sigma 2 Z alpha 2 over e 2 N 1 sigma 2 Z alpha 2 Donde n el tamano de la muestra N tamano de la poblacion s displaystyle sigma Desviacion estandar de la poblacion que generalmente cuando no se tiene su valor suele utilizarse un valor estimado a ojo o a partir de una pequena muestra o muestra piloto Para ser conservador prudente mejor errar estimando por exceso que por defecto Za Valor obtenido mediante niveles de confianza Es un valor constante que si no se tiene su valor se lo toma en relacion al 95 de confianza equivale a 1 96 como mas usual o en relacion al 99 de confianza equivale 2 58 valor que queda a criterio del encuestador e Limite aceptable de error muestral que generalmente cuando no se tiene su valor suele utilizarse un valor que varia entre el 1 0 01 y 9 0 09 valor que queda a criterio del encuestador La formula anterior se obtiene de la formula para calcular la estimacion del intervalo de confianza para la media X Z a s n N n N 1 m X Z a s n N n N 1 displaystyle overline X Z alpha frac sigma sqrt n sqrt frac N n N 1 leq mu leq overline X Z alpha frac sigma sqrt n sqrt frac N n N 1 De donde el error es e Z a s n N n N 1 displaystyle e Z alpha frac sigma sqrt n sqrt frac N n N 1 Elevando al cuadrado ambos miembros de la ecuacion se tiene e 2 Z a s n N n N 1 2 displaystyle e 2 left Z alpha frac sigma sqrt n sqrt frac N n N 1 right 2 e 2 Z a 2 s 2 n N n N 1 displaystyle e 2 Z alpha 2 frac sigma 2 n cdot frac N n N 1 Multiplicando fracciones e 2 Z a 2 s 2 N n n N 1 displaystyle e 2 frac Z alpha 2 sigma 2 left N n right n left N 1 right Eliminando denominadores e 2 n N 1 Z a 2 s 2 N n displaystyle e 2 n left N 1 right Z alpha 2 sigma 2 left N n right Eliminando parentesis e 2 n N e 2 n Z a 2 s 2 N Z a 2 s 2 n displaystyle e 2 nN e 2 n Z alpha 2 sigma 2 N Z alpha 2 sigma 2 n Transponiendo n a la izquierda e 2 n N e 2 n Z a 2 s 2 n Z a 2 s 2 N displaystyle e 2 nN e 2 n Z alpha 2 sigma 2 n Z alpha 2 sigma 2 N Factor comun n n e 2 N e 2 Z a 2 s 2 Z a 2 s 2 N displaystyle n left e 2 N e 2 Z alpha 2 sigma 2 right Z alpha 2 sigma 2 N Despejando n n Z a 2 s 2 N e 2 N e 2 Z a 2 s 2 displaystyle n frac Z alpha 2 sigma 2 N e 2 N e 2 Z alpha 2 sigma 2 Ordenando se obtiene la formula para calcular el tamano de la muestra n N s 2 Z a 2 e 2 N 1 s 2 Z a 2 displaystyle n N sigma 2 Z alpha 2 over e 2 N 1 sigma 2 Z alpha 2 Ejemplo ilustrativo Calcular el tamano de la muestra de una poblacion de 500 elementos con un nivel de confianza del 95 Solucion Se tiene N 500 para el 95 de confianza Za 1 96 y como no se tienen los demas valores se usara s 0 5 y e 0 05 Reemplazando valores en la formula se obtiene n N s 2 Z a 2 e 2 N 1 s 2 Z a 2 500 0 5 2 1 96 2 0 05 2 500 1 0 5 2 1 96 2 217 5 displaystyle n frac N sigma 2 Z alpha 2 e 2 N 1 sigma 2 Z alpha 2 frac 500 cdot 0 5 2 cdot 1 96 2 0 05 2 cdot 500 1 0 5 2 cdot 1 96 2 217 5 Lo cual se aproxima a 218 Estimacion de parametros Editar La estimacion de parametros consiste en el calculo aproximado del valor de un parametro en la poblacion utilizando la inferencia estadistica a partir de los valores observados en la muestra estudiada Para el calculo del tamano de la muestra en una estimacion de parametros son necesarios los conceptos de Intervalo de confianza variabilidad del parametro error nivel de confianza valor critico y valor a vease estimacion por intervalos Estimacion de una proporcion Editar Los datos que tenemos que incluir en la formula para calcular el numero de sujetos necesarios de la muestra N son Za 2 valor de Z correspondiente al riesgo a fijado El riesgo a fijado suele ser 0 05 y Za 2 de 1 96 P Valor de la proporcion que se supone existe en la poblacion i Precision con que se desea estimar el parametro 2 i displaystyle 2i es la amplitud del intervalo de confianza Estimacion de una media Editar Los datos que tenemos que incluir en la formula para calcular el numero de sujetos necesarios en la muestra N son Za 2 valor de Z correspondiente al riesgo a fijado El riesgo a fijado suele ser 0 05 y Za 2 de 1 96 s 2 displaystyle s 2 Varianza de la distribucion de la variable cuantitativa que se supone que existe en la poblacion i displaystyle i Precision con que se desea estimar el parametro 2 i displaystyle 2i es la amplitud del intervalo de confianza Contraste de hipotesis Editar Para conocer el tamano de la muestra en un estudio de investigacion en el que queremos conocer las diferencias existentes entre dos hipotesis debemos conocer previamente error tipo I y tipo II Hay que establecer el riesgo de cometer un error de tipo I que se esta dispuesto a aceptar Normalmente de forma arbitraria se acepta un riesgo del 5 Ademas hay que establecer el riesgo que se acepta de cometer un error tipo II que suele ser entre el 5 y el 20 Si la hipotesis es unilateral o bilateral El planteamiento de una hipotesis bilateral o de dos colas requiere mayor tamano muestral Definir la Magnitud de la diferencia efecto o asociacion que se desea detectar A mayores diferencias preestablecidas en el planteamiento de la hipotesis menor tamano muestral y a menor diferencia mayor espacio muestral Conocer la variabilidad del criterio de evaluacion en la poblacion Comparacion de dos proporciones Editar Para calcular el numero de sujetos necesarios en cada una de las muestras n debemos prefijar 1 645 Valor Z correspondiente al riesgo deseado 0 05 unilateral 1 96 Valor Z correspondiente al riesgo deseado 0 05 bilateral 0 13 Valor de la proporcion en el grupo de referencia placebo control o tratamiento habitual 0 44 Valor de la proporcion en el grupo del nuevo tratamiento intervencion o tecnica 0 29 Media de las dos proporciones p 1 displaystyle p 1 y p 2 displaystyle p 2 Coeficiente de correlacion Editar La asociacion entre dos variables cuantitativas necesita normalmente la utilizacion del coeficiente de correlacion r de Pearson Vease tambien Editar Portal Matematica Contenido relacionado con Matematica Referencias Editar Tamano de una muestra para una investigacion de mercado Trabajo de dos profesoras de la Universidad Rafael Landivar Datos Q2564360Obtenido de https es wikipedia org w index php title Tamano de la muestra amp oldid 136349798, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos