fbpx
Wikipedia

Coeficiente de contingencia

El coeficiente de contingencia C (de Karl Pearson) es una medida de relación estadística. El coeficiente de contingencia de Pearson expresa la intensidad de la relación entre dos (o más) variables cualitativas. Se basa en la comparación de las frecuencias efectivamente calculadas de dos características con las frecuencias que se hubiesen esperado con independencia de estas características.

El coeficiente (coeficiente Chi-cuadrado)

El coeficiente   (también llamado contingencia cuadrática),[1]​ sobre el que se basa el coeficiente de contingencia, es una medida de la "intensidad" de la relación entre las características observadas :

 

El valor informativo del coeficiente   es reducido debido a que su límite superior, es decir, el valor que asume en el caso de la completa dependencia de las características observadas es dependiente de la magnitud (dimensión) de la tabla de contingencia (es decir de la cantidad de valores posibles de las variables) y del tamaño del universo estudiado  . No está dada entonces la factibilidad de la comparación de valores del coeficiente   sobre diferentes tablas de contingencia y tamaños muestrales.[1][2]​ En el caso de la completa independencia de las características,  .

Rige que:[3]

 

siendo   el número de filas y   el número de columnas de la tabla de contingencia.

Usos

El valor de   se necesita para determinar el coeficiente de contingencia C. En las pruebas de significación estadística también se utiliza el valor de   (véase Prueba de Chi cuadrado).

Ejemplo

Sea la siguiente una tabla de contingencia proveniente de una encuesta:

automóvil tipo sedán automóvil tipo familiar     Totales
Obreros 19 18 37
Empleados 43 20 63
Totales 62 38 100

Cálculo del coeficiente  :

 

Contingencia cuadrática media

Otra medida para especificar la intensidad de la dependencia de las características en una tabla de contingencia es la contingencia cuadrática media, que en lo esencial representa una ampliación del coeficiente  :

 

Cuanto mayor es esta medida, tanto más intensa es la relación entre las dos características analizadas. Si ambas características (variables) son independientes, entonces cada uno de los sumandos se hace 0, a consecuencia de que se hace 0 el numerador de la fracción y con ello la medida misma también. En el caso de una tabla de contingencia de 2x2 la medida está normada y asume valores en el intervalo [0,1].

Coeficiente de contingencia de Karl Pearson

  puede asumir valores en principio muy grandes y no está limitado al intervalo  . Para excluir la dependencia del coeficiente de contingencia del tamaño de la muestra, se calcula sobre la base de   el coeficiente de contingencia C (también denominado CC o K) de Karl Pearson:

 .
donde   es el tamaño de la muestra.

Este puede asumir valores en el intervalo [0,1). Resulta problemático que el límite superior del coeficiente de contingencia C sea dependiente del número de las dimensiones observadas:[4]

Aquí rige  , donde   el mínimo de entre la cantidad de formas posibles de la característica en las variables estudiadas.

Coeficiente de contingencia corregido

Para poder excluir, además de la influencia del tamaño de la muestra, también la influencia de la dimensión de las tablas de contingencia consideradas (el número de formas de la característica) sobre el límite superior del coeficiente y asegurar así la comparabilidad de los resultados, se utiliza con frecuencia el coeficiente de contingencia corregido   (también denominado  ) para medir la relación:

 ,

donde   igual que más arriba.

Aquí rige:  : Un   cercano a 0 indica características independientes.   cerca de 1 señala una mayor medida de dependencia entre las características.

Para el ejemplo propuesto, resulta un coeficiente de contingencia corregido  .

Cramérs V

El Cramérs V (en inglés también: Cramér's V) es un coeficiente de contingencia, más precisamente, una medida de relación estadística basada en  . Se denomina así en honor del matemático y estadístico sueco Harald Cramér.

El Cramérs V es una valor de medida independiente del tamaño de la muestra. Cramérs V es una medida simétrica para la intensidad de la relación entre dos o más variables de la escala nominal, cuando (por lo menos) una de las dos variables tiene por lo menos dos formas (valores posibles). En una tabla de 2x2 el Cramérs V corresponde al Coeficiente phi.

Procedimiento

 .
 : Total de casos (volumen de la muestra)
  es el menor entre ambos valores «número de filas» (rows)" y "número de columnas (columns)"

Interpretación

En cualquier tabla de contingencia —independientemente de la cantidad de filas y columnas— Cramérs V está entre 0 y 1. Puede usarse para tablas de contingencia de cualquier tamaño. Un Cramérs V que es mayor que 0,3 es considerado en ciencias sociales como una correlación significativa.

Rango de valores [0 hasta 1]:

  • Cramérs V = 0: no hay relación entre X e Y
  • Cramérs V = 1: hay una relación perfecta entre X e Y
  • Cramérs V = 0,6: hay una correlación relativamente intensa entre X e Y

Dado que Cramérs V es un número siempre positivo, no se pueden hacer afirmaciones acerca de la dirección de la relación.

Coeficiente Phi

El coeficiente Phi (también llamado coeficiente de correlación de cuatro campos)   (también  ) es una medida para la intensidad de la relación entre variables dicotómicas.

Cálculo

para estimar la correlación de cuatro campos entre dos características dicotómicas A y B, se construye primeramente una tabla de contingencia que contiene la distribución de frecuencia conjunta de las variables.

  A=∅0 A=1 Total
B=0 a b a+b
B=1 c d c+d
Total a+c b+d a+b+c+d

Con los datos de la tabla se puede calcular   según la fórmula

   .[5]

Ejemplos

Medida de la asociación entre

  • Aprobación o rechazo de una decisión política acerca del género,
  • Presentación o en su defecto, no presentación de un aviso publicitario y compra o no-compra de un producto.
  • Aplicación de   a una matriz de confusión con dos clases.

Nota

Entre   y   existe la relación    bzw.   , donde   designa al número de observaciones. Con ello   es la raíz cuadrada (sin que importe el signo) de la contingencia media cuadrática (ver más arriba).

Como prueba de significación estadística, bajo el supuesto de que   es igual a cero,   tiene una distribución Chi Cuadrado con un grado de libertad.

Véase también

Bibliografía

  • Bortz, J., Lienert, G.A. & Boehnke, K. (1990). Verteilungsfreie Methoden in der Biostatistik. (Métodos libres de distribución en la bioestadística) Springer, Berlin (cap. 8.1, p. 326 y p. 355 y siguientes).
  • Diehl, J. M. / Kohr, H.U. (1999). Deskriptive Statistik. («Estadística descriptiva») 12ª edición. Klotz Eschborn, p.161.
  • Zöfel, P. (2003). Statistik für Psychologen. («Estadística para psicólogos») Pearson Studium, Múnich.
  • Signifikanzprüfung für die Vierfelderkorrelation («Prueba de significación para la correlación de cuatro campos»). (Formato PDF; 13 kB, idioma alemán)

Referencias

  1. Schulze, P.M. (2007), Beschreibende Statistik (9ª edición), Oldenbourg, p. 125 .
  2. Kohn, W. (2005), Statistik. Datenanalysis und Wahrscheinlichkeitsrechnung, Springer, p. 115 .
  3. Kohn, W., Ibidem, p. 114 .
  4. Toutenburg, H.; Heumann, C. (2008), Deskriptive Statistik: Eine Einführung in Methoden und Anwendungen mit R und SPSS (6ª edición), Springer, p. 115 .
  5. Rönz,, Bernd; Strohe, Hans Gerhard (compiladores) (1994), Lexikon Statistik, Wiesbaden: Gabler, p. 25 .

Enlaces externos

  • Calculadora interactiva del coeficiente phi
  •   Datos: Q1650755

coeficiente, contingencia, coeficiente, contingencia, karl, pearson, medida, relación, estadística, coeficiente, contingencia, pearson, expresa, intensidad, relación, entre, más, variables, cualitativas, basa, comparación, frecuencias, efectivamente, calculada. El coeficiente de contingencia C de Karl Pearson es una medida de relacion estadistica El coeficiente de contingencia de Pearson expresa la intensidad de la relacion entre dos o mas variables cualitativas Se basa en la comparacion de las frecuencias efectivamente calculadas de dos caracteristicas con las frecuencias que se hubiesen esperado con independencia de estas caracteristicas Indice 1 El coeficiente UNIQ postMath 00000001 QINU coeficiente Chi cuadrado 1 1 Usos 1 2 Ejemplo 2 Contingencia cuadratica media 3 Coeficiente de contingencia de Karl Pearson 3 1 Coeficiente de contingencia corregido 4 Cramers V 4 1 Procedimiento 4 2 Interpretacion 5 Coeficiente Phi UNIQ postMath 00000024 QINU 5 1 Calculo 5 2 Ejemplos 5 3 Nota 6 Vease tambien 7 Bibliografia 8 Referencias 9 Enlaces externosEl coeficiente x 2 displaystyle chi 2 coeficiente Chi cuadrado EditarEl coeficiente x 2 displaystyle chi 2 tambien llamado contingencia cuadratica 1 sobre el que se basa el coeficiente de contingencia es una medida de la intensidad de la relacion entre las caracteristicas observadas x 2 i 1 k j 1 m h i j h i h j n 2 h i h j n displaystyle chi 2 sum i 1 k sum j 1 m frac h i j frac h i h j n 2 frac h i h j n El valor informativo del coeficiente x 2 displaystyle chi 2 es reducido debido a que su limite superior es decir el valor que asume en el caso de la completa dependencia de las caracteristicas observadas es dependiente de la magnitud dimension de la tabla de contingencia es decir de la cantidad de valores posibles de las variables y del tamano del universo estudiado n displaystyle n No esta dada entonces la factibilidad de la comparacion de valores del coeficiente x 2 displaystyle chi 2 sobre diferentes tablas de contingencia y tamanos muestrales 1 2 En el caso de la completa independencia de las caracteristicas x 2 0 displaystyle chi 2 0 Rige que 3 0 x 2 n min k 1 m 1 displaystyle 0 leq chi 2 leq n cdot min k 1 m 1 siendo k displaystyle k el numero de filas y m displaystyle m el numero de columnas de la tabla de contingencia Usos Editar El valor de x 2 displaystyle chi 2 se necesita para determinar el coeficiente de contingencia C En las pruebas de significacion estadistica tambien se utiliza el valor de x 2 displaystyle chi 2 vease Prueba de Chi cuadrado Ejemplo Editar Sea la siguiente una tabla de contingencia proveniente de una encuesta automovil tipo sedan automovil tipo familiar TotalesObreros 19 18 37Empleados 43 20 63Totales 62 38 100Calculo del coeficiente x 2 displaystyle chi 2 19 37 62 100 2 37 62 100 18 37 38 100 2 37 38 100 43 63 62 100 2 63 62 100 20 63 38 100 2 63 38 100 2 83 displaystyle frac 19 frac 37 62 100 2 frac 37 62 100 frac 18 frac 37 38 100 2 frac 37 38 100 frac 43 frac 63 62 100 2 frac 63 62 100 frac 20 frac 63 38 100 2 frac 63 38 100 2 83 Contingencia cuadratica media EditarOtra medida para especificar la intensidad de la dependencia de las caracteristicas en una tabla de contingencia es la contingencia cuadratica media que en lo esencial representa una ampliacion del coeficiente x 2 displaystyle chi 2 x 2 n 1 n i 1 k j 1 m h i j h i h j n 2 h i h j n displaystyle frac chi 2 n frac 1 n sum i 1 k sum j 1 m frac h i j frac h i h j n 2 frac h i h j n Cuanto mayor es esta medida tanto mas intensa es la relacion entre las dos caracteristicas analizadas Si ambas caracteristicas variables son independientes entonces cada uno de los sumandos se hace 0 a consecuencia de que se hace 0 el numerador de la fraccion y con ello la medida misma tambien En el caso de una tabla de contingencia de 2x2 la medida esta normada y asume valores en el intervalo 0 1 Coeficiente de contingencia de Karl Pearson Editarx 2 displaystyle chi 2 puede asumir valores en principio muy grandes y no esta limitado al intervalo 0 1 displaystyle 0 1 Para excluir la dependencia del coeficiente de contingencia del tamano de la muestra se calcula sobre la base de x 2 displaystyle chi 2 el coeficiente de contingencia C tambien denominado CC o K de Karl Pearson C x 2 x 2 N displaystyle C sqrt frac chi 2 chi 2 N donde N displaystyle N es el tamano de la muestra Este puede asumir valores en el intervalo 0 1 Resulta problematico que el limite superior del coeficiente de contingencia C sea dependiente del numero de las dimensiones observadas 4 Aqui rige C 0 k 1 k displaystyle C in left 0 sqrt frac k 1 k right donde k min I J displaystyle k min I J el minimo de entre la cantidad de formas posibles de la caracteristica en las variables estudiadas Coeficiente de contingencia corregido Editar Para poder excluir ademas de la influencia del tamano de la muestra tambien la influencia de la dimension de las tablas de contingencia consideradas el numero de formas de la caracteristica sobre el limite superior del coeficiente y asegurar asi la comparabilidad de los resultados se utiliza con frecuencia el coeficiente de contingencia corregido C k o r r displaystyle C korr tambien denominado K displaystyle K para medir la relacion C k o r r k k 1 C k k 1 x 2 n x 2 displaystyle C korr sqrt frac k k 1 cdot C sqrt frac k k 1 cdot sqrt frac chi 2 n chi 2 donde k displaystyle k igual que mas arriba Aqui rige 0 C k o r r 1 displaystyle 0 leq C korr leq 1 Un C k o r r displaystyle C korr cercano a 0 indica caracteristicas independientes C k o r r displaystyle C korr cerca de 1 senala una mayor medida de dependencia entre las caracteristicas Para el ejemplo propuesto resulta un coeficiente de contingencia corregido C k o r r 2 2 1 0 166 0 234 displaystyle C korr sqrt frac 2 2 1 0 166 0 234 Cramers V EditarEl Cramers V en ingles tambien Cramer s V es un coeficiente de contingencia mas precisamente una medida de relacion estadistica basada en x 2 displaystyle chi 2 Se denomina asi en honor del matematico y estadistico sueco Harald Cramer El Cramers V es una valor de medida independiente del tamano de la muestra Cramers V es una medida simetrica para la intensidad de la relacion entre dos o mas variables de la escala nominal cuando por lo menos una de las dos variables tiene por lo menos dos formas valores posibles En una tabla de 2x2 el Cramers V corresponde al Coeficiente phi Procedimiento Editar V x 2 n m i n r c 1 displaystyle V sqrt frac chi 2 n min r c 1 n displaystyle n Total de casos volumen de la muestra m i n r c displaystyle min r c es el menor entre ambos valores numero de filas rows y numero de columnas columns Interpretacion Editar En cualquier tabla de contingencia independientemente de la cantidad de filas y columnas Cramers V esta entre 0 y 1 Puede usarse para tablas de contingencia de cualquier tamano Un Cramers V que es mayor que 0 3 es considerado en ciencias sociales como una correlacion significativa Rango de valores 0 hasta 1 Cramers V 0 no hay relacion entre X e Y Cramers V 1 hay una relacion perfecta entre X e Y Cramers V 0 6 hay una correlacion relativamente intensa entre X e YDado que Cramers V es un numero siempre positivo no se pueden hacer afirmaciones acerca de la direccion de la relacion Coeficiente Phi ϕ displaystyle boldsymbol phi EditarEl coeficiente Phi tambien llamado coeficiente de correlacion de cuatro campos ϕ displaystyle phi tambien r ϕ displaystyle widehat r phi es una medida para la intensidad de la relacion entre variables dicotomicas Calculo Editar para estimar la correlacion de cuatro campos entre dos caracteristicas dicotomicas A y B se construye primeramente una tabla de contingencia que contiene la distribucion de frecuencia conjunta de las variables A 0 A 1 TotalB 0 a b a bB 1 c d c dTotal a c b d a b c dCon los datos de la tabla se puede calcular ϕ displaystyle phi segun la formula ϕ a d b c a b c d a c b d displaystyle phi frac a cdot d b cdot c sqrt a b cdot c d cdot a c cdot b d 5 Ejemplos Editar Medida de la asociacion entre Aprobacion o rechazo de una decision politica acerca del genero Presentacion o en su defecto no presentacion de un aviso publicitario y compra o no compra de un producto Aplicacion de ϕ displaystyle phi a una matriz de confusion con dos clases Nota Editar Entre ϕ displaystyle phi y x 2 displaystyle chi 2 existe la relacion x 2 n ϕ 2 displaystyle chi 2 n cdot phi 2 bzw ϕ 2 x 2 n displaystyle phi 2 frac chi 2 n donde n displaystyle n designa al numero de observaciones Con ello ϕ displaystyle phi es la raiz cuadrada sin que importe el signo de la contingencia media cuadratica ver mas arriba Como prueba de significacion estadistica bajo el supuesto de que ϕ displaystyle phi es igual a cero n ϕ 2 displaystyle n cdot phi 2 tiene una distribucion Chi Cuadrado con un grado de libertad Vease tambien EditarTabla de contingencia Distribucion x Coeficiente phi Coeficiente de Tschuprow Jean Paul BenzecriBibliografia EditarBortz J Lienert G A amp Boehnke K 1990 Verteilungsfreie Methoden in der Biostatistik Metodos libres de distribucion en la bioestadistica Springer Berlin cap 8 1 p 326 y p 355 y siguientes Diehl J M Kohr H U 1999 Deskriptive Statistik Estadistica descriptiva 12ª edicion Klotz Eschborn p 161 Zofel P 2003 Statistik fur Psychologen Estadistica para psicologos Pearson Studium Munich Signifikanzprufung fur die Vierfelderkorrelation Prueba de significacion para la correlacion de cuatro campos Formato PDF 13 kB idioma aleman Referencias Editar a b Schulze P M 2007 Beschreibende Statistik 9ª edicion Oldenbourg p 125 Kohn W 2005 Statistik Datenanalysis und Wahrscheinlichkeitsrechnung Springer p 115 Kohn W Ibidem p 114 Toutenburg H Heumann C 2008 Deskriptive Statistik Eine Einfuhrung in Methoden und Anwendungen mit R und SPSS 6ª edicion Springer p 115 Ronz Bernd Strohe Hans Gerhard compiladores 1994 Lexikon Statistik Wiesbaden Gabler p 25 Enlaces externos EditarCalculadora interactiva del coeficiente phi Datos Q1650755 Obtenido de https es wikipedia org w index php title Coeficiente de contingencia amp oldid 140956276, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos