fbpx
Wikipedia

Diagrama de caja

Un diagrama de caja (también, diagrama de caja y bigotes o box plot) es un método estandarizado para representar gráficamente una serie de datos numéricos a través de sus cuartiles. De esta manera, se muestran a simple vista la mediana y los cuartiles de los datos,[1]​ y también pueden representarse sus valores atípicos. Conviene recordar que se utilizan las bisagras de Tukey, y no los cuartiles, a la hora de dibujar la caja del gráfico, aunque los resultados son semejantes en muestras grandes.

Tipos de variables que se ocupan

discretas y continuas

Componentes del diagrama de caja

 
Componentes del diagrama de caja

El diagrama de caja incluye los siguientes elementos:

  • rango (sin datos atípicos)
  • datos atípicos
  • rango intercuartil (también conocido como RIC)
  • cuartiles (Q1, Q2 y Q3)
  • mediana (Q2)
  • mínimo y máximo

Elaboración manual del diagrama de caja

Para la elaboración de manera manual de este tipo de gráfico, primero se obtiene la media de cada intervalo, y luego la mediana de la tabla de frecuencias en general. Con estos datos, se utiliza la fórmula de la media de cada intervalo elevado a la mediana. Los datos obtenidos en esta fórmula son la interpretación.

   +-----+-+ * o |-----------| | |---|   +-----+-+     +---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+ 0 1 2 4 5 7 9 10 12 15 
  • Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el rango intercuartílico (RIC):
En el ejemplo, para trazar la caja:
  • Valor 7: es el Q1 (25% de los datos)
  • Valor 8.5: es el Q2 o mediana (el 50% de los datos)
  • Valor 9: es el Q3 (75% de los datos)
  • Rango intercuartílico (Q3–Q1)
  • Los «bigotes», las líneas que se extienden desde la caja, se extienden hasta los valores máximo y mínimo de la serie o hasta 1,5 veces el RIC.

Cuando los datos se extienden más allá de esto, significa que hay valores atípicos en la serie y entonces hay que calcular los límites superior e inferior, Li y Ls.

Para ello, se consideran atípicos los valores inferiores a Q1–1.5·RIC o superiores a Q3+1.5·RIC.
En el ejemplo:
  • inferior: 7–1.5·2 = 4
  • superior: 9+1.5·2 = 12
Ahora se buscan los últimos valores que no son atípicos, que serán los extremos de los bigotes.
  • En el ejemplo: 4 y 10
  • Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0,5 y 2,5
  • Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1–3·RIC o Q3+3·RIC.
De modo que, en el ejemplo:
  • inferior: 7–3·2 = 1
  • superior: 9+3·2 = 15

Utilidad

  • Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no está en el centro del rectángulo, la distribución no es simétrica.
  • Son útiles para ver la presencia de valores atípicos también llamados outliers.
  • Pertenece a las herramientas de las estadística descriptiva. Permite ver como es la dispersión de los puntos con la mediana, los percentiles 25 y 75 y los valores máximos y mínimos.
  • Ponen en una sola dimensión los datos de un histograma, facilitando así el análisis de la información al detectar que el 50% de la población está en los límites de la caja.

Referencias

  1. «BBC Bitesize - GCSE Maths - Representing data - Edexcel - Revision 7». BBC Bitesize (en inglés británico). Consultado el 12 de noviembre de 2018. 

Enlaces externos

  • CiberConta
  •   Datos: Q895726
  •   Multimedia: Box plots

diagrama, caja, diagrama, caja, también, diagrama, caja, bigotes, plot, método, estandarizado, para, representar, gráficamente, serie, datos, numéricos, través, cuartiles, esta, manera, muestran, simple, vista, mediana, cuartiles, datos, también, pueden, repre. Un diagrama de caja tambien diagrama de caja y bigotes o box plot es un metodo estandarizado para representar graficamente una serie de datos numericos a traves de sus cuartiles De esta manera se muestran a simple vista la mediana y los cuartiles de los datos 1 y tambien pueden representarse sus valores atipicos Conviene recordar que se utilizan las bisagras de Tukey y no los cuartiles a la hora de dibujar la caja del grafico aunque los resultados son semejantes en muestras grandes Del experimento de Michelson y Morley Indice 1 Tipos de variables que se ocupan 2 Componentes del diagrama de caja 3 Elaboracion manual del diagrama de caja 4 Utilidad 5 Referencias 6 Enlaces externosTipos de variables que se ocupan Editardiscretas y continuasComponentes del diagrama de caja Editar Componentes del diagrama de caja El diagrama de caja incluye los siguientes elementos rango sin datos atipicos datos atipicos rango intercuartil tambien conocido como RIC cuartiles Q1 Q2 y Q3 mediana Q2 minimo y maximoElaboracion manual del diagrama de caja EditarPara la elaboracion de manera manual de este tipo de grafico primero se obtiene la media de cada intervalo y luego la mediana de la tabla de frecuencias en general Con estos datos se utiliza la formula de la media de cada intervalo elevado a la mediana Los datos obtenidos en esta formula son la interpretacion o 0 1 2 4 5 7 9 10 12 15 Ordenar los datos y obtener el valor minimo el maximo los cuartiles Q1 Q2 y Q3 y el rango intercuartilico RIC En el ejemplo para trazar la caja Valor 7 es el Q1 25 de los datos Valor 8 5 es el Q2 o mediana el 50 de los datos Valor 9 es el Q3 75 de los datos Rango intercuartilico Q3 Q1 Los bigotes las lineas que se extienden desde la caja se extienden hasta los valores maximo y minimo de la serie o hasta 1 5 veces el RIC Cuando los datos se extienden mas alla de esto significa que hay valores atipicos en la serie y entonces hay que calcular los limites superior e inferior Li y Ls Para ello se consideran atipicos los valores inferiores a Q1 1 5 RIC o superiores a Q3 1 5 RIC En el ejemplo inferior 7 1 5 2 4 superior 9 1 5 2 12 Ahora se buscan los ultimos valores que no son atipicos que seran los extremos de los bigotes En el ejemplo 4 y 10Marcar como atipicos todos los datos que estan fuera del intervalo Li Ls En el ejemplo 0 5 y 2 5Ademas se pueden considerar valores extremadamente atipicos aquellos que exceden Q1 3 RIC o Q3 3 RIC De modo que en el ejemplo inferior 7 3 2 1 superior 9 3 2 15Utilidad EditarProporcionan una vision general de la simetria de la distribucion de los datos si la mediana no esta en el centro del rectangulo la distribucion no es simetrica Son utiles para ver la presencia de valores atipicos tambien llamados outliers Pertenece a las herramientas de las estadistica descriptiva Permite ver como es la dispersion de los puntos con la mediana los percentiles 25 y 75 y los valores maximos y minimos Ponen en una sola dimension los datos de un histograma facilitando asi el analisis de la informacion al detectar que el 50 de la poblacion esta en los limites de la caja Referencias Editar BBC Bitesize GCSE Maths Representing data Edexcel Revision 7 BBC Bitesize en ingles britanico Consultado el 12 de noviembre de 2018 Enlaces externos EditarCiberConta Datos Q895726 Multimedia Box plotsObtenido de https es wikipedia org w index php title Diagrama de caja amp oldid 138066533, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos