Los diagramas de caja (también llamados diagramas de caja y bigotes o gráficos de caja y bigotes) ofrecen una buena imagen gráfica de la concentración de los datos. También muestran lo lejos que están los valores extremos de la mayoría de los datos. Un diagrama de caja se construye a partir de cinco valores: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo. Utilizamos estos valores para comparar la proximidad de otros valores de datos.
Para construir un diagrama de caja, utilice una línea numérica horizontal o vertical y una caja rectangular. Los valores de datos más pequeños y más grandes marcan los puntos finales del eje. El primer cuartil marca un extremo de la caja y el tercer cuartil marca el otro extremo de la caja. Aproximadamente el 50 % de los datos están dentro de la caja. Los "bigotes" se extienden desde los extremos de la caja hasta los valores de datos más pequeños y más grandes. La mediana o el segundo cuartil pueden estar entre el primer y el tercer cuartil, o puede ser uno, el otro, o ambos. El diagrama de caja ofrece una buena y rápida imagen de los datos.
NOTA
Es posible que encuentre diagramas de caja y bigotes con puntos que marcan los valores atípicos. En esos casos, los bigotes no se extienden hasta los valores mínimos y máximos.
Consideremos, de nuevo, este conjunto de datos.
1; 1; 2; 2; 4; 6; 6,8; 7,2; 8; 8,3; 9; 10; 10; 11,5
El primer cuartil es dos, la mediana es siete y el tercer cuartil es nueve. El valor más pequeño es uno y el más grande es 11,5. La siguiente imagen muestra el diagrama de caja construido.
NOTA
Consulte las instrucciones de la calculadora en el sitio web de TI o en el apéndice.
Los dos bigotes se extienden desde el primer cuartil hasta el valor más pequeño y desde el tercer cuartil hasta el valor más grande. La mediana se muestra con una línea discontinua.
NOTA
Es importante comenzar un diagrama de caja con una línea numérica a escala. De lo contrario, el diagrama de caja puede no ser útil.
Ejemplo 2.23
Los siguientes datos son las estaturas de 40 estudiantes en una clase de Estadística.
59; 60; 61; 62; 62; 63; 63; 64; 64; 64; 65; 65; 65; 65; 65; 65; 65; 65; 65; 66; 66; 67; 67; 68; 68; 69; 70; 70; 70; 70; 70; 71; 71; 72; 72; 73; 74; 74; 75; 77
Construya un diagrama de caja con las siguientes propiedades; las instrucciones de la calculadora para los valores mínimo y máximo, así como los cuartiles, siguen el ejemplo.
- Valor mínimo = 59
- Valor máximo = 77
- Q1: Primer cuartil = 64,5
- Q2: Segundo cuartil o mediana= 66
- Q3: Tercer cuartil = 70
- Cada trimestre tiene aproximadamente el 25 % de los datos.
- Los diferenciales de los cuatro trimestres son 64,5 - 59 = 5,5 (primer trimestre), 66 - 64,5 = 1,5 (segundo trimestre), 70 - 66 = 4 (tercer trimestre) y 77 - 70 = 7 (cuarto trimestre). Así, el segundo trimestre tiene el menor diferencial y el cuarto el mayor.
- Rango = valor máximo - el valor mínimo = 77 - 59 = 18
- Rango intercuartil: IQR = Q3 – Q1 = 70 - 64,5 = 5,5.
- El intervalo 59-65 tiene más del 25 % de los datos, por lo que tiene más datos que el intervalo 66-70, que tiene el 25 % de los datos.
- El 50 % de los datos (la mitad) tiene un rango de 5,5 pulgadas.
Uso de las calculadoras TI-83, 83+, 84, 84+
Para calcular el mínimo, el máximo y los cuartiles:
Introduzca los datos en el editor de listas (Pres STAT 1:EDIT). Si necesita borrar la lista, pulse flecha hacia arriba hasta el nombre L1, pulse BORRAR y luego flecha hacia abajo.
Ponga los valores de los datos en la lista L1.
Pulse STAT y la flecha hacia CALC. Pulse 1:1-VarStats. Ingrese L1.
Pulse ENTER.
Utilice las teclas de flecha hacia abajo y hacia arriba para desplazarse.
Valor más pequeño = 59.
Valor más alto = 77.
Q1: Primer cuartil = 64,5.
Q2: Segundo cuartil o mediana = 66.
Q3: Tercer cuartil = 70
Para construir el diagrama de caja:
Pulse 4:Plotsoff. Pulse ENTER.
Con la flecha hacia abajo y luego con la tecla de flecha hacia la derecha se pasa a la quinta imagen, que es el diagrama de caja. Pulse ENTER.
Flecha hacia abajo a Xlist: Pulse el segundo 1 para L1
Flecha hacia abajo a Freq: Pulse ALPHA. Pulse 1.
Pulse Zoom. Pulse 9: ZoomStat.
Pulse TRACE y utilice las teclas de flecha para examinar el diagrama de caja.
Inténtelo 2.23
Los siguientes datos son el número de páginas de 40 libros en una estantería. Construya un diagrama de caja utilizando una calculadora gráfica e indique el rango intercuartílico.
136; 140; 178; 190; 205; 215; 217; 218; 232; 234; 240; 255; 270; 275; 290; 301; 303; 315; 317; 318; 326; 333; 343; 349; 360; 369; 377; 388; 391; 392; 398; 400; 402; 405; 408; 422; 429; 450; 475; 512
En algunos conjuntos de datos, el valor más grande, el valor más pequeño, el primer cuartil, la mediana y el tercer cuartil pueden ser los mismos. Por ejemplo, puede tener un conjunto de datos en el que la mediana y el tercer cuartil son iguales. En este caso, el diagrama no tendría una línea de puntos dentro de la caja que muestra la mediana. El lado derecho del cuadro mostraría tanto el tercer cuartil como la mediana. Por ejemplo, si el valor más pequeño y el primer cuartil fuesen ambos uno, la mediana y el tercer cuartil fuesen ambos cinco, y el valor más grande fuese siete, el diagrama de caja tendría el siguiente aspecto:
En este caso, al menos el 25 % de los valores son iguales a uno. El 25 % de los valores están entre uno y cinco, ambos inclusive. Al menos el 25 % de los valores son iguales a cinco. El 25 % de los valores más altos se sitúan entre el cinco y el siete, ambos inclusive.
Ejemplo 2.24
Los resultados de las pruebas de una clase de Estadística universitaria impartida durante el día son:
99; 56; 78; 55,5; 32; 90; 80; 81; 56; 59; 45; 77; 84,5; 84; 70; 72; 68; 32; 79; 90
Los resultados de las pruebas de una clase de Estadística universitaria que se imparte por la noche son:
98; 78; 68; 83; 81; 89; 88; 76; 65; 45; 98; 90; 80; 84,5; 85; 79; 78; 98; 90; 79; 81; 25,5
Translation missing: es.problem
- Calcule los valores más pequeños y más grandes, la mediana y el primer y tercer cuartil en la clase del día.
- Calcule los valores más pequeños y más grandes, la mediana y el primer y tercer cuartil para la clase nocturna.
- En cada conjunto de datos, ¿qué porcentaje de los datos está entre el valor más pequeño y el primer cuartil? ¿El primer cuartil y la mediana? ¿La mediana y el tercer cuartil? ¿El tercer cuartil y el valor más grande? ¿Qué porcentaje de los datos está entre el primer cuartil y el valor más grande?
- Cree un diagrama de caja en cada conjunto de datos. Utilice una línea numérica en ambos gráficos de caja.
- ¿Qué diagrama de caja tiene la mayor dispersión para el 50 % medio de los datos (los datos entre el primer y el tercer cuartil)? ¿Qué significa esto en ese conjunto de datos en comparación con el otro conjunto de datos?
Solución
- Mín. = 32
- Q1 = 56
- M = 74,5
- Q3 = 82,5
- Máx. = 99
-
- Mín. = 25,5
- Q1 = 78
- M = 81
- Q3 = 89
- Máx. = 98
- Clase diurna: hay seis valores de datos que van de 32 a 56: 30 %. Hay seis valores de datos que van de 56 a 74,5: 30 %. Hay cinco valores de datos que van de 74,5 a 82,5: 25 %. Hay cinco valores de datos que van de 82,5 a 99: 25 %. Hay 16 valores de datos entre el primer cuartil, 56, y el valor más grande, 99: 75 %. Clase nocturna:
-
- El primer conjunto de datos tiene la mayor dispersión para el 50 % de los datos. El IQR del primer conjunto de datos es mayor que el IQR del segundo conjunto. Esto significa que hay más variabilidad en el 50 % medio del primer conjunto de datos.
Inténtelo 2.24
El siguiente conjunto de datos muestra las estaturas en pulgadas de los chicos de una clase de 40 estudiantes.
66; 66; 67; 67; 68; 68; 68; 68; 68; 69; 69; 69; 70; 71; 72; 72; 72; 73; 73; 74
El siguiente conjunto de datos muestra las alturas en pulgadas de las chicas de una clase de 40 estudiantes.
61; 61; 62; 62; 63; 63; 63; 65; 65; 65; 66; 66; 66; 67; 68; 68; 68; 69; 69; 69
Construya un diagrama de caja utilizando una calculadora gráfica para cada conjunto de datos, e indique qué diagrama de caja tiene la mayor dispersión para el 50 % medio de los datos.
Ejemplo 2.25
Grafique un diagrama de caja y bigote para los valores de los datos que se muestran a continuación.
10; 10; 10; 15; 35; 75; 90; 95; 100; 175; 420; 490; 515; 515; 790
Los cinco números utilizados para crear un diagrama de caja y bigotes son:
- Mín.: 10
- Q1: 15
- Med.: 95
- Q3: 490
- Máx.: 790
El siguiente gráfico muestra el diagrama de cajas y bigotes.
Inténtelo 2.25
Siga los pasos que utilizó para graficar un diagrama de caja y bigotes para los valores de datos que se muestran a continuación.
0; 5; 5; 15; 30; 30; 45; 50; 50; 60; 75; 110; 140; 240; 330