Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

2.4 Diagramas de caja

Introducción a la estadística2.4 Diagramas de caja

Menú
Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Frecuencia, tablas de frecuencia y niveles de medición
    5. 1.4 Diseño experimental y ética
    6. 1.5 Experimento de recopilación de datos
    7. 1.6 Experimento de muestreo
    8. Términos clave
    9. Repaso del capítulo
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
    3. 2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
    4. 2.3 Medidas de la ubicación de los datos
    5. 2.4 Diagramas de caja
    6. 2.5 Medidas del centro de los datos
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. 2.8 Estadística descriptiva
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia
    6. 3.5 Diagramas de árbol y de Venn
    7. 3.6 Temas de probabilidad
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Uniéndolo todo: Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
    3. 4.2 Media o valor esperado y desviación típica
    4. 4.3 Distribución binomial
    5. 4.4 Distribución geométrica
    6. 4.5 Distribución hipergeométrica
    7. 4.6 Distribución de Poisson
    8. 4.7 Distribución discreta (experimento con cartas)
    9. 4.8 Distribución discreta (experimento de los dados de la suerte)
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Referencias
    16. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Funciones de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. 5.4 Distribución continua
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Distribución normal (tiempos de vuelta)
    5. 6.4 Distribución normal (longitud del meñique)
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de medias muestrales (promedios)
    3. 7.2 El teorema del límite central para las sumas
    4. 7.3 Uso del teorema del límite central
    5. 7.4 Teorema del límite central (monedas en el bolsillo)
    6. 7.5 Teorema del límite central (recetas de galletas)
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 La media de una población utilizando la distribución normal
    3. 8.2 La media de una población utilizando la distribución t de Student
    4. 8.3 Una proporción de la población
    5. 8.4 Intervalo de confianza (costos de hogares)
    6. 8.5 Intervalo de confianza (lugar de nacimiento)
    7. 8.6 Intervalo de confianza (altura de las mujeres)
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Eventos poco comunes, la muestra, decisión y conclusión
    6. 9.5 Información adicional y ejemplos de pruebas de hipótesis completas
    7. 9.6 Pruebas de hipótesis de una sola media y una sola proporción
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Medias de dos poblaciones con desviaciones típicas desconocidas
    3. 10.2 Dos medias poblacionales con desviaciones típicas conocidas
    4. 10.3 Comparación de dos proporciones de población independientes
    5. 10.4 Muestras coincidentes o emparejadas
    6. 10.5 Prueba de hipótesis para dos medias y dos proporciones
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de bondad de ajuste
    4. 11.3 Prueba de independencia
    5. 11.4 Prueba de homogeneidad
    6. 11.5 Comparación de las pruebas chi-cuadrado
    7. 11.6 Prueba de una sola varianza
    8. 11.7 Laboratorio 1: Bondad de ajuste de chi-cuadrado
    9. 11.8 Laboratorio 2: prueba de independencia de chi-cuadrado
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  13. 12 Regresión lineal y correlación
    1. Introducción
    2. 12.1 Ecuaciones lineales
    3. 12.2 Diagramas de dispersión
    4. 12.3 La ecuación de regresión
    5. 12.4 Comprobación de la importancia del coeficiente de correlación
    6. 12.5 Predicción
    7. 12.6 Valores atípicos
    8. 12.7 Regresión (distancia desde la escuela)
    9. 12.8 Regresión (costo de los libros de texto)
    10. 12.9 Regresión (eficiencia del combustible)
    11. Términos clave
    12. Repaso del capítulo
    13. Repaso de fórmulas
    14. Práctica
    15. Tarea para la casa
    16. Resúmalo todo: tarea para la casa
    17. Referencias
    18. Soluciones
  14. 13 Distribución F y análisis de varianza anova de una vía
    1. Introducción
    2. 13.1 ANOVA de una vía
    3. 13.2 La distribución F y el cociente F
    4. 13.3 Datos sobre la distribución F
    5. 13.4 Prueba de dos varianzas
    6. 13.5 Laboratorio: ANOVA de una vía
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  15. A Ejercicios de repaso (caps. 3-13)
  16. B Pruebas prácticas (de la 1 a la 4) y exámenes finales
  17. C Conjuntos de datos
  18. D Proyectos de grupos y asociaciones
  19. E Hojas de soluciones
  20. F Oraciones, símbolos y fórmulas matemáticas
  21. G Notas para las calculadoras TI-83, 83+, 84 y 84+
  22. H Tablas
  23. Índice

Los diagramas de caja (también llamados diagramas de caja y bigotes o gráficos de caja y bigotes) ofrecen una buena imagen gráfica de la concentración de los datos. También muestran lo lejos que están los valores extremos de la mayoría de los datos. Un diagrama de caja se construye a partir de cinco valores: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo. Utilizamos estos valores para comparar la proximidad de otros valores de datos.

Para construir un diagrama de caja, utilice una línea numérica horizontal o vertical y una caja rectangular. Los valores de datos más pequeños y más grandes marcan los puntos finales del eje. El primer cuartil marca un extremo de la caja y el tercer cuartil marca el otro extremo de la caja. Aproximadamente el 50 % de los datos están dentro de la caja. Los "bigotes" se extienden desde los extremos de la caja hasta los valores de datos más pequeños y más grandes. La mediana o el segundo cuartil pueden estar entre el primer y el tercer cuartil, o puede ser uno, el otro, o ambos. El diagrama de caja ofrece una buena y rápida imagen de los datos.

NOTA

Es posible que encuentre diagramas de caja y bigotes con puntos que marcan los valores atípicos. En esos casos, los bigotes no se extienden hasta los valores mínimos y máximos.

Consideremos, de nuevo, este conjunto de datos.

1; 1; 2; 2; 4; 6; 6,8; 7,2; 8; 8,3; 9; 10; 10; 11,5

El primer cuartil es dos, la mediana es siete y el tercer cuartil es nueve. El valor más pequeño es uno y el más grande es 11,5. La siguiente imagen muestra el diagrama de caja construido.

NOTA

Consulte las instrucciones de la calculadora en el sitio web de TI o en el apéndice.

El primer bigote del diagrama de caja horizontal se extiende desde el valor más pequeño, 1, hasta el primer cuartil, 2, la caja comienza en el primer cuartil y se extiende hasta el tercer cuartil, 9, se traza una línea discontinua vertical en la mediana, 7, y el segundo bigote se extiende desde el tercer cuartil hasta el valor más grande, 11,5.
Figura 2.11

Los dos bigotes se extienden desde el primer cuartil hasta el valor más pequeño y desde el tercer cuartil hasta el valor más grande. La mediana se muestra con una línea discontinua.

NOTA

Es importante comenzar un diagrama de caja con una línea numérica a escala. De lo contrario, el diagrama de caja puede no ser útil.

Ejemplo 2.23

Los siguientes datos son las estaturas de 40 estudiantes en una clase de Estadística.

59; 60; 61; 62; 62; 63; 63; 64; 64; 64; 65; 65; 65; 65; 65; 65; 65; 65; 65; 66; 66; 67; 67; 68; 68; 69; 70; 70; 70; 70; 70; 71; 71; 72; 72; 73; 74; 74; 75; 77

Construya un diagrama de caja con las siguientes propiedades; las instrucciones de la calculadora para los valores mínimo y máximo, así como los cuartiles, siguen el ejemplo.

  • Valor mínimo = 59
  • Valor máximo = 77
  • Q1: Primer cuartil = 64,5
  • Q2: Segundo cuartil o mediana= 66
  • Q3: Tercer cuartil = 70
Diagrama de caja horizontal con el primer bigote que se extiende desde el valor más pequeño, 59, hasta el Q1, 64,5, la caja que comienza en el Q1 hasta el Q3, 70, la línea discontinua mediana en el Q2, 66, y el segundo bigote que se extiende desde el Q3 hasta el valor más grande, 77.
Figura 2.12
  1. Cada trimestre tiene aproximadamente el 25 % de los datos.
  2. Los diferenciales de los cuatro trimestres son 64,5 - 59 = 5,5 (primer trimestre), 66 - 64,5 = 1,5 (segundo trimestre), 70 - 66 = 4 (tercer trimestre) y 77 - 70 = 7 (cuarto trimestre). Así, el segundo trimestre tiene el menor diferencial y el cuarto el mayor.
  3. Rango = valor máximo - el valor mínimo = 77 - 59 = 18
  4. Rango intercuartil: IQR = Q3 – Q1 = 70 - 64,5 = 5,5.
  5. El intervalo 59-65 tiene más del 25 % de los datos, por lo que tiene más datos que el intervalo 66-70, que tiene el 25 % de los datos.
  6. El 50 % de los datos (la mitad) tiene un rango de 5,5 pulgadas.

Uso de las calculadoras TI-83, 83+, 84, 84+

Para calcular el mínimo, el máximo y los cuartiles:

Introduzca los datos en el editor de listas (Pres STAT 1:EDIT). Si necesita borrar la lista, pulse flecha hacia arriba hasta el nombre L1, pulse BORRAR y luego flecha hacia abajo.

Ponga los valores de los datos en la lista L1.

Pulse STAT y la flecha hacia CALC. Pulse 1:1-VarStats. Ingrese L1.

Pulse ENTER.

Utilice las teclas de flecha hacia abajo y hacia arriba para desplazarse.

Valor más pequeño = 59.

Valor más alto = 77.

Q1: Primer cuartil = 64,5.

Q2: Segundo cuartil o mediana = 66.

Q3: Tercer cuartil = 70

Para construir el diagrama de caja:

Pulse 4:Plotsoff. Pulse ENTER.

Con la flecha hacia abajo y luego con la tecla de flecha hacia la derecha se pasa a la quinta imagen, que es el diagrama de caja. Pulse ENTER.

Flecha hacia abajo a Xlist: Pulse el segundo 1 para L1

Flecha hacia abajo a Freq: Pulse ALPHA. Pulse 1.

Pulse Zoom. Pulse 9: ZoomStat.

Pulse TRACE y utilice las teclas de flecha para examinar el diagrama de caja.

Inténtelo 2.23

Los siguientes datos son el número de páginas de 40 libros en una estantería. Construya un diagrama de caja utilizando una calculadora gráfica e indique el rango intercuartílico.

136; 140; 178; 190; 205; 215; 217; 218; 232; 234; 240; 255; 270; 275; 290; 301; 303; 315; 317; 318; 326; 333; 343; 349; 360; 369; 377; 388; 391; 392; 398; 400; 402; 405; 408; 422; 429; 450; 475; 512

En algunos conjuntos de datos, el valor más grande, el valor más pequeño, el primer cuartil, la mediana y el tercer cuartil pueden ser los mismos. Por ejemplo, puede tener un conjunto de datos en el que la mediana y el tercer cuartil son iguales. En este caso, el diagrama no tendría una línea de puntos dentro de la caja que muestra la mediana. El lado derecho del cuadro mostraría tanto el tercer cuartil como la mediana. Por ejemplo, si el valor más pequeño y el primer cuartil fuesen ambos uno, la mediana y el tercer cuartil fuesen ambos cinco, y el valor más grande fuese siete, el diagrama de caja tendría el siguiente aspecto:

La caja horizontal del diagrama de caja comienza en el valor más pequeño y Q1, 1, hasta el Q3 y la mediana, 5, no se designa ninguna línea mediana, y tiene su bigote solitario que se extiende desde el Q3 hasta el valor más grande, 7.
Figura 2.13

En este caso, al menos el 25 % de los valores son iguales a uno. El 25 % de los valores están entre uno y cinco, ambos inclusive. Al menos el 25 % de los valores son iguales a cinco. El 25 % de los valores más altos se sitúan entre el cinco y el siete, ambos inclusive.

Ejemplo 2.24

Los resultados de las pruebas de una clase de Estadística universitaria impartida durante el día son:

99; 56; 78; 55,5; 32; 90; 80; 81; 56; 59; 45; 77; 84,5; 84; 70; 72; 68; 32; 79; 90

Los resultados de las pruebas de una clase de Estadística universitaria que se imparte por la noche son:

98; 78; 68; 83; 81; 89; 88; 76; 65; 45; 98; 90; 80; 84,5; 85; 79; 78; 98; 90; 79; 81; 25,5

translation missing: es.problem

  1. Calcule los valores más pequeños y más grandes, la mediana y el primer y tercer cuartil en la clase del día.
  2. Calcule los valores más pequeños y más grandes, la mediana y el primer y tercer cuartil para la clase nocturna.
  3. En cada conjunto de datos, ¿qué porcentaje de los datos está entre el valor más pequeño y el primer cuartil? ¿El primer cuartil y la mediana? ¿La mediana y el tercer cuartil? ¿El tercer cuartil y el valor más grande? ¿Qué porcentaje de los datos está entre el primer cuartil y el valor más grande?
  4. Cree un diagrama de caja en cada conjunto de datos. Utilice una línea numérica en ambos gráficos de caja.
  5. ¿Qué diagrama de caja tiene la mayor dispersión para el 50 % medio de los datos (los datos entre el primer y el tercer cuartil)? ¿Qué significa esto en ese conjunto de datos en comparación con el otro conjunto de datos?

Inténtelo 2.24

El siguiente conjunto de datos muestra las estaturas en pulgadas de los chicos de una clase de 40 estudiantes.

66; 66; 67; 67; 68; 68; 68; 68; 68; 69; 69; 69; 70; 71; 72; 72; 72; 73; 73; 74
El siguiente conjunto de datos muestra las alturas en pulgadas de las chicas de una clase de 40 estudiantes.
61; 61; 62; 62; 63; 63; 63; 65; 65; 65; 66; 66; 66; 67; 68; 68; 68; 69; 69; 69
Construya un diagrama de caja utilizando una calculadora gráfica para cada conjunto de datos, e indique qué diagrama de caja tiene la mayor dispersión para el 50 % medio de los datos.

Ejemplo 2.25

Grafique un diagrama de caja y bigote para los valores de los datos que se muestran a continuación.

10; 10; 10; 15; 35; 75; 90; 95; 100; 175; 420; 490; 515; 515; 790

Los cinco números utilizados para crear un diagrama de caja y bigotes son:

  • Mín.: 10
  • Q1: 15
  • Med.: 95
  • Q3: 490
  • Máx.: 790

El siguiente gráfico muestra el diagrama de cajas y bigotes.

Diagrama de caja horizontal con el primer bigote que se extiende desde el valor más pequeño, 10, hasta el Q1, 15, la caja que comienza desde el Q1 hasta el Q3, 490, la línea discontinua mediana en el Q2, 95, y el segundo bigote que se extiende desde el Q3 hasta el valor más grande, 790.
Figura 2.15

Inténtelo 2.25

Siga los pasos que utilizó para graficar un diagrama de caja y bigotes para los valores de datos que se muestran a continuación.

0; 5; 5; 15; 30; 30; 45; 50; 50; 60; 75; 110; 140; 240; 330

Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.