2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
Las notas de los estudiantes en un examen de Química fueron: 77, 78, 76, 81, 86, 51, 79, 82, 84, 99
- Construya un gráfico de tallo y hoja de los datos.
- ¿Hay posibles valores atípicos? Si es así, ¿qué puntuaciones son? ¿Por qué los considera atípicos?
La Tabla 2.61 contiene las tasas de obesidad de 2010 en estados de EE. UU. y en Washington, DC.
Estado | Porcentaje (%) | Estado | Porcentaje (%) | Estado | Porcentaje (%) |
---|---|---|---|---|---|
Alabama | 32,2 | Kentucky | 31,3 | Dakota del Norte | 27,2 |
Alaska | 24,5 | Luisiana | 31,0 | Ohio | 29,2 |
Arizona | 24,3 | Maine | 26,8 | Oklahoma | 30,4 |
Arkansas | 30,1 | Maryland | 27,1 | Oregón | 26,8 |
California | 24,0 | Massachusetts | 23,0 | Pensilvania | 28,6 |
Colorado | 21,0 | Michigan | 30,9 | Rhode Island | 25,5 |
Connecticut | 22,5 | Minnesota | 24,8 | Carolina del Sur | 31,5 |
Delaware | 28,0 | Misisipi | 34,0 | Dakota del Sur | 27,3 |
Washington, DC | 22,2 | Misuri | 30,5 | Tennessee | 30,8 |
Florida | 26,6 | Montana | 23,0 | Texas | 31,0 |
Georgia | 29,6 | Nebraska | 26,9 | Utah | 22,5 |
Hawái | 22,7 | Nevada | 22,4 | Vermont | 23,2 |
Idaho | 26,5 | Nuevo Hampshire | 25,0 | Virginia | 26,0 |
Illinois | 28,2 | Nueva Jersey | 23,8 | Washington | 25,5 |
Indiana | 29,6 | Nuevo México | 25,1 | Virginia Occidental | 32,5 |
Iowa | 28,4 | Nueva York | 23,9 | Wisconsin | 26,3 |
Kansas | 29,4 | Carolina del Norte | 27,8 | Wyoming | 25,1 |
- Utilice un generador de números aleatorios para elegir al azar ocho estados. Construya un gráfico de barras con las tasas de obesidad de esos ocho estados.
- Construya un gráfico de barras para todos los estados que comienzan con la letra “A”.
- Construya un gráfico de barras para todos los estados que comienzan con la letra “M”.
2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
Supongamos que tres editoriales se interesan por el número de libros de ficción de tapa blanda que compran los consumidores adultos al mes. Cada editorial realizó una encuesta. En la encuesta se les preguntó a los consumidores adultos el número de libros de ficción de tapa blanda que compraron el mes anterior. Los resultados son los siguientes:
N.º de libros | Frec. | Rel. Frec. |
---|---|---|
0 | 10 | |
1 | 12 | |
2 | 16 | |
3 | 12 | |
4 | 8 | |
5 | 6 | |
6 | 2 | |
8 | 2 |
N.º de libros | Frec. | Rel. Frec. |
---|---|---|
0 | 18 | |
1 | 24 | |
2 | 24 | |
3 | 22 | |
4 | 15 | |
5 | 10 | |
7 | 5 | |
9 | 1 |
N.º de libros | Frec. | Rel. Frec. |
---|---|---|
0–1 | 20 | |
2–3 | 35 | |
4–5 | 12 | |
6–7 | 2 | |
8–9 | 1 |
- Calcule las frecuencias relativas de cada encuesta. Escríbalas en las tablas.
- Utilizando una calculadora gráfica, una computadora o a mano, utilice la columna de frecuencias para construir un histograma de la encuesta de cada editor. Para las editoriales A y B, haga el ancho de las barras de uno. Para la editorial C, haga las barras con un ancho de dos.
- En oraciones completas, indique dos razones por las que los gráficos de las editoriales A y B no son idénticos.
- ¿Habría esperado que el gráfico de la editorial C se pareciera a los otros dos gráficos? ¿Por qué sí o por qué no?
- Haga nuevos histogramas para la editorial A y la editorial B. Esta vez, haga barras con un ancho de dos.
- Ahora, compare el gráfico de la editorial C con los nuevos gráficos de las editoriales A y B. ¿los gráficos son más parecidos o más distintos? Explique su respuesta.
A menudo, los cruceros realizan todas las transacciones a bordo sin dinero en efectivo, a excepción de los juegos de azar. Al final del crucero, los huéspedes pagan una sola factura que cubre todas las transacciones a bordo. Supongamos que se encuestaron 60 viajeros solteros y 70 parejas sobre sus facturas a bordo para un crucero de siete días desde Los Ángeles a la riviera mexicana. A continuación, un resumen de las facturas de cada grupo.
Monto (en dólares) | Frecuencia | Rel. Frecuencia |
---|---|---|
51-100 | 5 | |
101-150 | 10 | |
151-200 | 15 | |
201-250 | 15 | |
251-300 | 10 | |
301-350 | 5 |
Monto (en dólares) | Frecuencia | Rel. Frecuencia |
---|---|---|
100-150 | 5 | |
201-250 | 5 | |
251-300 | 5 | |
301-350 | 5 | |
351-400 | 10 | |
401-450 | 10 | |
451-500 | 10 | |
501-550 | 10 | |
551-600 | 5 | |
601-650 | 5 |
- Rellene la frecuencia relativa de cada grupo.
- Construya un histograma para el grupo de solteros. Escale el eje x a 50 dólares de ancho. Utilice la frecuencia relativa en el eje y.
- Construya un histograma para el grupo de parejas. Escale el eje x a 50 dólares de ancho. Utilice la frecuencia relativa en el eje y.
- Compare los dos gráficos:
- Enumere dos similitudes entre los gráficos.
- Enumere dos diferencias entre los gráficos.
- En general, ¿los gráficos son más parecidos o más diferentes?
- Construya un nuevo gráfico a mano para las parejas. Dado que cada pareja paga por dos personas, en vez de escalar el eje x a 50 dólares, escálelo a 100 dólares. Utilice la frecuencia relativa en el eje y.
- Compare el gráfico de los solteros con el nuevo gráfico de las parejas:
- Enumere dos similitudes entre los gráficos.
- En general, ¿los gráficos son más parecidos o más diferentes?
- ¿Cómo ha cambiado la escala del gráfico de parejas en comparación con el gráfico de solteros?
- Basándose en los gráficos, ¿cree que las personas gastan la misma cantidad, más o menos como solteros que como pareja? Explique por qué en una o dos oraciones completas.
Se les preguntó a veinticinco estudiantes seleccionados al azar el número de películas que habían visto la semana anterior. Los resultados son los siguientes.
N.º de películas | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
0 | 5 | ||
1 | 9 | ||
2 | 6 | ||
3 | 4 | ||
4 | 1 |
- Construya un histograma de los datos.
- Rellene las columnas del cuadro.
Use la siguiente información para responder los dos próximos ejercicios: supongamos que se les pregunta a ciento once personas que compran en una tienda especial de camisetas el número de camisetas que tienen y que cuestan más de 19 dólares cada una.
El porcentaje de personas que tienen como máximo tres camisetas que cuestan más de 19 dólares cada una es aproximadamente:
- 21
- 59
- 41
- No se puede determinar
Si los datos se recopilaron al preguntarles a las primeras 111 personas que entraron en la tienda, entonces el tipo de muestreo es:
- conglomerado
- simple aleatorio
- estratificado
- de conveniencia
A continuación se muestran las tasas de obesidad de 2010 por estados de EE. UU. y Washington, DC.
Estado | Porcentaje (%) | Estado | Porcentaje (%) | Estado | Porcentaje (%) |
---|---|---|---|---|---|
Alabama | 32,2 | Kentucky | 31,3 | Dakota del Norte | 27,2 |
Alaska | 24,5 | Luisiana | 31,0 | Ohio | 29,2 |
Arizona | 24,3 | Maine | 26,8 | Oklahoma | 30,4 |
Arkansas | 30,1 | Maryland | 27,1 | Oregón | 26,8 |
California | 24,0 | Massachusetts | 23,0 | Pensilvania | 28,6 |
Colorado | 21,0 | Michigan | 30,9 | Rhode Island | 25,5 |
Connecticut | 22,5 | Minnesota | 24,8 | Carolina del Sur | 31,5 |
Delaware | 28,0 | Misisipi | 34,0 | Dakota del Sur | 27,3 |
Washington, DC | 22,2 | Misuri | 30,5 | Tennessee | 30,8 |
Florida | 26,6 | Montana | 23,0 | Texas | 31,0 |
Georgia | 29,6 | Nebraska | 26,9 | Utah | 22,5 |
Hawái | 22,7 | Nevada | 22,4 | Vermont | 23,2 |
Idaho | 26,5 | Nuevo Hampshire | 25,0 | Virginia | 26,0 |
Illinois | 28,2 | Nueva Jersey | 23,8 | Washington | 25,5 |
Indiana | 29,6 | Nuevo México | 25,1 | Virginia Occidental | 32,5 |
Iowa | 28,4 | Nueva York | 23,9 | Wisconsin | 26,3 |
Kansas | 29,4 | Carolina del Norte | 27,8 | Wyoming | 25,1 |
Construya un gráfico de barras de las tasas de obesidad de su estado y de los cuatro estados más cercanos al suyo. Pista: Identifique el eje x con los estados.
2.3 Medidas de la ubicación de los datos
La edad media de las personas negras en Estados Unidos es actualmente de 30,9 años; la de las personas blancas es de 42,3 años.
- Basándose en esta información, indique dos razones por las que la edad media de las personas negras podría ser inferior a la de las personas blancas.
- ¿La menor edad media de las personas negras significa necesariamente que estas mueren más jóvenes que las personas blancas? ¿Por qué sí o por qué no?
- ¿Cómo es posible que las personas negras y las blancas mueran aproximadamente a la misma edad, pero que la edad media de las personas blancas sea mayor?
A seiscientos estadounidenses adultos se les preguntó mediante un sondeo telefónico: “¿Qué cree usted que constituye un ingreso de clase media?”. Los resultados están en la Tabla 2.69. Además, se incluye el extremo izquierdo, pero no el derecho.
Salario (dólares) | Frecuencia relativa |
---|---|
< 20.000 | 0,02 |
20.000-25.000 | 0,09 |
25.000-30.000 | 0,19 |
30.000-40.000 | 0,26 |
40.000-50.000 | 0,18 |
50.000-75.000 | 0,17 |
75.000-99.999 | 0,02 |
100.000 o más | 0,01 |
- ¿Qué porcentaje de la encuesta respondió “no estoy seguro”?
- ¿Qué porcentaje cree que la clase media es de 25.000 a 50.000 dólares?
- Construya un histograma de los datos.
- ¿Según los datos, todas las barras deben tener el mismo ancho? ¿Por qué sí o por qué no?
- ¿Cómo se deben tratar los intervalos <20.000 y más de 100.000? ¿Por qué?
- Calcule el percentil 40 y el percentil 80
- Construya un gráfico de barras de los datos
Dado el siguiente diagrama de caja:
- ¿cuál es el trimestre con menor dispersión de datos? ¿Cuál es esa dispersión?
- ¿cuál es el trimestre con mayor dispersión de datos? ¿Cuál es esa dispersión?
- calcule el rango intercuartil(IQR).
- ¿hay más datos en el intervalo 5-10 o en el intervalo 10-13? ¿Cómo lo sabe?
- ¿qué intervalo tiene menos datos? ¿Cómo lo sabe?
- 0–2
- 2–4
- 10–12
- 12–13
- necesito más información
El siguiente diagrama de caja muestra la población de Estados Unidos en 1990, el último año disponible.
- ¿Hay menos o más niños (de 17 años o menos) que personas mayores (de 65 años o más)? ¿Cómo lo sabe?
- El 12,6 % tiene 65 años o más. Aproximadamente, ¿qué porcentaje de la población son adultos en edad de trabajar (desde los 17 hasta los 65 años)?
2.4 Diagramas de caja
En una encuesta realizada a personas de 20 años en China, Alemania y Estados Unidos, se les preguntó por el número de países extranjeros que habían visitado en su vida. Los siguientes diagramas de caja muestran los resultados.
- En oraciones completas, describa lo que la forma de cada diagrama de caja implica sobre la distribución de los datos recogidos.
- ¿Más estadounidenses o más alemanes encuestados han estado en más de ocho países extranjeros?
- Compare los tres diagramas de caja. ¿Qué implican los viajes al extranjero de los residentes de 20 años de los tres países cuando se comparan entre sí?
Dado el siguiente diagrama de caja, responda las preguntas.
- Piense en un ejemplo (con palabras) en el que los datos puedan ajustarse al diagrama de caja anterior. Escriba el ejemplo en unas 2 a 5 oraciones.
- ¿Qué significa que el primer y el segundo cuartil estén tan juntos, mientras que el segundo y el tercer cuartil están bastante separados?
Dados los siguientes gráficos de caja, responda las preguntas.
- Explique en oraciones completas, por qué cada afirmación es falsa
- Datos 1 tiene más valores de datos por encima de 2 que Datos 2.
- Los conjuntos de datos no pueden tener el mismo modo.
- En los Datos 1, hay más valores de datos por debajo de cuatro que por encima de cuatro.
- ¿En qué grupo, Datos 1 o Datos 2, es más probable que el valor de "7" sea un valor atípico? Explique con oraciones completas.
Se realizó una encuesta a 130 compradores de automóviles nuevos de la serie 3 de BMW, 130 compradores de automóviles nuevos de la serie 5 de BMW y 130 compradores de automóviles nuevos de la serie 7 de BMW. En esta, se preguntaba a las personas, la edad que tenían cuando compraron su automóvil. Los siguientes diagramas de caja muestran los resultados.
- En oraciones completas, describa lo que la forma de cada diagrama de caja implica sobre la distribución de los datos recopilados para esa serie de automóviles.
- ¿Qué grupo tiene más probabilidades de tener un valor atípico? Explique cómo lo determinó.
- Compare los tres diagramas de caja. ¿Qué implican sobre la edad de compra de un BMW de la serie cuando se comparan entre sí?
- Mire la serie 5 de BMW. ¿Qué trimestre tiene la menor dispersión de datos? ¿Cuál es la dispersión?
- Mire la serie 5 de BMW. ¿Qué trimestre tiene la mayor dispersión de datos? ¿Cuál es la dispersión?
- Mire la serie 5 de BMW. Estime el rango intercuartil (IQR).
- Mire la serie 5 de BMW. ¿Hay más datos en el intervalo 31 a 38 o en el intervalo 45 a 55? ¿Cómo lo sabe?
- Mire la serie 5 de BMW. ¿Qué intervalo tiene menos datos? ¿Cómo lo sabe?
- 31–35
- 38–41
- 41–64
Se les preguntó a veinticinco estudiantes seleccionados al azar el número de películas que habían visto la semana anterior. Los resultados son los siguientes:
N.º de películas | Frecuencia |
---|---|
0 | 5 |
1 | 9 |
2 | 6 |
3 | 4 |
4 | 1 |
Construya un diagrama de caja de los datos.
2.5 Medidas del centro de los datos
Los países más obesos del mundo tienen tasas de obesidad que van del 11,4 % al 74,6 %. Estos datos se resumen en el siguiente cuadro.
Porcentaje de población obesa | Número de países |
---|---|
11,4-20,45 | 29 |
20,45-29,45 | 13 |
29,45-38,45 | 4 |
38,45-47,45 | 0 |
47,45-56,45 | 2 |
56,45-65,45 | 1 |
65,45-74,45 | 0 |
74,45-83,45 | 1 |
- ¿Cuál es la mejor estimación del porcentaje promedio de obesidad en estos países?
- Estados Unidos tiene una tasa promedio de obesidad del 33,9 %. ¿Esta tasa está por encima o por debajo del promedio?
- ¿Cómo se compara Estados Unidos con otros países?
La Tabla 2.72 da el porcentaje de niños menores de cinco años considerados con bajo peso. ¿Cuál es la mejor estimación del porcentaje medio de niños con bajo peso?
Porcentaje de niños con bajo peso | Número de países |
---|---|
16-21,45 | 23 |
21,45-26,9 | 4 |
26,9-32,35 | 9 |
32,35-37,8 | 7 |
37,8-43,25 | 6 |
43,25-48,7 | 1 |
2.6 Distorsión y media, mediana y moda
La edad media de la población de EE. UU. en 1980 era de 30,0 años. En 1991, la edad media era de 33,1 años.
- ¿Qué significa que la edad media aumente?
- Dé dos razones por las que la edad media podría aumentar.
- Para que la edad media aumente, ¿el número real de niños es menor en 1991 que en 1980? ¿Por qué sí o por qué no?
2.7 Medidas de la dispersión de los datos
Utilice la siguiente información para responder a los siguientes nueve ejercicios: Los parámetros de población que aparecen a continuación describen el número de estudiantes equivalentes a tiempo completo (full-time equivalent number of students, FTES) cada año en el Lake Tahoe Community College desde 1976-1977 hasta 2004-2005.
- μ = 1.000 FTES
- mediana = 1.014 FTES
- σ = 474 FTES
- primer cuartil = 528,5 FTES
- tercer cuartil = 1.447,5 FTES
- n = 29 años
Se toma una muestra de 11 años. ¿Cuántos se espera que tengan un FTES de 1.014 o más? Explique cómo ha determinado su respuesta.
El 75 % de todos los años tiene un FTES:
- en o por debajo de: _____
- en o por encima de: _____
¿Qué porcentaje de FTES fue de 528,5 a 1.447,5? ¿Cómo lo sabe?
¿A cuántas desviaciones típicas de la media está la mediana?
Información adicional: La población FTES para 2005-2006 hasta 2010-2011 se dio en un informe actualizado. Los datos se presentan aquí.
Año | 2005-2006 | 2006–07 | 2007–08 | 2008–09 | 2009–10 | 2010–11 |
Total de FTES | 1.585 | 1.690 | 1.735 | 1.935 | 2.021 | 1.890 |
Calcule la media, la mediana, la desviación típica, el primer cuartil, el tercer cuartil y el IQR. Redondee a un decimal.
¿Qué información adicional se necesita para construir un diagrama de cajas para los FTES de 2005-2006 a 2010-2011 y para los FTES de 1976-1977 a 2004-2005?
Compare el IQR de los FTES de 1976-1977 a 2004-2005 con el IQR de los FTES de 2005-2006 a 2010-2011. ¿Por qué cree que los IQR son tan diferentes?
Tres estudiantes solicitaban el ingreso en la misma escuela de posgrado. Venían de escuelas con sistemas de calificación diferentes. ¿Cuál estudiante tiene el mejor GPA en comparación con otros estudiantes de su escuela? Explique cómo ha determinado su respuesta.
Estudiante | GPA | GPA de la escuela | Desviación típica de la escuela |
---|---|---|---|
Thuy | 2,7 | 3,2 | 0,8 |
Vichet | 87 | 75 | 20 |
Kamala | 8,6 | 8 | 0,4 |
Una escuela de música presupuestó la compra de tres instrumentos musicales. Planean comprar un piano que cuesta 3.000 dólares, una guitarra que cuesta 550 dólares y una batería que cuesta 600 dólares. El costo medio de un piano es de 4.000 dólares, con una desviación típica de 2.500 dólares. El costo medio de una guitarra es de 500 dólares, con una desviación típica de 200 dólares. El costo medio de la batería es de 700 dólares, con una desviación típica de 100 dólares. ¿Cuál es el costo más bajo en comparación con otros instrumentos del mismo tipo? ¿Qué costo es el más elevado en comparación con otros instrumentos del mismo tipo? Justifique su respuesta.
Una clase de escuela primaria corrió una milla con una media de 11 minutos y una desviación típica de tres minutos. Rachel, una estudiante de la clase, corrió una milla en ocho minutos. Una clase de escuela secundaria júnior corrió una milla con una media de nueve minutos y una desviación típica de dos minutos. Kenji, un estudiante de la clase, corrió 1 milla en 8,5 minutos. Una clase de escuela secundaria corrió una milla con una media de siete minutos y una desviación típica de cuatro minutos. Nedda, una estudiante de la clase, corrió una milla en ocho minutos.
- ¿Por qué se considera a Kenji mejor corredor que Nedda, a pesar de que esta corría más rápido que él?
- ¿Quién es el corredor más rápido con respecto a su clase? Explique por qué.
Los países más obesos del mundo tienen tasas de obesidad que van del 11,4 % al 74,6 %. Estos datos se resumen en la tabla 14.
Porcentaje de población obesa | Número de países |
---|---|
11,4-20,45 | 29 |
20,45-29,45 | 13 |
29,45-38,45 | 4 |
38,45-47,45 | 0 |
47,45-56,45 | 2 |
56,45-65,45 | 1 |
65,45-74,45 | 0 |
74,45-83,45 | 1 |
¿Cuál es la mejor estimación del porcentaje promedio de obesidad en estos países? ¿Cuál es la desviación típica de las tasas de obesidad indicadas? Estados Unidos tiene una tasa promedio de obesidad del 33,9 %. ¿Esta tasa está por encima o por debajo del promedio? ¿Cuán “inusual” es la tasa de obesidad de Estados Unidos en comparación con la tasa promedio? Explique.
La Tabla 2.76 da el porcentaje de niños menores de cinco años considerados con bajo peso.
Porcentaje de niños con bajo peso | Número de países |
---|---|
16-21,45 | 23 |
21,45-26,9 | 4 |
26,9-32,35 | 9 |
32,35-37,8 | 7 |
37,8-43,25 | 6 |
43,25-48,7 | 1 |
¿Cuál es la mejor estimación del porcentaje medio de niños con bajo peso? ¿Cuál es la desviación típica? ¿Cuáles intervalos podrían considerarse inusuales? Explique.