Prueba práctica 1
1.1: Definiciones de estadística, probabilidad y términos clave
Use la siguiente información para responder los próximos tres ejercicios. Un supermercado está interesado en saber cuánto dinero, en promedio, gastan sus clientes en cada visita al departamento de productos agrícolas. Obtienen una muestra de 1.000 visitas de sus registros de la tienda y calculan el gasto promedio de cada cliente en productos agrícolas.
1. Identifique la población, la muestra, el parámetro, la estadística, la variable y los datos de este ejemplo.
- población
- muestra
- parámetro
- estadística
- variable
- datos
2. ¿Qué tipo de datos son la "cantidad de dinero que se gasta en productos por visita"?
- cualitativo
- cuantitativo-continuo
- cuantitativo-discreto
3. El estudio concluye que la media de gasto en productos agrícolas por visita de los clientes de la muestra es de 12,84 dólares. Este es un ejemplo de una:
- población
- muestra
- parámetro
- estadística
- variable
1.2: Datos, muestreo y variación de datos y muestreo
Use la siguiente información para responder los próximos dos ejercicios. Un club de salud está interesado en saber cuántas veces utiliza el club un socio típico en una semana. Deciden pedirle a uno de cada diez clientes en un día determinado que rellene una breve encuesta que incluya información sobre la cantidad de veces que ha visitado el club durante la semana anterior.
4. ¿Qué tipo de diseño de muestreo es este?
- conglomerado
- estratificado
- simple aleatorio
- sistemático
5. "Número de visitas por semana", ¿qué tipo de datos son?
- cualitativo
- cuantitativo-continuo
- cuantitativo-discreto
6. Describa una situación en la que calcularía un parámetro, en lugar de una estadística.
7. El gobierno federal de EE. UU. lleva a cabo una encuesta con estudiantes de último año de secundaria sobre sus planes de educación y empleo en el futuro. Una de las preguntas se refiere a si tienen previsto asistir a un instituto universitario de cuatro años o a una universidad el año siguiente. El 50 % responde afirmativamente a esta pregunta; ese 50 % es un:
- parámetro
- estadística
- variable
- datos
8. Imagine que el gobierno federal de EE. UU. tuviera los medios para encuestar a todos los estudiantes sénior de secundaria del país sobre sus planes de educación y empleo futuros y descubriera que el 50 % tenía previsto asistir a un instituto universitario o a una universidad de 4 años el año siguiente. Este 50 % es un ejemplo de un:
- parámetro
- estadística
- variable
- datos
Use la siguiente información para responder los próximos tres ejercicios. En una encuesta realizada a una muestra aleatoria de 100 enfermeros que trabajaban en un gran hospital se les preguntó cuántos años llevaban trabajando en la profesión. Sus respuestas se resumen en la siguiente tabla (incompleta).
9. Rellene los espacios en blanco de la tabla y redondee sus respuestas a dos decimales para las celdas de frecuencia relativa y frecuencia relativa acumulada.
N.º de años | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
< 5 | 25 | ||
5–10 | 30 | ||
> 10 | vacío |
10. ¿Qué proporción de enfermeros tiene cinco o más años de experiencia?
11. ¿Qué proporción de enfermeros tiene diez o menos años de experiencia?
12. Describa cómo podría obtener una muestra aleatoria de 30 estudiantes de una clase de 200 estudiantes.
13. Describa cómo podría obtener una muestra estratificada de estudiantes de institutos universitarios en la que los estratos sean sus años de estudio (primero y segundo años, júnior o sénior).
14. Un administrador quiere obtener una muestra, sin reemplazo, de 30 empleados de una plantilla de 150. Describa cómo cambia la probabilidad de que lo seleccionen a lo largo de la extracción de la muestra.
15. El gerente de unos grandes almacenes decide medir la satisfacción de los empleados para lo cual selecciona cuatro departamentos al azar y hace entrevistas a todos los empleados de esos cuatro departamentos. ¿De qué tipo de diseño de encuesta se trata?
- conglomerado
- estratificado
- simple aleatorio
- sistemático
16. Un popular programa deportivo de televisión estadounidense hace un sondeo entre los espectadores para saber qué equipo creen que ganará el campeonato de la Liga Nacional de Fútbol Americano (National Football League, NFL) este año. Los espectadores votan a través de un número de teléfono que aparece en la pantalla de su televisor y le dicen al operador qué equipo creen que va a ganar. ¿Cree que los que participan en este sondeo son representativos de todos los aficionados al fútbol en Estados Unidos?
17. Dos investigadores que estudian tasas de vacunación obtienen muestras de forma independiente de 50 niños entre 3 y 18 meses de una gran zona urbana y determinan si están al día en sus vacunas. Una investigadora halla que el 84 % de los niños de su muestra están al día, y el otro halla que el 86 % de los de su muestra están al día. Suponiendo que ambos hayan seguido los procedimientos de muestreo adecuados y hayan hecho sus cálculos correctamente, ¿cuál es la explicación probable de esta discrepancia?
18. Una escuela secundaria aumentó la duración de la jornada escolar de 6,5 a 7,5 horas. Los estudiantes que deseaban asistir a esta escuela secundaria debían firmar contratos en los que se comprometían a esforzarse al máximo en su trabajo escolar y a obedecer las reglas de la escuela; si no deseaban hacerlo, podían asistir a otra escuela secundaria del distrito. Al cabo de un año, el desempeño de los estudiantes en las pruebas estatales había aumentado en diez puntos porcentuales con respecto al año anterior. ¿Esta mejora prueba que una jornada escolar más larga mejora el rendimiento de los estudiantes?
19. Usted lee un artículo de prensa en el que se informa que comer almendras aumenta la satisfacción en la vida. El estudio lo hizo la Asociación de Cultivadores de Almendras y se basó en una encuesta aleatoria en la que se le preguntaba a la gente sobre su consumo de diversos alimentos, entre ellos las almendras, y también sobre su satisfacción con diferentes aspectos de su vida. ¿Hay algo en este sondeo que lo lleve a cuestionar su conclusión?
20. ¿Por qué la falta de respuesta es un problema en las encuestas?
1.3: Frecuencia, tablas de frecuencia y niveles de medición
21. Calcule la media de los siguientes números y presente su respuesta con un decimal más de los que están en los datos originales:
14, 5, 18, 23, 6
1.4: Diseño experimental y ética
22. Un psicólogo está interesado en saber si el tamaño de la vajilla (boles, platos, etc.) influye en cuánto comen los estudiantes universitarios. Asigna aleatoriamente a 100 estudiantes de universitarios a uno de los dos grupos: al primero se le sirve una comida con una vajilla de tamaño normal, mientras que al segundo se le sirve la misma comida, pero con una vajilla un 20 % más pequeña de lo normal. Registra la cantidad de comida que consume cada grupo. Identifique los siguientes componentes de este estudio.
- población
- muestra
- unidades experimentales
- variable explicativa
- tratamiento
- variable de respuesta
23. Un investigador analiza los resultados de la Prueba de Aptitud Académica (Scholastic Aptitude Test, SAT) durante un periodo de cinco años y descubre que los estudiantes hombres obtienen una calificación promedio más alta en la sección de Matemáticas, y las mujeres una calificación promedio más alta en la sección verbal. Concluye que estas diferencias observadas en el desempeño de las pruebas se deben a factores genéticos. Explique cómo las variables ocultas podrían ofrecer una explicación alternativa a las diferencias observadas en las calificaciones de los exámenes.
24. Explique por qué no sería posible utilizar la asignación aleatoria para estudiar los efectos del hábito de fumar sobre la salud.
25. Una profesora hace una encuesta telefónica entre la población de una ciudad mediante una muestra de números del directorio telefónico y les pide a sus estudiantes ayudantes que llamen una vez a cada uno de los números seleccionados para administrar la encuesta. ¿Cuáles son las fuentes de sesgo de esta encuesta?
26. Una profesora ofrece créditos adicionales a estudiantes que participan en sus estudios de investigación. ¿Qué problema ético plantea este método de reclutamiento de sujetos?
2.1: Gráficos de tallo y hoja (diagramas de tallo), de líneas y de barras
Use la siguiente información para responder los próximos cuatro ejercicios. Las notas del examen de Química de mitad de semestre, en una escala del 0 al 100, fueron las siguientes:
62, 64, 65, 65, 68, 70, 72, 72, 74, 75, 75, 75, 76,78, 78, 81, 83, 83, 84, 85, 87, 88, 92, 95, 98, 98, 100, 100, 740
27. ¿Ve algún valor atípico en estos datos? Si es así, ¿cómo abordaría la situación?
28. Construya un diagrama de tallo para estos datos y use solo los valores del rango entre 0 y 100.
29. Describa la distribución de las calificaciones de los exámenes.
2.2: Histogramas, polígonos de frecuencia y gráficos de series temporales
30. En un aula de 35 estudiantes siete de ellos obtuvieron calificaciones en el rango entre 70 y 79. ¿Cuál es la frecuencia relativa de las calificaciones en este rango?
Use la siguiente información para responder los próximos tres ejercicios. Usted lleva a cabo un sondeo entre 30 estudiantes para saber cuántas clases van a tomar este trimestre. Sus resultados son:
1; 1; 1; 1
2; 2; 2; 2; 2
3; 3; 3; 3; 3; 3; 3; 3
4; 4; 4; 4; 4; 4; 4; 4; 4
5; 5; 5; 5
31. Usted decide construir un histograma de estos datos. ¿Cuál será el rango de su primera barra y cuál será el punto central?
32. ¿Cuáles serán los anchos y los puntos centrales de las otras barras?
33. ¿Cuál barra de este histograma será la más alta y cuál será su altura?
34. Usted obtiene los datos de la Oficina del Censo de EE. UU. sobre la mediana de la renta de los hogares de su ciudad y decide mostrarlos gráficamente. ¿Cuál es la mejor opción para estos datos, un gráfico de barras o un histograma?
35. Usted recopila datos sobre el color de los automóviles que conducen los estudiantes de su clase de estadística y quiere mostrar esta información de forma gráfica. ¿Cuál es la mejor opción para estos datos, un gráfico de barras o un histograma?
2.3: Medidas de la ubicación de los datos
36. Su hija lleva a casa los resultados de los exámenes que muestran que ha obtenido una calificación para su curso en el percentil 80 en Matemáticas y en el percentil 76 en lectura. Interprete estas calificaciones.
37. Hay que esperar 90 minutos en la sala de urgencias de un hospital antes de que un médico lo atienda. Se entera de que su tiempo de espera estaba en el percentil 82 de todos los tiempos de espera. Explique qué significa esto y si cree que es bueno o no.
2.4: Diagramas de caja
Use la siguiente información para responder los próximos tres ejercicios. 1; 1; 2; 3; 4; 4; 5; 5; 6; 7; 7; 8; 9
38. ¿Cuál es la mediana de estos datos?
39. ¿Cuál es el primer cuartil de estos datos?
40. ¿Cuál es el tercer cuartil de estos datos?
Use la siguiente información para responder los próximos cuatro ejercicios. Este diagrama de caja representa las calificaciones del examen final de una clase de Física.
41. ¿Cuál es la mediana de estos datos y cómo lo sabe?
42. ¿Cuáles son el primer y el tercer cuartil de estos datos y cómo lo sabe?
43. ¿Cuál es el rango intercuartil de estos datos?
44. ¿Cuál es el rango de estos datos?
2.5: Medidas del centro de los datos
45. En un maratón, la mediana del tiempo de llegada fue de 3:35:04 (tres horas, 35 minutos y cuatro segundos). Usted llegó en el tiempo 3:34:10. Interprete el significado de la mediana del tiempo y analice su tiempo en relación con ella.
Use la siguiente información para responder los próximos tres ejercicios. El valor, en miles de dólares, de las casas de una manzana, son: 45; 47; 47,5; 51; 53,5; 125.
46. Calcule la media de estos datos.
47. Calcule la mediana de estos datos.
48. ¿Cuál cree que refleja mejor el valor promedio de las viviendas de esta manzana?
2.6: Distorsión y media, mediana y moda
49. En una distribución con asimetría a la izquierda, ¿cuál es mayor?
- la media
- la mediana
- la moda
50. En una distribución con asimetría a la derecha, ¿cuál es mayor?
- la media
- la mediana
- la moda
51. En una distribución simétrica, ¿cuál será la relación entre la media, la mediana y la moda?
2.7: Medidas de la dispersión de los datos
Use la siguiente información para responder los próximos cuatro ejercicios. 10; 11; 15; 15; 17; 22
52. Calcule la media y la desviación típica de estos datos mediante la fórmula de la muestra para la desviación típica.
53. ¿Qué número está dos desviaciones típicas por encima de la media de estos datos?
54. Exprese el número 13,7 en términos de la media y la desviación típica de estos datos.
55. En una clase de Biología, las calificaciones del examen final se distribuyen normalmente, con una media de 85 y una desviación típica de cinco. Susan obtuvo una calificación de 95 en el examen final. Exprese el resultado de su examen como una puntuación z, e interprete su significado.
3.1: Terminología
Use la siguiente información para responder los próximos dos ejercicios. Tiene un frasco lleno de canicas: 50 son rojas, 25 azules y 15 amarillas. Supongamos que saca una canica al azar en cada ensayo y la sustituye antes del siguiente.
Supongamos que P(R) = la probabilidad de sacar una canica roja.
Supongamos que P(B) = la probabilidad de sacar una canica azul.
Supongamos que P(Y) = la probabilidad de sacar una canica amarilla.
56. Calcule P(B).
57. ¿Qué es más probable, sacar una canica roja o una canica amarilla? Justifique su respuesta numéricamente.
Use la siguiente información para responder los próximos dos ejercicios. Las siguientes son probabilidades que describen un grupo de estudiantes de educación superior.
Supongamos que P(M) = la probabilidad de que el estudiante sea hombre.
Supongamos que P(F) = la probabilidad de que el estudiante sea mujer.
Supongamos que P(E) = la probabilidad de que el estudiante se especialice en Educación.
Supongamos que P(S) = la probabilidad de que el estudiante se especialice en Ciencias.
58. Escriba los símbolos de la probabilidad de que un estudiante, seleccionado al azar, sea a la vez mujer y con especialidad en Ciencias.
59. Escriba los símbolos de la probabilidad de que el estudiante se especialice en Educación, y el valor dado es que es hombre.
3.2: Eventos mutuamente excluyentes e independientes
60. Los eventos A y B son independientes.
Si P(A) = 0,3 y P(B) = 0,5, halle P(A Y B).
61. C y D son eventos mutuamente excluyentes.
Si P(C) = 0,18 y P(D) = 0,03; halle P(C O D).
3.3: Dos reglas básicas de la probabilidad
62. En una promoción de 300 estudiantes de escuela secundaria, 200 van a ir a un instituto universitario, 40 piensan trabajar a tiempo completo y 80 se toman un año sabático. ¿Son estos eventos mutuamente excluyentes?
Use la siguiente información para responder los próximos dos ejercicios. Una arquera acierta en el centro del blanco (la diana) el 70 % de las veces. Sin embargo, es una tiradora de rachas, y si acierta el centro en un tiro, su probabilidad de acertar en el tiro inmediatamente posterior es de 0,85. Escrito en notación probabilística:
P(A) = P(B) = P(acertar el centro en un tiro) = 0,70
P(B|A) = P(acertar el centro en un segundo tiro, dado que ella lo hizo en el primero) = 0,85
63. Calcule la probabilidad de que acierte en el centro del blanco en dos lanzamientos consecutivos.
64. ¿P(A) y P(B) son independientes en este ejemplo?
3.4: Tablas de contingencia
Use la siguiente información para responder los próximos tres ejercicios. La siguiente tabla de contingencia muestra el número de estudiantes que declaran haber estudiado, al menos, 15 horas a la semana y cuántos estuvieron en el cuadro de honor el semestre pasado.
Cuadro de honor | No están en el cuadro de honor | Total | |
---|---|---|---|
Estudian, al menos, 15 horas a la semana | 200 | ||
Estudian menos de 15 horas a la semana | 125 | 193 | |
Total | 1.000 |
65. Rellene la tabla.
66. Calcule P(cuadro de honor|estudian, al menos, 15 horas a la semana).
67. ¿Cuál es la probabilidad de que un estudiante estudie menos de 15 horas a la semana?
68. ¿Los eventos “estudian, al menos, 15 horas a la semana” y “estar en el cuadro de honor” son independientes? Justifique su respuesta numéricamente.
3.5: Diagramas de árbol y de Venn
69. En una escuela secundaria algunos estudiantes juegan en el equipo de tenis y otros en el de fútbol, pero ninguno juega tanto tenis como fútbol. Dibuje un diagrama de Venn que lo ilustre.
70. En una escuela secundaria algunos estudiantes juegan tenis, otros fútbol y otros ambas cosas. Dibuje un diagrama de Venn que lo ilustre.
Soluciones de la prueba de práctica 1
1.1: Definiciones de estadística, probabilidad y términos clave
1.
- población: todas las visitas de compra de todos los clientes de la tienda
- muestra: las 1.000 visitas extraídas para el estudio
- parámetro: el gasto promedio en productos agrícolas por visita de todos los clientes de la tienda
- estadística: el gasto promedio en productos agrícolas por visita de la muestra de 1.000
- variable: el gasto en productos agrícolas para cada visita
- datos: los montos en dólares gastados en productos agrícolas; por ejemplo, 15,40 dólares, 11,53 dólares, etc.
2. c
3. d
1.2: Datos, muestreo y variación de datos y muestreo
4. d
5. c
6. Las respuestas variarán.
Ejemplo de respuesta: Cualquier solución en la que se utilicen datos de toda la población es aceptable. Por ejemplo, una profesora puede calcular la calificación promedio de los exámenes de su clase: como en el cálculo se usaron las calificaciones de todos los miembros de la clase, el promedio es un parámetro.
7. b
8. a
9.
N.º de años | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
< 5 | 25 | 0,25 | 0,25 |
5–10 | 30 | 0,30 | 0,55 |
> 10 | 45 | 0,45 | 1,00 |
10. 0,75
11. 0,55
12. Las respuestas variarán.
Ejemplo de respuesta: Una posibilidad es obtener la lista de la clase y asignar a cada estudiante un número del 1 al 200. Luego, usar un generador de números aleatorios o una tabla de números aleatorios para generar 30 números entre 1 y 200 y seleccionar a los estudiantes que coinciden con los números aleatorios. También sería aceptable escribir el nombre de cada estudiante en una tarjeta, mezclarlas en una caja y sacar 30 nombres al azar.
13. Una posibilidad sería obtener una lista de estudiantes inscritos en el instituto universitario e incluir la categoría de cada estudiante. Luego, extraería una muestra aleatoria proporcional de cada clase (por ejemplo, si el 30 % de los estudiantes del instituto universitario son de primer año, el 30 % de la muestra se extraería de la clase de primer año).
14. Para la primera persona elegida, la probabilidad de que cada una sea seleccionada es de una en 150. Para la segunda persona, es una de cada 149, para la tercera es una en 148 y así sucesivamente. Para la 30.ª persona seleccionada, la probabilidad de selección es de una en 121.
15. a
16. No. Hay, al menos, dos posibilidades de sesgo. Primero, los espectadores de este programa en particular pueden no ser representativos de los aficionados al fútbol americano en su conjunto. Segundo, la muestra será autoseleccionada, ya que las personas tienen que hacer una llamada telefónica para participar, y esas personas probablemente no sean representativas de la población de aficionados al fútbol americano en su conjunto.
17. Estos resultados (84 % en una muestra, 86 % en la otra) se deben probablemente a la variabilidad del muestreo. Cada investigador extrajo una muestra diferente de niños, y no cabe esperar que obtengan exactamente el mismo resultado, aunque sí que los resultados sean similares, como ocurre en este caso.
18. No. La mejora también se podría deber a la autoselección: solo estudiantes motivados estaban dispuestos a firmar el contrato, y lo habrían hecho bien incluso en una escuela con jornadas de 6,5 horas. Como ambos cambios se implementaron al mismo tiempo, no es posible separar su influencia.
19. Al menos dos aspectos de este sondeo son problemáticos. El primero es que fue realizada por un grupo que se beneficiaría del resultado: es probable que las ventas de almendras aumenten si las personas creen que comerlas las hará más felices. El segundo es que este sondeo halló que el consumo de almendras y la satisfacción vital están correlacionados, pero no establece que comer almendras cause satisfacción. Es igualmente posible, por ejemplo, que personas con mayores ingresos sean más propensas a comer almendras y también estén más satisfechas con su vida.
20. Se desea que la muestra de personas que participan en una encuesta sea representativa de la población de la que se extrae. Las personas que se niegan a participar en una encuesta suelen tener opiniones diferentes a las de las que sí participan, por lo que incluso una muestra aleatoria puede producir resultados sesgados si un gran porcentaje de los seleccionados se niega a participar en una encuesta.
1.3: Frecuencia, tablas de frecuencia y niveles de medición
21. 13,2
1.4: Diseño experimental y ética
22.
- población: todos los estudiantes de institutos universitarios
- muestra: los 100 estudiantes del instituto universitario del estudio
- unidades experimentales: cada estudiante del instituto universitario que participó
- variable explicativa: el tamaño de la vajilla
- tratamiento: vajilla un 20 % más pequeña de lo normal
- variable de respuesta: la cantidad de alimentos ingeridos
23. Hay muchas variables ocultas que podrían influir en las diferencias observadas en las calificaciones de los exámenes. Tal vez los niños, en promedio, hayan tomado más cursos de Matemáticas que las niñas, y las niñas hayan tomado más clases de Inglés que los niños. Quizás sus familias y sus maestros hayan animado a los niños a prepararse para una carrera en Matemáticas y Ciencias, y por eso se han esforzado más en estudiar Matemáticas, mientras que a las niñas se las ha animado a prepararse para campos como la Comunicación y la Psicología, más centrados en el uso del lenguaje. El diseño de un estudio tendría que controlar estas y otras posibles variables ocultas (cualquier cosa que pudiera explicar la diferencia observada en las calificaciones de las pruebas, aparte de la explicación genética) para poder sacar una conclusión científicamente sólida sobre diferencias genéticas.
24. Para poner en práctica la asignación aleatoria, habría que poder asignar a las personas a fumar o no fumar. Dado que el hábito de fumar tiene muchos efectos nocivos, no sería un experimento ético. En cambio, estudiamos a personas que han elegido fumar y las comparamos con otras que han elegido no fumar, e intentamos controlar las otras formas en que esos dos grupos pueden diferir (variables ocultas).
25. Las fuentes de sesgo incluyen el hecho de que no todas las personas tienen un teléfono, que los números de teléfono móvil, a menudo, no figuran en los directorios publicados y que una persona puede no estar en casa en el momento de la llamada telefónica; todos estos factores hacen que sea probable que los encuestados no sean representativos del conjunto de la población.
26. No se debe coaccionar a los sujetos de la investigación a que participen, y ofrecer créditos adicionales a cambio de la participación podría interpretarse como coacción. Además, este método ocasionará una muestra voluntaria que no puede suponerse representativa del conjunto de la población.
2.1: Gráficos de tallo y hoja (diagramas de tallo), de líneas y de barras
27. El valor 740 es un valor atípico porque los exámenes se calificaron en una escala de 0 a 100, y 740 está muy lejos de ese rango. Puede tratarse de un error de introducción de datos siendo la calificación real de 74, por lo que el profesor debería volver a revisar ese examen para ver cuál fue la calificación real.
28.
Tallo | Hoja |
---|---|
6 | 2 4 5 5 8 |
7 | 0 2 2 4 5 5 5 6 8 8 |
8 | 1 3 3 4 5 7 8 |
9 | 2 5 8 8 |
10 | 0 0 |
29. La mayoría de las calificaciones de este examen se situaron en el rango de 70 a 89, con unas pocas calificaciones en el rango de 60 a 69 y unas pocas en el rango de 90 a 100.
2.2: Histogramas, polígonos de frecuencia y gráficos de series temporales
30.
31. El rango será de 0,5 a 1,5, y el punto central será 1.
32. Rango de 1,5 a 2,5, punto central 2; rango de 2,5 a 3,5, punto central 3; rango de 3,5 a 4,5, punto central 4; rango de 4,5 a 5,5, punto central 5.
33. La barra de 3,5 a 4,5, con un punto central de 4, será la más alta; su altura será de nueve, ya que hay nueve estudiantes que toman cuatro cursos.
34. El histograma es una mejor opción porque los ingresos son una variable continua.
35. Un gráfico de barras es la mejor opción porque estos datos son categóricos y no continuos.
2.3: Medidas de la ubicación de los datos
36. Su hija obtuvo una calificación mejor que el 80 % de los estudiantes de su grado en Matemáticas y mejor que el 76 % de los estudiantes en Lectura. Ambas calificaciones son muy buenas y la sitúan en el cuartil superior, pero su calificación en Matemáticas es ligeramente mejor en relación con sus compañeros que su calificación en Lectura.
37. Tuvo un tiempo de espera inusualmente largo, lo cual es deficiente: El 82 % de los pacientes tuvo un tiempo de espera más corto que el suyo, y solo el 18 % tuvo un tiempo de espera más largo.
2.4: Diagramas de caja
38. 5
39. 3
40. 7
41. La mediana es de 86, representada por la línea vertical del recuadro.
42. El primer cuartil es 80 y el tercer cuartil es 92, tal y como se representa en los límites izquierdo y derecho del recuadro.
43. IQR = 92 – 80 = 12
44. Rango = 100 – 75 = 25
2.5: Medidas del centro de los datos
45. La mitad de los corredores que terminaron el maratón corrieron un tiempo más rápido que 3:35:04, y la mitad corrieron un tiempo más lento que 3:35:04. Su tiempo es más rápido que la mediana del tiempo, por lo que lo ha hecho mejor que más de la mitad de los corredores de esta carrera.
46. 61,5, o 61.500 dólares
47. 49,25 o 49.250 dólares
48. La mediana, porque la media está distorsionada por el alto valor de una casa.
2.6: Distorsión y media, mediana y moda
49. c
50. a
51. Todos ellos estarán bastante cerca unos de otros.
2.7: Medidas de la dispersión de los datos
52. Media: 15
Desviación típica: 4,3
53. 15 + (2)(4,3) = 23,6
54. 13,7 es una desviación típica por debajo de la media de estos datos, porque 15 - 4,3 = 10,7
55.
La puntuación z de Susan fue de 2,0, lo que significa que obtuvo dos desviaciones típicas por encima de la media de la clase en el examen final.
3.1: Terminología
56.
57. Es más probable sacar una canica roja.
58. P(F Y S)
59. P(E|M)
3.2: Eventos mutuamente excluyentes e independientes
60. P(A Y B) = (0,3)(0,5) = 0,15
61. P(C O D) = 0,18 + 0,03 = 0,21
3.3: Dos reglas básicas de la probabilidad
62. No, no pueden ser mutuamente excluyentes, porque suman más de 300. Por lo tanto, algunos estudiantes deben encajar en dos o más categorías (p. ej., ir a un instituto universitario y trabajar a tiempo completo).
63. P(A y B) = (P(B|A))(P(A)) = (0,85)(0,70) = 0,595
64. No. Si fueran independientes, P(B) sería igual que P(B|A). Sabemos que no es así, porque P(B) = 0,70 y P(B|A) = 0,85.
3.4: Tablas de contingencia
65.
Cuadro de honor | No están en el cuadro de honor | Total | |
---|---|---|---|
Estudian, al menos, 15 horas a la semana | 482 | 200 | 682 |
Estudian menos de 15 horas a la semana | 125 | 193 | 318 |
Total | 607 | 393 | 1.000 |
66.
67.
68. Supongamos que P(S) = estudia, al menos, 15 horas a la semana.
Supongamos que P(H) = está en el cuadro de honor.
De la tabla, P(S) = 0,682, P(H) = 0,607 y P(S Y H) = 0,482.
Si P(S) y P(H) fueran independientes, entonces P(S Y H) sería igual a (P(S))(P(H)).
Sin embargo, (P(S))(P(H)) = (0,682)(0,607) = 0,414, mientras que P(S Y H) = 0,482.
Por lo tanto, P(S) y P(H) no son independientes.
3.5: Diagramas de árbol y de Venn
69.
70.
Prueba de práctica 2
4.1: Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
Use la siguiente información para responder los próximos cinco ejercicios. Usted realiza una encuesta entre una muestra aleatoria de estudiantes de una determinada universidad. Los datos recopilados incluyen su especialidad, el número de clases que tomaron el semestre anterior y la cantidad de dinero que gastaron en libros comprados para las clases en el semestre anterior.
1. Si X = la especialidad del estudiante, ¿cuál es el dominio de X?
2. Si Y = el número de clases tomadas en el semestre anterior, ¿cuál es el dominio de Y?
3. Si Z = la cantidad de dinero gastada en libros en el semestre anterior, ¿cuál es el dominio de Z?
4. ¿Por qué X, Y y Z son variables aleatorias en el ejemplo anterior?
5. Después de recopilar los datos, halla que para un caso Z = –7. ¿Este es un valor posible para Z?
6. ¿Cuáles son las dos características esenciales de una distribución de probabilidad discreta?
Use esta distribución de probabilidad discreta representada en esta tabla para responder las próximas seis preguntas. La biblioteca de la universidad registra el número de libros prestados por cada usuario a lo largo de un día, con el siguiente resultado:
x | P(x) |
---|---|
0 | 0,20 |
1 | 0,45 |
2 | 0,20 |
3 | 0,10 |
4 | 0,05 |
7. Defina la variable aleatoria X para este ejemplo.
8. ¿Qué es P(x > 2)?
9. ¿Cuál es la probabilidad de que un cliente pida prestado al menos un libro?
10. ¿Cuál es la probabilidad de que un cliente no pida prestado más de tres libros?
11. Si en la tabla aparece P(x) como 0,15, ¿cómo sabría que hay un error?
12. ¿Cuál es el número promedio de libros que pide prestado un cliente?
4.2: Media o valor esperado y desviación típica
Use la siguiente información para responder los próximos cuatro ejercicios. En una compañía hay tres puestos de trabajo vacantes: uno en el departamento de contabilidad, otro en el de recursos humanos y otro en el de ventas. El puesto de trabajo de Contabilidad recibe 30 solicitantes, el Departamento de Recursos Humanos recibe 40 solicitantes y el Departamento de Recursos Humanos y Ventas recibe 60 solicitantes.
13. Si X = el número de solicitudes para un puesto de trabajo, utilice esta información para rellenar la Tabla B7.
x | P(x) | xP(x) |
---|---|---|
14. ¿Cuál es el número medio de solicitantes por cada departamento?
15. ¿Cuál es la Función de Distribución de Probabilidad (Probability Distribution Function, PDF) de X?
16. Añada una cuarta columna a la tabla, para (x – μ)2P(x).
17. ¿Cuál es la desviación típica de X?
4.3: Distribución binomial
18. En un experimento binomial, si p = 0,65, ¿a qué equivale q?
19. ¿Cuáles son las características necesarias de un experimento binomial?
20. Joe realiza un experimento para ver cuántas veces tiene que lanzar una moneda antes de obtener cuatro caras seguidas. ¿Califica esto como un experimento binomial?
Use la siguiente información para responder los próximos tres ejercicios. En una comunidad en particular, el 65 % de los hogares tienen, al menos, una persona que se ha graduado de un instituto universitario. Usted toma una muestra aleatoria de 100 hogares de esta comunidad. Supongamos que X = el número de hogares donde al menos uno de sus integrantes tiene un título universitario.
21. Describa la distribución de probabilidad de X.
22. ¿Cuál es la media de X?
23. ¿Cuál es la desviación típica de X?
Use la siguiente información para responder los próximos cuatro ejercicios. Joe es la estrella del equipo de béisbol de su escuela. Su promedio de bateo es de 0,400, lo que significa que por cada diez veces que le toca batear (turno al bate), cuatro de esas veces ejecuta un batazo imparable. Usted decide seguir su desempeño de bateo en sus próximos 20 turnos al bate.
24. Defina la variable aleatoria X en este experimento.
25. Suponiendo que la probabilidad de Joe de ejecutar un batazo imparable es independiente e idéntica en los 20 turnos al bate, describa la distribución de X.
26. Dada esta información, ¿qué número de aciertos predice que obtendrá Joe?
27. ¿Cuál es la desviación típica de X?
4.4: Distribución geométrica
28. ¿Cuáles son las tres principales características de un experimento geométrico?
29. Decide realizar un experimento geométrico lanzando una moneda hasta que salga cara. Esto requiere cinco ensayos. Represente los resultados de este ensayo mediante H para cara y T para cruz.
30. Está realizando un experimento geométrico sacando cartas de un mazo regular de 52 cartas, con reemplazo, hasta sacar la reina de corazones. ¿Cuál es el dominio de X para este experimento?
31. Está realizando un experimento geométrico sacando cartas de un mazo regular de 52 cartas, sin reemplazo, hasta que saque una carta roja. ¿Cuál es el dominio de X para este experimento?
Use la siguiente información para responder los próximos tres ejercicios. En una universidad en particular el 27 % de los estudiantes se especializan en Ingeniería. Decide seleccionar estudiantes al azar hasta que elige a uno que se especializa en Ingeniería. Supongamos que X = el número de estudiantes que selecciona hasta hallar uno que se especialice en Ingeniería.
32. ¿Cuál es la distribución de probabilidad de X?
33. ¿Cuál es la media de X?
34. ¿Cuál es la desviación típica de X?
4.5: Distribución hipergeométrica
35. Usted extrae una muestra aleatoria de diez estudiantes para que participen en una encuesta de un grupo de 30 formado por 16 niños y 14 niñas. Le interesa la probabilidad de que siete de los estudiantes seleccionados sean niños. ¿Califica esto como un experimento hipergeométrico? Enumere las condiciones y si se cumplen o no.
36. Usted saca cinco cartas, sin reemplazo, de un mazo regular de 52 cartas y está interesado en la probabilidad de que dos de las cartas sean picas. ¿Cuáles son el grupo de interés, el tamaño del grupo de interés y el tamaño de la muestra para este ejemplo?
4.6: Distribución de Poisson
37. ¿Cuáles son las principales características de la distribución de Poisson?
Use la siguiente información para responder los próximos tres ejercicios. El número de conductores que llegan a una cabina de peaje en una hora se puede modelar mediante la distribución de Poisson.
38. Si X = el número de conductores, y el promedio de conductores por hora es de cuatro, ¿cómo expresaría esta distribución?
39. ¿Cuál es el dominio de X?
40. ¿Cuáles son la media y la desviación típica de X?
5.1: Funciones de probabilidad continuas
41. Lleva a cabo una encuesta entre los estudiantes para ver cuántos libros compraron el semestre anterior, la cantidad total que pagaron por esos libros, el número que vendieron una vez terminó el semestre y la cantidad de dinero que recibieron por los libros que vendieron. ¿Cuáles variables de esta encuesta son discretas y cuáles son continuas?
42. Con las variables aleatorias continuas nunca calculamos la probabilidad de que X tenga un valor determinado, sino que siempre hablamos en términos de la probabilidad de que X tenga un valor dentro de un rango determinado. ¿Por qué?
43. Para una variable aleatoria continua, ¿por qué P(x < c) y P(x ≤ c) son afirmaciones equivalentes?
44. Para una función de probabilidad continua, P(x < 5) = 0,35. ¿Qué es P(x > 5), y cómo lo sabe?
45. Describa cómo dibujaría la distribución de probabilidad continua descrita por la función para . ¿Qué tipo de distribución es esta?
46. Para la distribución de probabilidad continua descrita por la función para , ¿cuál es la P(0 < x < 4)?
5.2: La distribución uniforme
47. Para la distribución de probabilidad continua descrita por la función para , ¿cuál es la P(2 < x < 5)?
Use la siguiente información para responder los próximos cuatro ejercicios. El número de minutos que un paciente espera en una clínica médica para ser atendido por un médico se representa mediante una distribución uniforme entre cero y 30 minutos, ambos inclusive.
48. Si X es igual al número de minutos que espera una persona, ¿cuál es la distribución de X?
49. Escriba la función de densidad de probabilidad de esta distribución.
50. ¿Cuál es la media y la desviación típica del tiempo de espera?
51. ¿Cuál es la probabilidad de que un paciente espere menos de diez minutos?
5.3: La distribución exponencial
52. La distribución de la variable X, que representa el tiempo promedio hasta el fallo de una batería de automóvil, puede escribirse como X ~ Exp(m). Describa esta distribución con palabras.
53. Si el valor de m para una distribución exponencial es diez, ¿cuáles son la media y la desviación típica de la distribución?
54. Escriba la función de densidad de probabilidad para una variable distribuida como: X ~ Exp(0,2).
6.1: La distribución normal estándar
55. Traslade a palabras esta afirmación sobre la distribución de una variable aleatoria X: X ~ (100, 15).
56. Si la variable X tiene la distribución normal estándar, expréselo simbólicamente.
Use la siguiente información para los próximos seis ejercicios. Según la Organización Mundial de la Salud, la altura en centímetros para niñas de cinco años y cero meses se distribuye de la siguiente manera: X ~ N(109, 4,5).
57. ¿Cuál es la puntuación z para una altura de 112 pulgadas?
58. ¿Cuál es la puntuación z para una altura de 100 centímetros?
59. Calcule la puntuación z para una altura de 105 centímetros y explique lo que significa en el contexto de la población.
60. ¿Qué altura corresponde a una puntuación z de 1,5 en esta población?
61. Mediante la regla empírica esperamos que, aproximadamente, el 68 % de los valores de una distribución normal se sitúen dentro de una desviación típica por encima o por debajo de la media. En términos de un rango específico de valores, ¿qué significa esto para esta distribución?
62. Mediante la regla empírica, ¿aproximadamente qué porcentaje de alturas en esta distribución espera que estén entre 95,5 cm y 122,5 cm?
6.2: Uso de la distribución normal
Use la siguiente información para responder los próximos cuatro ejercicios. El distribuidor de billetes de lotería afirma que el 20 % de los billetes son ganadores. Se extrae una muestra de 500 billetes para probar esta proposición.
63. ¿Puede usar la aproximación normal a la binomial para sus cálculos? Por qué sí o por qué no.
64. ¿Cuáles son la media y la desviación típica esperadas para su muestra, suponiendo que la afirmación del distribuidor sea cierta?
65. ¿Cuál es la probabilidad de que su muestra tenga una media superior a 100?
66. Si la puntuación z del resultado de su muestra es –2,00, explique qué significa esto mediante la regla empírica.
7.1: Teorema del límite central de medias muestrales (promedios)
67. ¿Qué dice el teorema del límite central con respecto a la distribución de medias muestrales?
68. La distribución de los resultados al lanzar una moneda imparcial es uniforme: la cara y la cruz tienen la misma probabilidad en cualquier lanzamiento y, en un gran número de pruebas, se espera aproximadamente el mismo número de caras y de cruces. Sin embargo, si se realiza un estudio lanzando 30 monedas, se registra el número de caras y se repite 100 veces, la distribución de la media del número de caras será aproximadamente normal. ¿Cómo es posible?
69. La media de una población distribuida normalmente es 50, y la desviación típica es cuatro. Si extrae 100 muestras de tamaño 40 de esta población, describa lo que esperaría ver en términos de la distribución del muestreo de la media muestral.
70. X es una variable aleatoria con una media de 25 y una desviación típica de dos. Escriba la distribución para la media muestral de muestras de tamaño 100 extraídas de esta población.
71. Su amigo está haciendo un experimento extrayendo muestras de tamaño 50 de una población con una media de 117 y una desviación típica de 16. Este tamaño de muestra es lo suficientemente grande como para permitir el uso del teorema del límite central, por lo que dice que la desviación típica de la distribución del muestreo de la media muestral también será 16. Explique por qué es un error y calcule el valor correcto.
72. Está leyendo un artículo de investigación que hace referencia al “error estándar de la media”. ¿Qué significa esto y cómo se calcula?
Use la siguiente información para responder los próximos seis ejercicios. Se extraen repetidamente muestras de n = 100 de una población con una media de 75 y una desviación típica de 4,5.
73. ¿Cuál es la distribución esperada de las medias muestrales?
74. Uno de sus amigos intenta convencerlo de que el error estándar de la media debe ser 4,5. Explique qué error cometió su amigo.
75. ¿Cuál es la puntuación z para una media muestral de 76?
76. ¿Cuál es la puntuación z para una media muestral de 74,7?
77. ¿Qué media muestral corresponde a una puntuación z de 1,5?
78. Si se reduce el tamaño de la muestra a 50, ¿el error estándar de la media será menor o mayor? ¿Cuál sería su valor?
Use la siguiente información para responder las dos próximas preguntas. Usamos la regla empírica para analizar los datos de muestras de tamaño 60 extraídas de una población con una media de 70 y una desviación típica de 9.
79. ¿Qué rango de valores se espera que incluya el 68 % de las medias muestrales?
80. Si aumenta el tamaño de la muestra a 100, ¿qué rango esperaría que contuviera el 68 % de las medias muestrales mediante la regla empírica?
7.2: El teorema del límite central para las sumas
81. ¿Cómo se aplica el teorema del límite central a las sumas de variables aleatorias?
82. Explique en qué se parecen las reglas que aplican el teorema del límite central a las medias muestrales y a las sumas de una variable aleatoria.
83. Si se extraen repetidamente muestras de tamaño 50 de una población con una media de 80 y una desviación típica de cuatro y se calcula la suma de cada muestra, ¿cuál es la distribución esperada de estas sumas?
Use la siguiente información para responder los próximos cuatro ejercicios. Se extrae una muestra de tamaño 40 de una población con una media de 125 y una desviación típica de siete.
84. Calcule la suma. ¿Cuál es la probabilidad de que la suma de su muestra sea inferior a 5.000?
85. Si toma muestras de este tamaño repetidamente, calculando la suma cada vez, ¿qué rango de valores esperaría que contuviera el 95 % de las sumas de las muestras?
86. ¿Qué valor es una desviación típica por debajo de la media?
87. ¿Qué valor corresponde a una puntuación z de 2,2?
7.3: Uso del teorema del límite central
88. ¿Qué dice la ley de los grandes números sobre la relación entre la media muestral y la media de la población?
89. Al aplicar la ley de los grandes números, ¿qué media muestral se acercaría más a la media de la población, una muestra de tamaño diez o una muestra de tamaño 100?
Use esta información para las próximas tres preguntas. Un fabricante hace tornillos con un diámetro medio de 0,15 cm (centímetros) y un rango de 0,10 cm a 0,20 cm; dentro de ese rango, la distribución es uniforme.
90. Si X = el diámetro de un tornillo, ¿cuál es la distribución de X?
91. Supongamos que se extraen repetidamente muestras de tamaño 100 y se calcula su media. Al aplicar el teorema del límite central, ¿cuál es la distribución de estas medias muestrales?
92. Supongamos que extrae repetidamente muestras de 60 y calcula su suma. Al aplicar el teorema del límite central, ¿cuál es la distribución de estas sumas muestrales?
Soluciones de la prueba de práctica 2
Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
1. El dominio de X = {Inglés, Matemáticas, ...}, es decir, una lista de todas las especialidades que se ofrecen en la universidad, más “sin declarar”.
2. El dominio de Y = {0, 1, 2, ...}, es decir, los enteros desde 0 hasta el límite superior de las clases permitidas por la universidad.
3. El dominio de Z = cualquier cantidad de dinero a partir de 0.
4. Porque pueden tomar cualquier valor dentro de su dominio, y su valor para cualquier caso particular no se conoce hasta que se termina la encuesta.
5. No, porque el dominio de Z solo incluye números positivos (no se puede gastar una cantidad negativa de dinero). Posiblemente el valor –7 sea un error de introducción de datos, o un código especial para indicar que el estudiante no ha respondido la pregunta.
6. Las probabilidades deben sumar 1,0, y las probabilidades de cada evento deben estar entre 0 y 1, ambos inclusive.
7. Supongamos que X = el número de libros sacados por un cliente.
8. P(x > 2) = 0,10 + 0,05 = 0,15
9. P(x ≥ 0) = 1 – 0,20 = 0,80
10. P(x ≤ 3) = 1 – 0,05 = 0,95
11. Las probabilidades sumarían 1,10, y la probabilidad total en una distribución debe ser siempre igual a 1,0.
12. = 0(0,20) + 1(0,45) + 2(0,20) + 3(0,10) + 4(0,05) = 1,35
Media o valor esperado y desviación típica
13.
x | P(x) | xP(x) |
---|---|---|
30 | 30/130 | 6,92 |
40 | 40/130 | 12,31 |
60 | 60/130 | 27,69 |
14. = 6,92 + 12,31 + 27,69 = 46,92
15. P(x = 30) = 0,23
P(x = 40) = 0,31
P(x = 60) = 0,46
16.
x | P(x) | xP(x) | (x – μ)2P(x) |
---|---|---|---|
30 | 0,23 | 6,92 | (30 – 46,92)2(0,23) = 66,09 |
40 | 0,31 | 12,31 | (40 – 46,92)2(0,31) = 14,75 |
60 | 0,46 | 46,92 | (60 – 46,92)2(0,46) = 78,93 |
Distribución binomial
18. q = 1 - 0,65 = 0,35
19.
- Hay un número fijo de ensayos.
- Solo hay dos resultados posibles, y suman 1.
- Los ensayos son independientes y se realizan en condiciones idénticas.
20. No, porque no hay un número fijo de ensayos
21. X ~ B(100, 0,65)
22. μ = np = 100(0,65) = 65
23.
24. X = Joe ejecuta un batazo imparable en un turno al bate (en una ocasión en la que viene a batear)
25. X ~ B(20, 0,4)
26. μ = np = 20(0,4) = 8
27.
4.4: Distribución geométrica
28.
- Se realizan una serie de ensayos de Bernoulli hasta que uno de ellos es un acierto, y entonces el experimento se detiene.
- Se realiza al menos un ensayo, pero no hay un límite máximo al número de ensayos.
- La probabilidad de acierto o fallo es igual para cada ensayo.
29. T T T T H
30. El dominio de X = {1, 2, 3, 4, 5, ....n}. Como está haciendo la extracción sin reemplazo, no hay un límite superior para el número de extracciones que pueden ser necesarias.
31. El dominio de X = {1, 2, 3, 4, 5, 6, 7, 8., 9, 10, 11, 12...27}. Como está haciendo la extracción sin reemplazo, y 26 de las 52 cartas son rojas, tiene que extraer una carta roja dentro de las primeras 17 extracciones.
32. X ~ G(0,24)
33.
34.
4.5: Distribución hipergeométrica
35. Sí, porque está haciendo el muestreo de una población compuesta por dos grupos (niños y niñas), tiene un grupo de interés (niños) y está haciendo el muestreo sin reemplazo (por lo tanto, las probabilidades cambian con cada elección, y no está realizando ensayos de Bernoulli).
36. El grupo de interés son las cartas que son picas, el tamaño del grupo de interés es 13 y el tamaño de la muestra es cinco.
4.6: Distribución de Poisson
37. Una distribución de Poisson modela el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, cuando los eventos son independientes y la tasa promedio de los eventos es conocida.
38. X ~ P(4)
39. El dominio de X = {0, 1, 2, 3, .....) es decir, cualquier número entero a partir de 0.
40.
5.1: Funciones de probabilidad continuas
41. Las variables discretas son el número de libros comprados y el número de libros vendidos al final del semestre. Las variables continuas son la cantidad de dinero gastada por los libros y la cantidad de dinero recibida cuando se vendieron.
42. Porque para una variable aleatoria continua, P(x = c) = 0, donde c es un valor cualquiera. En cambio, calculamos P(c < x < d), es decir, la probabilidad de que el valor de x esté entre los valores c y d.
43. Porque P(x = c) = 0 para cualquier variable aleatoria continua.
44. P(x > 5) = 1 – 0,35 = 0,65, porque la probabilidad total de una función de probabilidad continua es siempre 1.
45. Se trata de una distribución de probabilidad uniforme. Se dibujaría como un rectángulo con los lados verticales en 0 y 20, y los lados horizontales en y 0.
46.
5.2: La distribución uniforme
47.
48. X ~ U(0, 15)
49. para para
50.
51.
5.3: La distribución exponencial
52. X tiene una distribución exponencial con parámetro de decaimiento m y media y desviación típica . En esta distribución, habrá un número relativamente grande de valores pequeños, y los valores serán menos comunes a medida que sean más grandes.
53.
54. f(x) = 0,2e–0,2x donde x ≥ 0.
6.1: La distribución normal estándar
55. La variable aleatoria X tiene una distribución normal con una media de 100 y una desviación típica de 15.
56. X ~ N(0,1)
57. así que
58. así que
59.
Esta niña es más baja que el promedio para su edad, en 0,89 desviaciones típicas.
60. 109 + (1,5)(4,5) = 115,75 cm
61. Se espera que alrededor del 68 % de las estaturas de las niñas de cinco años y cero meses estén entre 104,5 cm y 113,5 cm.
62. Esperamos que el 99,7 % de las alturas de esta distribución se sitúen entre 95,5 cm y 122,5 cm porque ese rango representa los valores de tres desviaciones típicas por encima y por debajo de la media.
6.2: Uso de la distribución normal
63. Sí, porque tanto np como nq son mayores que cinco.
np = (500)(0,20) = 100 y nq = 500(0,80) = 400
64.
65. Cincuenta por ciento, porque en una distribución normal la mitad de los valores están por encima de la media.
66. Los resultados de nuestra muestra estaban dos desviaciones típicas por debajo de la media, lo que sugiere que es poco probable que el 20 % de los boletos de lotería sean ganadores, como afirma el distribuidor, y que el verdadero porcentaje de ganadores es menor. Al aplicar la regla empírica, si esa afirmación fuera cierta, esperaríamos ver un resultado tan inferior a la media solo un 2,5 % de las veces.
7.1: Teorema del límite central de medias muestrales (promedios)
67. El teorema del límite central afirma que si se extraen muestras de tamaño suficiente de una población, la distribución de las medias muestrales será normal, incluso si la distribución poblacional no lo es.
68. El tamaño de la muestra de 30 es lo suficientemente grande en este ejemplo para aplicar el teorema del límite central. Este teorema ] establece que para muestras de tamaño suficiente extraídas de una población, la distribución del muestreo de la media muestral se acerca a la normalidad, independientemente de la distribución poblacional de la que se extrajeron las muestras.
69. No se puede esperar que cada muestra tenga una media de 50 debido a la variabilidad del muestreo. Sin embargo, es de esperar que la distribución del muestreo de la media muestral se agrupe en torno a 50, con una distribución aproximadamente normal, de modo que los valores cercanos a 50 sean más comunes que los valores más alejados de 50.
70. porque
71. La desviación típica de la distribución del muestreo de la media muestral se puede calcular mediante la fórmula , que en este caso es . Por tanto, el valor correcto de la desviación típica de la distribución del muestreo de la media muestral es 2,26.
72. El error estándar de la media es otro nombre para la desviación típica de la distribución del muestreo de la media muestral. Dadas muestras de tamaño n extraídas de una población con desviación típica σx, el error estándar de la media es .
73. X ~ N(75, 0,45)
74. Su amigo olvidó dividir la desviación típica entre la raíz cuadrada de n.
75.
76.
77. 75 + (1,5)(0,45) = 75,675
78. El error estándar de la media será mayor porque estará dividiendo entre un número menor. El error estándar de la media para muestras de tamaño n = 50 es:
79. Es de esperar que este rango incluya valores de hasta una desviación típica por encima o por debajo de la media muestral. En este caso:
y por lo que cabría esperar que el 68 % de las medias muestrales estuvieran entre 68,84 y 71,16.
80. y por lo que cabría esperar que el 68 % de las medias muestrales estuvieran entre 69,1 y 70,9. Observe que se trata de un intervalo más estrecho debido al mayor tamaño de la muestra.
7.2: El teorema del límite central para las sumas
81. Para una variable aleatoria X, la variable aleatoria ΣX tenderá a una distribución normal a medida que aumenta el tamaño n de las muestras utilizadas para calcular la suma.
82. Ambas reglas establecen que la distribución de una cantidad (la media o la suma) calculada sobre muestras extraídas de una población tenderá a tener una distribución normal, a medida que aumenta el tamaño de la muestra, independientemente de la distribución poblacional de la que se extraen las muestras.
83. así que
84. La probabilidad es 0,50, porque 5.000 es la media de la distribución muestral de las sumas de tamaño 40 de esta población. Las sumas de las variables aleatorias calculadas a partir de una muestra de tamaño suficiente se distribuyen normalmente y, en una distribución normal, la mitad de los valores están por debajo de la media.
85. Al usar la regla empírica, se esperaría que el 95 % de los valores estuvieran dentro de las dos desviaciones típicas de la media. El uso de la fórmula de la desviación típica es para una suma de muestras: por lo que cabría esperar que el 95 % de los valores estuvieran entre 5.000 + (2)(44,3) y 5.000 - (2)(44,3), o entre 4.911,4 y 588,6.
86.
87.
7.3: Uso del teorema del límite central
88. La ley de los grandes números dice que, a medida que aumenta el tamaño de la muestra, la media muestral tiende a acercarse cada vez más a la media de la población.
89. Es de esperar que la media de una muestra de tamaño 100 esté más cerca de la media de la población, porque la ley de los grandes números dice que, a medida que aumenta el tamaño de la muestra, la media muestral tiende a acercarse a la media de la población.
90. X ~ N(0,10, 0,20)
91. y la desviación típica de una distribución uniforme es . En este ejemplo, la desviación típica de la distribución es
así que
92.
Prueba práctica 3
8.1: Intervalo de confianza, media de población única, desviación típica de la población conocida, normal
Use la siguiente información para responder los próximos siete ejercicios. Se extrae una muestra de tamaño 30 de una población distribuida normalmente y una desviación típica de cuatro.
1. ¿Cuál es el error estándar de la media muestral en este caso redondeado a dos decimales?
2. ¿Cuál es la distribución de la media muestral?
3. Si quiere construir un intervalo de confianza del 95 % doble, ¿cuál será la probabilidad en cada cola de la distribución?
4. ¿Cuál es la puntuación z y el límite de error o margen de error de la población (Error Bound for a population Mean, EBM) apropiados para un intervalo de confianza del 95 % para estos datos?
5. Al redondear a dos decimales, ¿cuál es el intervalo de confianza del 95 % si la media muestral es 41?
6. ¿Cuál es el intervalo de confianza del 90 % si la media muestral es 41? Redondear a dos decimales
7. Supongamos que el tamaño de la muestra en este estudio hubiera sido de 50, en vez de 30. ¿Cuál sería el intervalo de confianza del 95 % si la media muestral es 41? Redondee su respuesta a dos decimales.
8. Para cualquier conjunto de datos y situación de muestreo dados, ¿qué esperaría que fuera más amplio: un intervalo de confianza del 95 % o un intervalo de confianza del 99 %?
8.2: Intervalo de confianza, media de población única, desviación típica desconocida, t de Student
9. Al comparar los gráficos de la distribución normal estándar (distribuciónz) y una distribución t con 15 grados de libertad (degrees of freedom, df), ¿en qué se diferencian?
10. Al comparar los gráficos de la distribución normal estándar (distribuciónz) y una distribución t con 15 grados de libertad (df), ¿en qué se parecen?
Use la siguiente información para responder los próximos cinco ejercicios. Se sabe que la temperatura corporal se distribuye normalmente entre adultos sanos. Como no se conoce la desviación típica de la población, se utiliza la distribución t para estudiar la temperatura corporal. Usted recopila datos de una muestra aleatoria de 20 adultos sanos y halla que las temperaturas de su muestra tienen una media de 98,4 y una desviación típica de la muestra de 0,3 (ambas en grados Fahrenheit).
11. ¿Cuáles son los grados de libertad (df) de este estudio?
12. Para un intervalo de confianza del 95 % de dos colas, ¿cuál es el valor t apropiado que se debe usar en la fórmula?
13. ¿Qué es el intervalo de confianza del 95 %?
14. ¿Qué es el intervalo de confianza del 99 %? Redondee a dos decimales.
15. Supongamos que el tamaño de la muestra hubiera sido de 30 en vez de 20. ¿Cuál sería entonces el intervalo de confianza del 95 %? Redondear a dos decimales
8.3: Intervalo de confianza para una proporción de la población
Use esta información para responder los próximos cuatro ejercicios. Usted realiza un sondeo entre 500 residentes de la ciudad seleccionados al azar para preguntarles si tienen automóvil. 280 dicen que poseen automóvil y 220 que no.
16. Calcule la proporción y la desviación típica de la muestra para estos datos.
17. ¿Cuál es el intervalo de confianza del 95 % doble? Redondee a cuatro decimales.
18. Calcule el intervalo de confianza del 90 %. Redondee a cuatro decimales.
19. Calcule el intervalo de confianza del 99 %. Redondee a cuatro decimales.
Use la siguiente información para responder los próximos tres ejercicios. Está planeando hacer un sondeo entre miembros de la comunidad mayores de 65 años para determinar cuántos tienen teléfonos móviles. Quiere producir una estimación cuyo intervalo de confianza del 95 % esté dentro de los cuatro puntos porcentuales (más o menos) de la verdadera proporción de la población. Utilice una proporción de población estimada de 0,5.
20. ¿Qué tamaño de muestra necesita?
21. Supongamos que usted sabe, por una investigación previa, que la proporción de la población es de 0,6. ¿Qué tamaño de muestra necesita?
22. Supongamos que quiere un intervalo de confianza del 95 % dentro de tres puntos porcentuales de la población. Supongamos que la proporción de la población es de 0,5. ¿Qué tamaño de muestra necesita?
9.1: Hipótesis nula y alternativa
23. En su estado, el 58 % de los votantes registrados en una comunidad están registrados como republicanos. Le interesa hacer un estudio para ver si esto también ocurre en su comunidad. Indique las hipótesis nula y alternativa para comprobarlo.
24. Cree que, al menos, el 58 % de los votantes registrados en una comunidad están registrados como republicanos. Indique las hipótesis nula y alternativa para comprobarlo.
25. El valor medio de un hogar en una ciudad es de 268.000 dólares. Cree que el valor medio de un hogar de un determinado vecindario es inferior al promedio de la ciudad. Escriba las hipótesis nula y alternativa para comprobarlo.
26. Indique la hipótesis alternativa adecuada a esta hipótesis nula: H0: μ = 107
27. Indique la hipótesis alternativa adecuada a esta hipótesis nula: H0: p < 0,25
9.2: Resultados y errores de tipo I y II
28. Si se rechaza H0 cuando H0 es correcta, ¿de qué tipo de error se trata?
29. Si no se rechaza H0 cuando H0 es falsa, ¿de qué tipo de error se trata?
30. ¿Cuál es la relación entre el error de tipo II y la potencia de una prueba?
31. Se está desarrollando un nuevo análisis de sangre para detectar cáncer en los pacientes. Los resultados positivos son seguidos por una prueba más precisa (y costosa). Se supone que el paciente no tiene cáncer. Describa la hipótesis nula, los errores de tipo I y de tipo II para esta situación y explique qué tipo de error es más grave.
32. Explique con palabras qué significa que una prueba de detección de TB tenga un nivel α de 0,10. La hipótesis nula es que el paciente no tiene tuberculosis (TB).
33. Explique con palabras qué significa que una prueba de detección de TB tenga un nivel β de 0,20. La hipótesis nula es que el paciente no tiene tuberculosis (TB).
34. Explique con palabras qué significa que una prueba de detección de TB tenga una potencia de 0,80.
9.3: Distribución necesaria para la comprobación de la hipótesis
35. Si está realizando una prueba de hipótesis de una media de población única y no conoce la varianza poblacional, ¿qué prueba utilizará si el tamaño de la muestra es 10 y la población es normal?
36. Si está realizando una prueba de hipótesis de una única media poblacional, y conoce la varianza poblacional, ¿qué prueba utilizará?
37. Si está realizando una prueba de hipótesis de una única proporción poblacional, con np y nq mayores o iguales a cinco, ¿qué prueba utilizará y con qué parámetros?
38. La información publicada indica que, en promedio, los estudiantes de educación superior dedican menos de 20 horas a estudiar a la semana. Usted extrae una muestra de 25 estudiantes de su instituto universitario y halla que la media muestral es de 18,5 horas, con una desviación típica de 1,5 horas. ¿Qué distribución utilizará para comprobar si los hábitos de estudio en su instituto universitario son iguales al promedio nacional, y por qué?
39. Un estudio publicado dice que el 95 % de los niños estadounidenses están vacunados contra el sarampión, con una desviación típica del 1,5 %. Usted toma una muestra de 100 niños de su comunidad y comprueba sus registros de vacunación, para ver si la tasa de vacunación en su comunidad es igual al promedio nacional. ¿Qué distribución utilizará para esta prueba y por qué?
9.4: Eventos poco comunes, la muestra, decisión y conclusión
40. Usted está realizando un estudio con un nivel α de 0,05. Si obtiene un resultado con un valor p de 0,07, ¿cuál será su decisión?
41. Está realizando un estudio con α = 0,01. Si obtiene un resultado con un valor p de 0,006, ¿cuál será su decisión?
Use la siguiente información para responder los próximos cinco ejercicios. Según la Organización Mundial de la Salud, la altura promedio de un niño de un año es de 29”. Usted cree que los niños que padecen una determinada enfermedad son más pequeños que el promedio, así que toma una muestra de 20 niños con esta enfermedad y halla una altura promedio de 27,5” y una desviación típica de la muestra de 1,5”.
42. ¿Cuáles son las hipótesis nula y alternativa de este estudio?
43. ¿Qué distribución utilizará para comprobar su hipótesis y por qué?
44. ¿Cuál es el estadístico de prueba y el valor p?
45. Con base en los resultados de su muestra, ¿cuál es su decisión?
46. Suponga que la media de su muestra es de 25,0. Vuelva a hacer los cálculos y describa cuál sería su decisión.
9.5: Información adicional y ejemplos de pruebas de hipótesis completas
47. Usted realiza un estudio utilizando α = 0,05. ¿Cuál es el nivel de significación de este estudio?
48. Usted lleva a cabo un estudio basado en una muestra extraída de una población distribuida normalmente y varianza conocida, con las siguientes hipótesis:
H0: μ = 35,5
Ha: μ ≠ 35,5
¿Realizará una prueba de una o dos colas?
49. Usted lleva a cabo un estudio basado en una muestra extraída de una población distribuida normalmente y varianza conocida, con las siguientes hipótesis:
H0: μ ≥ 35,5
Ha: μ < 35,5
¿Realizará una prueba de una o dos colas?
Use la siguiente información para responder los próximos tres ejercicios. El 80 % de los adultos de todo el país tienen automóvil. Le interesa saber si en su comunidad se mantiene esa proporción. Toma una muestra de 100 personas y halla que el 75 % tiene automóvil.
50. ¿Cuáles son las hipótesis nula y alternativa de este estudio?
51. ¿Qué prueba utilizará y por qué?
10.1: Comparación de dos medias poblacionales independientes con desviaciones típicas poblacionales desconocidas
52. Usted lleva a cabo un sondeo de opinión política y entrevista a los dos miembros de 50 matrimonios. ¿Los grupos de este estudio son independientes o coincidentes?
53. Usted está probando un nuevo medicamento para tratar el insomnio. Se asignan aleatoriamente 80 sujetos voluntarios a las condiciones experimental (nuevo fármaco) o de control (tratamiento estándar). ¿Los grupos de este estudio son independientes o coincidentes?
54. Usted investiga la eficacia de un nuevo libro de texto de Matemáticas para estudiantes de escuela secundaria. Se administra una prueba previa a un grupo de estudiantes al principio del semestre y una prueba posterior al final de un año de instrucción utilizando este libro de texto, y se comparan los resultados. ¿Los grupos de este estudio son independientes o coincidentes?
Use la siguiente información para responder los próximos dos ejercicios. Usted realiza un estudio sobre la diferencia de tiempo en dos institutos universitarios para la finalización de la carrera. En el instituto universitario A, los estudiantes tardan un promedio de 4,8 años en alcanzar su título, mientras que en el instituto universitario B tardan un promedio de 4,2 años. La desviación típica combinada de estos datos es de 1,6 años
55. Calcule la d de Cohen e interprétela.
56. Supongamos que el tiempo medio para obtener un título en el instituto universitario A es de 5,2 años. Calcule el tamaño del efecto e interprételo.
57. Lleva a cabo una prueba t de muestras independientes con un tamaño de muestra de diez en cada uno de los dos grupos. Si realiza una prueba de hipótesis de dos colas con α = 0,01, ¿qué valores p le harán rechazar la hipótesis nula?
58. Usted realiza una prueba t de muestras independientes con un tamaño de muestra de 15 en cada grupo, con las siguientes hipótesis:
H0: μ ≥ 110
Ha: μ < 110.
Si α = 0,05, ¿qué valores t le harán rechazar la hipótesis nula?
10.2: Comparación de dos medias poblacionales independientes con desviaciones típicas poblacionales conocidas
Use la siguiente información para responder los próximos seis ejercicios. Los estudiantes de Ciencias de institutos universitarios suelen quejarse de que deben gastar más en libros de texto cada semestre que los estudiantes de Humanidades. Para comprobarlo, toma muestras aleatorias de 50 estudiantes de Ciencias y 50 de Humanidades de su instituto universitario y registra cuánto gastó cada uno de ellos durante el semestre pasado en libros de texto. Considere que los estudiantes de Ciencias son el grupo uno y los de Humanidades el grupo dos.
59. ¿Cuál es la variable aleatoria de este estudio?
60. ¿Cuáles son las hipótesis nula y alternativa de este estudio?
61. Si los 50 estudiantes de Ciencias gastaron un promedio de 530 dólares con una desviación típica de la muestra de 20 dólares y los 50 estudiantes de Humanidades gastaron un promedio de 380 dólares con una desviación típica de la muestra de 15 dólares, ¿aceptaría o rechazaría la hipótesis nula? Utilice un nivel alfa de 0,05. ¿Cuál es su conclusión?
62. ¿Cuál sería su decisión si utilizara α = 0,01?
10.3: Comparación de dos proporciones de población independientes
Use la información para responder los próximos seis ejercicios. Quiere saber si la proporción de hogares con servicio de televisión por cable difiere entre la comunidad A y la comunidad B. Para comprobarlo, extrae una muestra aleatoria de 100 para cada una y registra si tienen servicio de cable.
63. ¿Cuáles son las hipótesis nula y alternativa de este estudio?
64. Si 65 hogares de la comunidad A y 78 hogares de la comunidad B tienen servicio de cable, ¿cuál es la proporción combinada?
65. Con α = 0,03, ¿rechazará la hipótesis nula? ¿Cuál es su conclusión? 65 hogares de la comunidad A y 78 hogares de la comunidad B tienen servicio de cable. Se encuestaron 100 hogares de cada comunidad.
66. Utilizando un valor alfa de 0,01, ¿rechazaría la hipótesis nula? ¿Cuál es su conclusión? 65 hogares de la comunidad A y 78 hogares de la comunidad B tienen servicio de cable. Se encuestaron 100 hogares de cada comunidad.
10.4: Muestras coincidentes o emparejadas
Use la siguiente información para responder los próximos cinco ejercicios. Le interesa saber si un programa de ejercicios en particular ayuda a la gente a perder peso. Usted lleva a cabo un estudio en el que pesa a los participantes al principio del estudio y de nuevo al final, después de que hayan participado en el programa de ejercicios durante seis meses. Se comparan los resultados utilizando una prueba t de pares coincidentes, en la que los datos son {peso al final – peso al inicio}. Cree que, en promedio, los participantes habrán perdido peso después de seis meses en el programa de ejercicios.
67. ¿Cuáles son las hipótesis nula y alternativa de este estudio?
68. Calcule el estadístico de prueba, suponiendo que = -5, sd = 6, y n = 30 (pares).
69. ¿Cuáles son los grados de libertad de esta estadística?
70. Utilizando α = 0,05, ¿cuál es su decisión respecto a la eficacia de este programa para provocar la pérdida de peso? ¿Cuál es la conclusión?
71. ¿Qué significaría que la estadística t hubiera sido 4,56 y cuál habría sido su decisión en ese caso?
11.1: Datos sobre la distribución chi-cuadrado
72. ¿Cuál es la media y la desviación típica de una distribución chi-cuadrado con 20 grados de libertad?
11.2: Prueba de bondad de ajuste
Use la siguiente información para responder los próximos cuatro ejercicios. En todo el país, alrededor del 66 % de los graduados de la escuela secundaria se inscriben en la enseñanza superior. Hace una prueba de bondad de ajuste de chi-cuadrado para determinar si esta misma proporción se aplica a la clase más reciente de 200 graduados de su escuela secundaria. Su hipótesis nula es que la distribución nacional también se aplica a su escuela secundaria.
73. ¿Cuál es el número previsto de estudiantes de su clase de graduados de la escuela secundaria inscritos y no inscritos en la educación superior?
74. Rellene el resto de esta tabla.
Observado (O) | Esperado (E) | O - E | (O - E)2 | ||
---|---|---|---|---|---|
Inscritos | 145 | ||||
No inscritos | 55 |
75. ¿Cuáles son los grados de libertad de esta prueba de chi-cuadrado?
76. ¿Cuál es el estadístico de prueba de chi-cuadrado y el valor p? Al nivel de significación del 5 %, ¿qué conclusión obtiene?
77. Para una distribución chi-cuadrado con 92 grados de libertad, la curva _____________.
78. Para una distribución chi-cuadrado con cinco grados de libertad, la curva es ______________.
11.3: Prueba de independencia
Use la siguiente información para responder los próximos cuatro ejercicios. Está considerando realizar una prueba de independencia de chi-cuadrado para los datos de esta tabla que muestra datos sobre la posesión de teléfonos móviles de los estudiantes de primer y último año de una escuela secundaria. Su hipótesis nula es que la posesión de teléfonos móviles es independiente de la posición de clase.
79. Calcule los valores esperados para las celdas.
Móvil = Sí | Móvil = No | |
---|---|---|
Primer año | 100 | 150 |
Último año | 200 | 50 |
80. Calcule por cada móvil, donde O = observado y E = esperado.
81. ¿Cuál es el estadístico de chi-cuadrado y los grados de libertad de este estudio?
82. Con un nivel de significación α = 0,5, ¿cuál es su decisión respecto a la hipótesis nula?
11.4: Prueba de homogeneidad
83. Usted realiza una prueba de homogeneidad de chi-cuadrado para los datos de una tabla de cinco por dos. ¿Cuáles son los grados de libertad de esta prueba?
11.5: Resumen comparativo de las pruebas chi-cuadrado: Bondad de ajuste, independencia y homogeneidad
84. Un sondeo realizado en 2013 en el estado de California encuestó a personas sobre los impuestos a las bebidas azucaradas. Los resultados se presentan en la siguiente tabla y están clasificados por grupo étnico y tipo de respuesta. ¿Las respuestas del sondeo son independientes del grupo étnico de los participantes? Haga una prueba de hipótesis al nivel de significación del 5 %.
Grupo étnico/Tipo de respuesta | Aprueba | Desaprueba | Sin opinión | Total de la fila |
---|---|---|---|---|
Blanco/no hispano | 234 | 433 | 43 | 710 |
Latinos | 147 | 106 | 19 | 272 |
Afroamericanos | 24 | 41 | 6 | 71 |
Asiático americano | 54 | 48 | 16 | 118 |
Total de la columna | 459 | 628 | 84 | 1171 |
85. En una prueba de homogeneidad, ¿qué debe ser cierto sobre el valor esperado de cada celda?
86. En términos generales, ¿cuáles son las hipótesis nula y alternativa de la prueba de independencia chi-cuadrado?
87. En términos generales, ¿cuáles son las hipótesis nula y alternativa de la prueba de homogeneidad chi-cuadrado?
11.6: Prueba de una sola varianza
88. Una prueba de laboratorio pretende tener una varianza de no más de cinco. Usted cree que la varianza es mayor. ¿Cuáles son las hipótesis nula y alternativa para comprobarlo?
Soluciones de la prueba de práctica 3
8.1: Intervalo de confianza, media de población única, desviación típica de la población conocida, normal
1.
2. normal
3. 0,025 o 2,5 %; un intervalo de confianza del 95 % contiene el 95 % de la probabilidad y excluye el 5 %, y el 5 % excluido se reparte por igual entre las colas superior e inferior de la distribución.
4. puntuación z = 1,96;
5. 41 ± 1,43 = (39,57, 42,43); utilizando la función Zinterval de la calculadora, la respuesta es (40,74, 41,26. Las respuestas difieren debido al redondeo.
6. El valor zpara un intervalo de confianza del 90 % es 1,645, por lo que EBM = 1,645(0,73) = 1,20085.
El intervalo de confianza del 90 % es 41 ± 1,20 = (39,80; 42,20).
La respuesta de la función Zinterval de la calculadora es (40,78; 41,23). Las respuestas difieren debido al redondeo.
7. El error estándar de medición es:
El intervalo de confianza del 95 % es 41 ± 1,12 = (39,88; 42,12).
La respuesta de la función Zinterval de la calculadora es (40,84; 41,16). Las respuestas difieren debido al redondeo.
8. El intervalo de confianza del 99 % porque incluye todo el porcentaje de la distribución, menos el uno. El intervalo de confianza del 95 % será más estrecho, porque excluye el cinco por ciento de la distribución.
8.2: Intervalo de confianza, media de población única, desviación típica desconocida, t de Student
9. La distribución ttendrá más probabilidad en sus colas (“colas más gruesas”) y menos probabilidad cerca de la media de la distribución (“más corta en el centro”).
10. Ambas distribuciones son simétricas y están centradas en cero.
11. df = n - 1 = 20 - 1 = 19
12. Puede obtener el valor t de una tabla de probabilidades o de una calculadora. En este caso, para una distribución t con 19 grados de libertad, y un intervalo de confianza del 95 % doble, el valor es 2,093, es decir,
La función de la calculadora es invT(0,975, 19).
13.
98,4 ± 0,14 = (98,26, 98,54).
La respuesta de la función de calculadora Tinterval es (98,26; 98,54).
14. La función de la calculadora es invT(0,995, 19)
98,4 ± 0,19 = (98,21, 98,59). La respuesta de la función Tinterval de la calculadora es (98,21, 98,59).
15. df = n - 1 = 30 - 1 = 29.
98,4 ± 0,11 = (98,29, 98,51). La respuesta de la función Tinterval de la calculadora es (98,29; 98,51).
8.3: Intervalo de confianza para una proporción de la población
16.
17. Porque está usando la aproximación normal a la binomial, .
Calcule el límite de error de la población (error bound for the population, EBP):
Calcule el intervalo de confianza del 95 %:
0,56 ± 0,0435 = (0,5165, 0,6035).
La respuesta de la función 1-PropZint de la calculadora es (0,5165; 0,6035).
18.
0,56 ± 0,03 = (0,5236, 0,5964). La respuesta de la función de calculadora 1-PropZint es (0,5235; 0,5965)
19.
0,56 ± 0,05 = (0,5127, 0,6173).
La respuesta de la función 1-PropZint de la calculadora es (0,5028; 0,6172).
20. EBP = 0,04 (porque 4 % = 0,04)
para un intervalo de confianza del 95 %
Necesita 601 sujetos (redondeando hacia arriba desde 600,25).
21.
Necesita 577 sujetos (redondeando hacia arriba desde 576,24).
22.
Necesita 1.068 sujetos (redondeando hacia arriba desde 1.067,11).
9.1: Hipótesis nula y alternativa
23. H0: p = 0,58
Ha: p ≠ 0,58
24. H0: p ≥ 0,58
Ha: p < 0,58
25. H0: μ ≥ 268.000 dólares
Ha: μ < 268.000 dólares
26. Ha: μ ≠ 107
27. Ha: p ≥ 0,25
9.2: Resultados y errores de tipo I y II
28. un error de tipo I
29. un error de tipo II
30. Potencia = 1 – β = 1 – P(error de tipo II).
31. La hipótesis nula es que el paciente no tiene cáncer. Un error de tipo I sería detectar un cáncer cuando no está presente. Un error de tipo II sería no detectar el cáncer cuando está presente. Un error de tipo II es más grave, ya que el hecho de no detectar el cáncer podría impedir que el paciente reciba el tratamiento adecuado.
32. La prueba de detección tiene un diez por ciento de probabilidad de error de tipo I, lo que significa que el diez por ciento de las veces detectará TB cuando no esté presente.
33. La prueba de detección tiene una probabilidad de error de tipo II del 20 %, lo que significa que el 20 % de las veces no detectará TB cuando en realidad está presente.
34. El ochenta por ciento de las veces, la prueba de detección detectará TB cuando esté realmente presente.
9.3: Distribución necesaria para la comprobación de la hipótesis
35. La distribución tde Student.
36. La distribución normal o prueba z.
37. La distribución normal con μ = p y σ =
38. t24. Se utiliza la distribución tporque no se conoce la desviación típica de la población, y los grados de libertad son 24 porque df = n – 1.
39.
Como se conoce la desviación típica de la población y se tiene una muestra grande, se puede utilizar la distribución normal.
9.4: Eventos poco comunes, la muestra, decisión y conclusión
40. No se rechaza la hipótesis nula porque α ≤ p
41. Rechaza la hipótesis nula porque α ≥ p.
42. H0: μ ≥ 29,0”
Ha: μ < 29,0”
43. t19. Como no se conoce la desviación típica de la población, se utiliza la distribución t. Los grados de libertad son 19, porque df = n – 1.
44. El estadístico de prueba es –4,4721 y el valor p es 0,00013 con la función TTEST de la calculadora.
45. Con α = 0,05, se rechaza la hipótesis nula.
46. Con α = 0,05, el valor pes casi cero utilizando la función TTEST de la calculadora, por lo que se rechaza la hipótesis nula.
9.5: Información adicional y ejemplos de pruebas de hipótesis completas
47. El nivel de significación es del cinco por ciento.
48. dos colas
49. una cola
50. H0: p = 0,8
Ha: p ≠ 0,8
51. Utiliza la prueba normal para una proporción poblacional única porque np y nq son mayores que cinco.
10.1: Comparación de dos medias poblacionales independientes con desviaciones típicas poblacionales desconocidas
52. Son coincidentes (emparejados), porque usted entrevistó a parejas casadas.
53. Son independientes, porque los participantes se asignaron al azar a los grupos.
54. Son coincidentes (emparejados), porque se han recopilado datos dos veces de cada persona.
55.
Se trata de un tamaño del efecto pequeño, ya que 0,375 se sitúa entre los tamaños del efecto pequeño (0,2) y medio (0,5) de Cohen.
56.
El tamaño del efecto es de 0,625. Según la norma de Cohen, se trata de un tamaño del efecto medio, ya que se sitúa entre los tamaños del efecto medio (0,5) y grande (0,8).
57. valor p < 0,01.
58. Solo rechazará la hipótesis nula si obtiene un valor significativamente inferior a la media hipotética de 110.
10.2: Comparación de dos medias poblacionales independientes con desviaciones típicas poblacionales conocidas
59. , es decir, la diferencia media de la cantidad gastada en libros de texto para los dos grupos.
60. H0: ≤ 0
Ha: > 0
Esto también se podría escribir como:
H0:
Ha:
61. Use la función 2-SampTest de la calculadora y rechace la hipótesis nula. Con un nivel de significación del 5 % hay pruebas suficientes para concluir que los estudiantes de Ciencias gastan más en libros de texto que los de Humanidades.
62. Use la función 2-SampTest de la calculadora y rechace la hipótesis nula. Con un nivel de significación del 1 %, hay pruebas suficientes para concluir que los estudiantes de Ciencias gastan más en libros de texto que los de Humanidades.
10.3: Comparación de dos proporciones de población independientes
63. H0: pA = pB
Ha: pA ≠ pB
64.
65. Con la función de la calculadora 2-PropZTest el valor p = 0,0417. rechazar la hipótesis nula. Con un nivel de significación del 3 %, hay pruebas suficientes para concluir que existe una diferencia entre las proporciones de hogares de las dos comunidades que tienen servicio de cable.
66. Con la función 2-PropZTest de la calculadora, el valor p = 0,0417. no rechazar la hipótesis nula. Al nivel de significación del 1 % no hay pruebas suficientes para concluir que existe una diferencia entre las proporciones de hogares de las dos comunidades que tienen servicio de cable.
10.4: Muestras coincidentes o emparejadas
67. H0:
Ha:
68. t = - 4,5644
69. df = 30 – 1 = 29.
70. Con la función TTEST de la calculadora, el valor p = 0,00004, por lo que se rechaza la hipótesis nula. Al nivel del 5 %, hay pruebas suficientes para concluir que los participantes perdieron peso, en promedio.
71. Un estadístico tpositivo significaría que los participantes, en promedio, aumentaron de peso durante los seis meses.
11.1: Datos sobre la distribución chi-cuadrado
72. μ = df = 20
11.2: Prueba de bondad de ajuste
73. Inscritos = 200(0,66) = 132. No inscritos = 200(0,34) = 68
74.
Observado (O) | Esperado (E) | O – E | (O – E)2 | ||
---|---|---|---|---|---|
Inscritos | 145 | 132 | 145 – 132 = 13 | 169 | |
No inscritos | 55 | 68 | 55 – 68 = -13 | 169 |
75. df = n - 1 = 2 – 1 = 1.
76. Con la función de la calculadora Chi-square GOF – Test (en STAT TESTS), el estadístico de prueba es 3,7656 y el valor p es 0,0523. no rechazar la hipótesis nula. Al nivel de significación del 5 % no hay pruebas suficientes para concluir que la distribución de la clase de graduados más recientes de la escuela secundaria de inscritos y no inscritos no se ajusta a la de la distribución nacional.
77. se aproxima a la normal
78. asimetría a la derecha
11.3: Prueba de independencia
79.
Móvil = Sí | Móvil = No | Total | |
---|---|---|---|
Primer año | 250 | ||
Último año | 250 | ||
Total | 300 | 200 | 500 |
80.
81. Chi-cuadrado = 16,67 + 25 + 16,67 + 25 = 83,34.
df = (r – 1)(c – 1) = 1
82. valor p = P(Chi-cuadrado, 83,34) = 0
Rechaza la hipótesis nula.
También puede usar la función de la calculadora STAT TESTS Chi-Square – Test.
11.4: Prueba de homogeneidad
83. La tabla tiene cinco filas y dos columnas. df = (r – 1)(c – 1) = (4)(1) = 4.
11.5: Resumen comparativo de las pruebas chi-cuadrado: Bondad de ajuste, independencia y homogeneidad
84. Con la función de la calculadora (STAT TESTS) Chi-Square Test, el valor p = 0. rechazar la hipótesis nula. Con un nivel de significación del 5 % hay pruebas suficientes para concluir que las respuestas del sondeo son independientes del grupo étnico de los participantes.
85. El valor esperado de cada celda debe ser, al menos, cinco.
86. H0: Las variables son independientes.
Ha: Las variables no son independientes.
87. H0: Las poblaciones tienen la misma distribución.
Ha: Las poblaciones no tienen la misma distribución.
11.6: Prueba de una sola varianza
88. H0: σ2 ≤ 5
Ha: σ2 > 5
Prueba práctica 4
12.1 Ecuaciones lineales
1. ¿Cuáles de las siguientes ecuaciones son lineales?
- y = –3x
- y = 0,2 + 0,74x
- y = –9,4 – 2x
- A y B
- A, B y C
2. Para completar un trabajo de pintura se necesitan cuatro horas de preparación más una hora por cada 1.000 pies cuadrados. ¿Cómo expresaría esta información en una ecuación lineal?
3. Se paga a un instructor de estadística una tarifa por clase de 2.000 dólares más 100 dólares por cada estudiante de la clase. ¿Cómo expresaría esta información en una ecuación lineal?
4. Una escuela de tutoría requiere que los estudiantes paguen una cuota de inscripción única de 500 dólares más una matrícula de 3.000 dólares al año. Exprese esta información en una ecuación.
12.2: Pendiente e intersección en Y de una ecuación lineal
Use la siguiente información para responder los próximos cuatro ejercicios. Por los costos de mano de obra de las reparaciones un mecánico de automóviles cobra una tarifa fija de 75 dólares por automóvil, más una tarifa por hora de 55 dólares.
5. ¿Cuáles son las variables independientes y dependientes de esta situación?
6. Escriba la ecuación e identifique la pendiente y la intersección.
7. ¿Cuál es el costo de la mano de obra para un trabajo que tarda 3,5 horas en terminarse?
8. Un trabajo tarda 2,4 horas en terminarse, mientras que otro tarda 6,3 horas. ¿Cuál es la diferencia en los costos de mano de obra de estos dos trabajos?
12.3: Diagramas de dispersión
9. Describa el patrón de este diagrama de dispersión y decida si las variables X y Y serían buenas candidatas para la regresión lineal.
10. Describa el patrón de este diagrama de dispersión y decida si las variables X y Y serían buenas candidatas para la regresión lineal.
11. Describa el patrón de este diagrama de dispersión y decida si las variables X y Y serían buenas candidatas para la regresión lineal.
12. Describa el patrón de este diagrama de dispersión y decida si las variables X y Y serían buenas candidatas para la regresión lineal.
12.4: La ecuación de regresión
Use la siguiente información para responder los próximos cuatro ejercicios. La estatura (en pulgadas) y el peso (en libras) en una muestra de hombres de institutos universitarios de primer año que tienen una relación lineal con las siguientes estadísticas resumidas:
= 68,4
= 141,6
sx = 4,0
sy = 9,6
r = 0,73.
Supongamos que Y = peso y X = estatura, y escriba la ecuación de regresión en la forma:
13. ¿Cuál es el valor de la pendiente?
14. ¿Cuál es el valor de la intersección en y?
15. Escriba la ecuación de regresión que predice el peso a partir de la estatura en este conjunto de datos, y calcule el peso predicho para alguien de 68 pulgadas de alto.
12.5: Coeficiente de correlación y coeficiente de determinación
16. La correlación entre el peso de la carrocería y la eficiencia del combustible (medida en millas por galón) para una muestra de 2.012 modelos de automóviles es de –0,56. Calcule el coeficiente de determinación de estos datos y explique su significado.
17. La correlación entre el promedio de calificaciones (Grade Point Average, GPA) de la escuela secundaria y el GPA del primer año del instituto universitario para una muestra de 200 estudiantes de educación superior es de 0,32. ¿Cuánta variación en el GPA del primer año de instituto universitario no se explica por el GPA de la escuela secundaria?
18. Redondeado a dos decimales, ¿qué correlación entre dos variables es necesaria para tener un coeficiente de determinación de, al menos, 0,50?
12.6: Comprobación de la importancia del coeficiente de correlación
19. Escriba las hipótesis nula y alternativa de un estudio para determinar si dos variables están significativamente correlacionadas.
20. En una muestra de 30 casos, dos variables tienen una correlación de 0,33. Haga una prueba t para ver si este resultado es significativo al nivel α = 0,05. Use la fórmula
21. En una muestra de 25 casos, dos variables tienen una correlación de 0,45. Haga una prueba t para ver si este resultado es significativo al nivel α = 0,05. Use la fórmula
12.7: Predicción
Use la siguiente información para responder los próximos dos ejercicios. Un estudio que relaciona los gramos de potasio (Y) con los gramos de fibra (X) por porción en productos de harina enriquecida (pan, panecillos, etc.) produjo la ecuación:
22. Para un producto con cinco gramos de fibra por ración, ¿cuáles son los gramos de potasio esperados por ración?
23. Al comparar dos productos, uno con tres gramos de fibra por ración y otro con seis gramos de fibra por ración, ¿cuál es la diferencia esperada en gramos de potasio por ración?
12.8: Valores atípicos
24. En el contexto del análisis de regresión, ¿cuál es la definición de un valor atípico y cuál es la regla general para evaluar si un valor dado en un conjunto de datos es un valor atípico?
25. En el contexto del análisis de regresión, ¿cuál es la definición de punto influyente y en qué se diferencia un punto influyente de un valor atípico?
26. La línea de regresión de mínimos cuadrados para un conjunto de datos es y la desviación típica de los residuos es de 0,4. ¿Un caso con los valores x = 2 y = 6,2 se considera un valor atípico?
27. La línea de regresión de mínimos cuadrados para un conjunto de datos es y la desviación típica de los residuos es de 0,13. ¿Un caso con los valores x = 4,1 y = 2,34 se considera un valor atípico?
13.1: ANOVA de una vía
28. ¿Cuáles son los cinco supuestos básicos que hay que cumplir si se quiere hacer un análisis de varianza (ANalysis Of VAriance, ANOVA) de una vía?
29. Usted está hacer un ANOVA de una vía para comparar la eficacia de cuatro fármacos en la reducción de la presión arterial en pacientes hipertensos. ¿Cuáles son las hipótesis nula y alternativa de este estudio?
30. ¿Cuál es la principal diferencia entre la prueba tde muestras independientes y el ANOVA de una vía?
31. Está comparando los resultados de tres métodos de enseñanza de geometría para estudiantes de escuela secundaria. Las calificaciones del examen final X1, X2, X3, para las muestras impartidas por los diferentes métodos tienen las siguientes distribuciones:
X1 ~ N(85; 3,6)
X1 ~ N(82; 4,8)
X1 ~ N(79; 2,9).
Cada muestra incluye 100 estudiantes, y las calificaciones del examen final tienen un rango de 0 a 100. Suponiendo que las muestras sean independientes y seleccionadas al azar, ¿se han cumplido los requisitos para realizar un ANOVA de una vía? Explique por qué sí o por qué no para cada supuesto.
32. Usted realiza un estudio en el que se compara la eficacia de cuatro tipos de fertilizantes para aumentar el rendimiento de los cultivos en sembradíos de trigo. Al examinar los resultados de la muestra, se halla que dos de las muestras tienen una distribución aproximadamente normal, y dos tienen una distribución aproximadamente uniforme. ¿Esto es una violación de los supuestos para realizar un ANOVA de una vía?
13.2: La distribución F
Use la siguiente información para responder los próximos siete ejercicios. Está realizando un estudio sobre tres tipos de suplementos alimenticios para el ganado vacuno para comprobar su eficacia a la hora de producir un aumento de peso entre los terneros, cuya alimentación incluye uno de los suplementos. Tiene cuatro grupos de 30 terneros (uno es un grupo de control que recibe el alimento habitual, pero sin suplemento). Llevará a cabo un ANOVA de una vía después de un año para ver si hay diferencias en el peso medio de los cuatro grupos.
33. ¿Cuál es la suma de los cuadrados (Sum of Squares, SS) SSdentro en este experimento y qué significa?
34. ¿Cuál es la SSentre en este experimento y qué significa?
35. ¿Qué son k y i para este experimento?
36. Si SSdentro = 374,5 y SStotal = 621,4 para estos datos, ¿qué es SSentre?
37. ¿Qué son MSentre y MSdentro para este experimento?
38. ¿Cuál es la estadística F para estos datos?
39. Si hubiera habido 35 terneros en cada grupo, en vez de 30, y las sumas de los cuadrados siguieran siendo iguales, ¿sería el estadístico F mayor o menor?
13.3: Datos sobre la distribución F
40. ¿Cuáles de los siguientes números son posibles estadísticas F?
- 2,47
- 5,95
- -3,61
- 7,28
- 0,97
41. Los histogramas F1 y F2 que aparecen a continuación muestran la distribución de los casos de las muestras de dos poblaciones, una distribuida F3, 15 y otra distribuida F5, 500. ¿Qué muestra procede de qué población?
42. El estadístico F de un experimento con k = 3 y n = 50 es 3,67. Con α = 0,05, ¿rechazará la hipótesis nula?
43. El estadístico F de un experimento con k = 4 y n = 100 es 4,72. Con α = 0,01, ¿rechazará la hipótesis nula?
13.4: Prueba de dos varianzas
44. ¿Qué supuestos deben cumplirse para realizar la prueba F de dos varianzas?
45. Cree que hay mayor varianza en las notas otorgadas por el Departamento de Matemáticas de su universidad que en el de Inglés. Usted recopila todas las notas de las clases de grado en los dos departamentos durante un semestre, calcula la varianza de cada una y realiza una prueba F de dos varianzas. ¿Cuáles son las hipótesis nula y alternativa de este estudio?
Soluciones de la prueba de práctica 4
12.1 Ecuaciones lineales
1. e. A, B y C.
Las tres son ecuaciones lineales de la forma y = mx + b.
2. Supongamos que y = el número total de horas necesarias, y x son los pies cuadrados, medidos en unidades de 1.000. La ecuación es: y = x + 4
3. Supongamos que y = el pago total y x es el número de estudiantes de una clase. La ecuación es: y = 100(x) + 2.000
4. Supongamos que y = el costo total de la asistencia, y x es el número de años inscritos. La ecuación es: y = 3.000(x) + 500
12.2: Pendiente e intersección en Y de una ecuación lineal
5. La variable independiente son las horas trabajadas en un automóvil. La variable dependiente es el total de gastos de mano de obra para arreglar un automóvil.
6. Supongamos que y = la carga total, y x es el número de horas necesarias. La ecuación es: y = 55x + 75
La pendiente es 55 y la intersección es 75.
7. y = 55(3,5) + 75 = 267,50
8. Dado que la intersección está incluida en ambas ecuaciones, mientras que usted solo está interesado en la diferencia de costos, no necesita incluir la intersección en la solución. La diferencia en el número de horas requeridas es: 6,3 – 2,4 = 3,9.
Multiplique esta diferencia por el costo por hora: 55(3,9) = 214,5.
La diferencia de costo entre los dos trabajos es de 214,50 dólares.
12.3: Diagramas de dispersión
9. Las variables X y Y tienen una fuerte relación lineal. Estas variables serían buenas candidatas para el análisis con regresión lineal.
10. Las variables X y Y tienen una fuerte relación lineal negativa. Estas variables serían buenas candidatas para el análisis con regresión lineal.
11. No hay una relación lineal clara entre las variables X y Y, por lo que no son buenas candidatas para la regresión lineal.
12. Las variables X y Y tienen una fuerte relación positiva, pero es curvilínea y en vez de lineal. Estas variables no son buenas candidatas para la regresión lineal.
12.4: La ecuación de regresión
13.
14.
15.
12.5: Coeficiente de correlación y coeficiente de determinación
16. El coeficiente de determinación es el cuadrado de la correlación, o r2.
Para estos datos, r2 = (–0,56)2 = 0,3136 ≈ 0,31 o 31 %. Esto significa que el 31 % de la variación en la eficiencia del combustible se puede explicar por el peso de la carrocería del automóvil.
17. El coeficiente de determinación = 0,322 = 0,1024. Esta es la cantidad de variación en el GPA de estudiantes de primer año del instituto universitario que puede ser explicada por el GPA de la escuela secundaria. La cantidad que no se puede explicar es 1 – 0,1024 = 0,8976 ≈ 0,90. Por lo tanto, cerca del 90 % de la varianza en el GPA de los estudiantes de instituto universitario de primer año en estos datos no se explica por el GPA de la escuela secundaria.
18.
Se necesita una correlación de 0,71 o superior para tener un coeficiente de determinación de, al menos, 0,5.
12.6: Comprobación de la importancia del coeficiente de correlación
19. H0: ρ = 0
Ha: ρ ≠ 0
20.
El valor crítico para α = 0,05 para una prueba de dos colas utilizando la distribución t29 es 2,045. Su valor es menor que este, por lo que no se rechaza la hipótesis nula y se concluye que el estudio no produjo ninguna evidencia de que las variables estén significativamente correlacionadas.
Con la función tcdf de la calculadora, el valor p es 2tcdf(1,85; 10^99; 29) = 0,0373. No se rechaza la hipótesis nula y se concluye que el estudio no ha aportado pruebas de que las variables estén significativamente correlacionadas.
21.
El valor crítico para α = 0,05 para una prueba de dos colas utilizando la distribución t24 es 2,064. Su valor es mayor que este, por lo que se rechaza la hipótesis nula y se concluye que el estudio produjo evidencia de que las variables están significativamente correlacionadas.
Con la función tcdf de la calculadora, el valor p es 2tcdf(2,417; 10^99; 24) = 0,0118. Rechace la hipótesis nula y concluya que el estudio produjo evidencia de que las variables están significativamente correlacionadas.
12.7: Predicción
22.
23. Como la intersección aparece en ambos valores esperados, puede ignorarla al calcular una puntuación de diferencia prevista. La diferencia en gramos de fibra por ración es de 6 – 3 = 3 y la diferencia prevista en gramos de potasio por ración es de (16)(3) = 48.
12.8: Valores atípicos
24. Un valor atípico es un valor observado que se aleja de la línea de regresión de mínimos cuadrados. Una regla general es que un punto con más de dos desviaciones típicas de los residuos respecto a su valor predicho en la línea de regresión de mínimos cuadrados es un valor atípico.
25. Un punto influyente es un valor observado en un conjunto de datos que está alejado de otros puntos del conjunto de datos, en una dirección horizontal. A diferencia de un valor atípico, un punto influyente se determina por su relación con otros valores del conjunto de datos, no por su relación con la línea de regresión.
26. El valor previsto para y es: . El valor de 6,2 está a menos de dos desviaciones típicas del valor previsto, por lo que no se considera un valor atípico.
Residual para (2; 6,2): 6,2 – 5,6 = 0,6 (0,6 < 2(0,4))
27. El valor previsto para y es: = 2,3 – 0.1(4,1) = 1,89. El valor de 2,32 está a más de dos desviaciones típicas del valor previsto, por lo que se considera un valor atípico.
Residual para (4,1; 2,34): 2,32 – 1,89 = 0,43 (0,43 > 2(0,13))
13.1: ANOVA de una vía
28.
- Cada muestra se extrae de una población distribuida normalmente
- Todas las muestras son independientes y se seleccionan al azar.
- Las poblaciones de las que se extraen las muestras tienen desviaciones típicas iguales.
- El factor es una variable categórica.
- La respuesta es una variable numérica.
29. H0: μ1 = μ2 = μ3 = μ4
Ha: Al menos dos de las medias del grupo μ1, μ2, μ3, μ4 no son iguales.
30. La prueba tde muestras independientes solo puede comparar las medias de dos grupos, mientras que el ANOVA de una vía puede comparar las medias de más de dos grupos.
31. Cada muestra parece haber sido extraída de una población distribuida normalmente, el factor es una variable categórica (método), el resultado es una variable numérica (calificación de la prueba) y se le dijo que las muestras eran independientes y seleccionadas al azar, por lo que se cumplen esos requisitos. Sin embargo, cada muestra tiene una desviación típica diferente, y esto sugiere que las poblaciones de las que se extrajeron también tienen desviaciones típicas diferentes, lo que supone una violación de un supuesto del ANOVA de una vía. Serán necesarios más estadísticos de prueba para comprobar el supuesto de igualdad de varianza antes de continuar con el análisis.
32. Uno de los supuestos de un ANOVA de una vía es que las muestras proceden de poblaciones distribuidas normalmente. Dado que dos de sus muestras tienen una distribución aproximadamente uniforme, esto pone en duda que se cumpla esta hipótesis. Serán necesarios más estadísticos de prueba para determinar si puede continuar con el análisis.
13.2: La distribución F
33. La SSdentro es la suma de los cuadrados dentro de los grupos, lo que representa la variación en el resultado que no puede atribuirse a los diferentes suplementos alimenticios, sino que se debe a factores individuales o al azar entre los terneros de cada grupo.
34. La SSentre es la suma de los cuadrados entre los grupos, lo que representa la variación en el resultado que puede atribuirse a los diferentes suplementos alimenticios.
35. k = el número de grupos = 4
n1 = el número de casos del grupo 1 = 30
n = el número total de casos = 4(30) = 120
36. SStotal = SSdentro + SSentre por lo que SSentre = SStotal – SSdentro
621,4 – 374,5 = 246,9
37. Las medias cuadráticas en un ANOVA se hallan al dividir cada suma de cuadrados entre sus respectivos grados de libertad (df).
Para SStotal, df = n – 1 = 120 – 1 = 119.
Para SSentre, df = k - 1 = 4 - 1 = 3.
Para SSdentro, df = 120 – 4 = 116.
MSentre = = 82,3
MSdentro = = 3,23
38.
39. Sería mayor, porque estaría dividiendo entre un número menor. El valor de MSentre no cambiaría con un cambio en el tamaño de la muestra, pero el valor de MSdentro sería menor, porque se estaría dividiendo entre un número mayor (dfdentro sería 136, no 116). Dividir una constante entre un número menor produce un resultado mayor.
13.3: Datos sobre la distribución F
40. Todas menos la opción c, –3,61. Las estadísticas F son siempre mayores o iguales a 0.
41. A medida que aumentan los grados de libertad en una distribución F, la distribución casi se normaliza. El histograma F2 se acerca más a una distribución normal que el histograma F1, por lo que la muestra que aparece en el histograma F1 se extrajo de la población F3, 15, y la muestra que aparece en el histograma F2 se extrajo de la población F5, 500.
42. Con la función Fcdf de la calculadora, el valor p = Fcdf(3,67; 1E; 3,50) = 0,0182. rechazar la hipótesis nula.
43. Con la función Fcdf de la calculadora, el valor p = Fcdf(4,72; 1E; 4; 100) = 0,0016. Rechaza la hipótesis nula.
13.4: Prueba de dos varianzas
44. Las muestras se deben extraer de poblaciones distribuidas normalmente y de poblaciones independientes.
45. Supongamos que = varianza en las notas de Matemáticas y = varianza en las notas de Inglés.
H0: ≤
Ha: >
Práctica del examen final 1
Use la siguiente información para responder los dos próximos ejercicios: El experimento consiste en lanzar dos dados de 12 caras (los números 1 a 12 están impresos en las caras de cada dado).
- Sea que el evento A = ambos dados muestran un número par.
- Sea que el evento B = ambos dados muestran un número superior a ocho.
1. Los eventos A y B son:
- mutuamente excluyentes.
- independientes.
- mutuamente excluyentes e independientes.
- no son mutuamente excluyentes ni independientes.
2. Calcule P(A|B).
3. ¿Cuál de las siguientes afirmaciones es VERDADERA cuando comprobamos una hipótesis sobre muestras coincidentes o emparejadas?
- El tamaño de las muestras casi nunca es pequeño.
- Se toman dos medidas del mismo par de personas u objetos.
- Se comparan dos medias muestrales entre sí.
- Las opciones de respuesta b y c son ambas verdaderas.
Use la siguiente información para responder los próximos dos ejercicios: A ciento dieciocho estudiantes se les preguntó de qué tipo de color estaban pintadas sus habitaciones: colores claros, oscuros o llamativos. Los resultados se tabularon según el sexo.
Colores claros | Colores oscuros | Colores llamativos | |
---|---|---|---|
Mujeres | 20 | 22 | 28 |
Hombres | 10 | 30 | 8 |
4. Calcule la probabilidad de que un estudiante seleccionado al azar sea hombre o tenga un dormitorio pintado con colores claros.
5. Calcule la probabilidad de que un estudiante elegido al azar sea hombre, dado que su dormitorio está pintado con colores oscuros.
Use la siguiente información para responder los próximos dos ejercicios: Nos interesa el número de veces que hay que recordarle a un adolescente que haga sus tareas cada semana. Se realizó una encuesta a 40 madres. La Tabla B16 muestra los resultados de la encuesta.
x | P (x) |
---|---|
0 | |
1 | |
2 | |
3 | |
4 | |
5 |
6. Calcule la probabilidad de que a un adolescente se le recuerde dos veces que haga sus tareas.
- 8
- 2
7. Calcule el número de veces que se le recuerda a un adolescente que haga sus tareas.
- 15
- 2,78
- 1,0
- 3,13
Use la siguiente información para responder los próximos dos ejercicios: En un día cualquiera, aproximadamente el 37,5 % de los automóviles en el garaje de De Anza están estacionados en posición incorrecta. Seleccionamos al azar a 22 automóviles. Estamos interesados en el número de automóviles que están estacionados en posición incorrecta.
8. Por cada 22 automóviles, ¿cuántos se espera que estén aparcados en posición incorrecta, en promedio?
- 8,25
- 11
- 18
- 7,5
9. ¿Cuál es la probabilidad de que al menos diez de los 22 automóviles estén aparcados en posición incorrecta?
- 0,1263
- 0,1607
- 0,2870
- 0,8393
10. Queremos hacer una prueba de hipótesis con una muestra de 15 calificaciones de la escala de inteligencia Stanford-Binet. Nuestra afirmación es que la calificación media de la escala de inteligencia Stanford-Binet es superior a 100. Se sabe que la desviación típica de todas las calificaciones de la escala de inteligencia Stanford-Binet es de 15 puntos. La distribución correcta que se utiliza para la comprobación de la hipótesis es:
- Binomial
- t de Student
- Normal
- Uniforme
Use la siguiente información para responder los próximos tres ejercicios: El instituto universitario De Anza mantiene estadísticas sobre el índice de aprobados de los estudiantes que se inscriben en las clases de Matemáticas. En una muestra de 1.795 estudiantes inscritos en Matemáticas 1A (Cálculo del 1.er trimestre), 1.428 aprobaron el curso. En una muestra de 856 estudiantes inscritos en Matemáticas 1B (Cálculo del 2.º trimestre), 662 aprobaron. En general, ¿los índices de aprobados de Matemáticas 1A y Matemáticas 1B son estadísticamente iguales? Supongamos que A = el subíndice de Matemáticas 1A y B = el subíndice de Matemáticas 1B.
11. Si se realizara una comprobación adecuada, la hipótesis alternativa sería:
- Ha: pA = pB
- Ha: pA > pB
- Ho: pA = pB
- Ha: pA ≠ pB
12. El error de tipo I:
- concluye que el índice de aprobados de Matemáticas 1A es igual al de Matemáticas 1B cuando, en realidad, los índices de aprobados son diferentes.
- concluye que el porcentaje de aprobados de Matemáticas 1A es diferente al de Matemáticas 1B cuando, en realidad, los porcentajes de aprobados son iguales.
- concluye que el porcentaje de aprobados de Matemáticas 1A es mayor que el de Matemáticas 1B cuando, en realidad, el porcentaje de aprobados de Matemáticas 1A es menor que el de Matemáticas 1B.
- concluye que el porcentaje de aprobados de Matemáticas 1A es igual al de Matemáticas 1B cuando, en realidad, son iguales.
13. La decisión correcta es:
- rechaza H0
- no rechaza H0
- No hay suficiente información para hacer la prueba de la hipótesis.
Kia, Alejandra e Iris son corredoras en los equipos de atletismo de tres escuelas diferentes. Sus tiempos de carrera, en minutos, y las estadísticas de los equipos de atletismo de sus respectivas escuelas para una carrera de una milla figuran en la siguiente tabla:
Tiempo de ejecución | Tiempo promedio de carrera de la escuela | Desviación típica de la escuela | |
---|---|---|---|
Kia | 4,9 | 5,2 | 0,15 |
Alejandra | 4,2 | 4,6 | 0,25 |
Iris | 4,5 | 4,9 | 0,12 |
14. ¿Cuál es la MEJOR estudiante en comparación con las demás corredoras de su escuela?
- Kia
- Alejandra
- Iris
- Imposible de determinar
Use la siguiente información para responder los próximos dos ejercicios: Los siguientes precios de sudaderas de esquí para adultos son del catálogo de invierno de Gorsuch Ltd.: 212, 292, 278, 199, 280 y 236 dólares.
Supongamos que la población subyacente del precio de la sudadera es aproximadamente normal. La hipótesis nula es que el precio medio de las sudaderas de esquí para adultos de Gorsuch Ltd. es de 275 dólares como mínimo.
15. La distribución correcta que debería utilizarse para comprobar la hipótesis es
- Normal
- Binomial
- t de Student
- Exponencial
16. La prueba de la hipótesis:
- es de dos colas.
- es de cola izquierda.
- es de cola derecha.
- no tiene colas.
17. Sara, estudiante de estadística, quería determinar la media del número de libros que los profesores de institutos universitarios tienen en su oficina. Seleccionó al azar dos edificios del campus y le preguntó a cada profesor de los edificios seleccionados cuántos libros hay en su oficina. Sara encuestó a 25 profesores. El tipo seleccionado de muestreo es
- muestreo aleatorio simple.
- muestreo sistemático.
- muestreo por conglomerados.
- muestreo estratificado.
18. ¿Una tienda de ropa utilizaría qué medida del centro de datos al hacer pedidos para el típico cliente "medio"?
- media
- mediana
- moda
- IQR
19. En una comprobación de la hipótesis, el valor p es
- la probabilidad de que un resultado de los datos ocurra por pura casualidad cuando la hipótesis nula es verdadera.
- llamado el alfa preconcebido.
- comparado con beta para decidir si se rechaza o no la hipótesis nula.
- Las opciones de respuesta A y B son ambas verdaderas.
Use la siguiente información para responder los próximos tres ejercicios: Un colegio comunitario ofrece clases 6 días a la semana: de lunes a sábado. María realizó un estudio de los estudiantes de sus clases para determinar cuántos días a la semana acuden al campus los estudiantes que están en sus clases. En cada una de sus 5 clases seleccionó al azar a 10 estudiantes y les preguntó cuántos días acudían al campus para asistir a clases. Todas sus clases son del mismo tamaño. Los resultados de su encuesta se resumen en la Tabla B18.
Número de días en el campus | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
1 | 2 | ||
2 | 12 | 0,24 | |
3 | 10 | 0,20 | |
4 | 0,98 | ||
5 | 0 | ||
6 | 1 | 0,02 | 1,00 |
20. Además del muestreo de conveniencia, ¿qué otra técnica de muestreo utilizó María?
- simple aleatorio
- sistemático
- conglomerado
- estratificado
21. ¿Cuántos estudiantes acuden al campus para recibir clases cuatro días a la semana?
- 49
- 25
- 30
- 13
22. ¿Cuál es el percentil 60 de estos datos?
- 2
- 3
- 4
- 5
Use la siguiente información para responder los dos próximos ejercicios: Los siguientes datos son los resultados de una encuesta aleatoria realizada a 110 reservistas llamados a servicio activo para aumentar la seguridad en aeropuertos de California.
Número de dependientes | Frecuencia |
---|---|
0 | 11 |
1 | 27 |
2 | 33 |
3 | 20 |
4 | 19 |
23. Construya un intervalo de confianza del 95 % para la media poblacional real del número de dependientes de los reservistas llamados a servicio activo para aumentar la seguridad en aeropuertos de California.
- (1,85, 2,32)
- (1,80, 2,36)
- (1,97, 2,46)
- (1,92, 2,50)
24. El intervalo de confianza del 95 % significa:
- El cinco por ciento de los intervalos de confianza construidos de esta manera no contendrán el verdadero número promedio de dependientes de la población.
- Tenemos un 95 % de confianza para que el número de la media real de la población de dependientes caiga en el intervalo.
- Las dos opciones de respuesta anteriores son correctas.
- Ninguna de las anteriores.
25. X ~ U(4; 10). Calcule el percentil 30.
- 0,3000
- 3
- 5,8
- 6,1
26. Si X ~ Exp(0,8), entonces P(x < μ) = __________
- 0,3679
- 0,4727
- 0,6321
- no se puede determinar
27. La vida útil de un tablero de circuito de computadora se distribuye normalmente con una media de 2.500 horas y una desviación típica de 60 horas. ¿Cuál es la probabilidad de que un tablero seleccionado al azar dure como máximo 2.560 horas?
- 0,8413
- 0,1587
- 0,3461
- 0,6539
28. Se realizó una encuesta entre 123 reservistas llamados a servicio activo como consecuencia de los atentados del 11 de septiembre de 2001 para determinar la proporción de los que estaban casados. Ochenta y seis declararon estar casados. Construya un intervalo de confianza del 98 % para la verdadera proporción de la población de reservistas llamados al servicio activo que están casados.
- (0,6030, 0,7954)
- (0,6181, 0,7802)
- (0,5927, 0,8057)
- (0,6312, 0,7672)
29. Los tiempos de victoria en los maratones de 26 millas de corredores de talla mundial tienen un promedio de 145 minutos con una desviación típica de 14 minutos. Se recopila una muestra de los últimos diez tiempos de los ganadores de maratones. Supongamos que x = los tiempos medios de victoria en diez maratones. La distribución para x es:
30. Supongamos que Phi Beta Kappa distingue al uno por ciento de los mejores estudiantes de último año de institutos universitarios y universidades. Suponga que la media del promedio de calificaciones (GPA) en un instituto universitario determinado se distribuye normalmente con una media de 2,5 y una desviación típica de 0,5. ¿Cuál sería el GPA mínimo necesario para ser miembro de Phi Beta Kappa en esa universidad?
- 3,99
- 1,34
- 3,00
- 3,66
El número de personas que viven en granjas en Estados Unidos ha disminuido constantemente durante el siglo XX. Estos son los datos sobre la población agrícola (en millones de personas) de 1935 a 1980.
Año | 1935 | 1940 | 1945 | 1950 | 1955 | 1960 | 1965 | 1970 | 1975 | 1980 |
---|---|---|---|---|---|---|---|---|---|---|
Población | 32,1 | 30,5 | 24,4 | 23,0 | 19,1 | 15,6 | 12,4 | 9,7 | 8,9 | 7,2 |
31. La ecuación de regresión lineal es = 1166,93 - 0,5868x. ¿Cuál era la población agrícola prevista (en millones de personas) para 1980?
- 7,2
- 5,1
- 6,0
- 8,0
32. En la regresión lineal, ¿cuál es la mejor SSE posible?
- 13,46
- 18,22
- 24,05
- 16,33
33. En el análisis de regresión, si el coeficiente de correlación es cercano a uno, ¿qué se puede decir de la línea de mejor ajuste?
- Es una línea horizontal. Por lo tanto, no podemos utilizarla.
- Hay un fuerte patrón lineal. Por lo tanto, es muy probable que sea un buen modelo para utilizar.
- El coeficiente de correlación está cerca del límite. Por lo tanto, es difícil tomar una decisión.
- No tenemos la ecuación. Por lo tanto, no podemos decir nada al respecto.
Use la siguiente información para responder los próximos tres ejercicios: En un estudio sobre los planes de carrera de mujeres y hombres jóvenes se enviaron cuestionarios a los 722 miembros de la clase de último año de la Facultad de Administración y Negocios de la Universidad de Illinois. Una de las preguntas se refería a la especialidad que el estudiante había elegido dentro del programa de Negocios. Estos son los datos de los estudiantes que respondieron.
Mujeres | Hombres | |
---|---|---|
Contabilidad | 68 | 56 |
Administración | 91 | 40 |
Economía | 5 | 6 |
Finanzas | 61 | 59 |
34. La distribución para la prueba es:
- .
- .
- .
- .
35. El número previsto de mujeres que eligen las finanzas es:
- 37.
- 61.
- 60.
- 70.
36. El valor p es 0,0127 y el nivel de significación es 0,05. La conclusión de la prueba es:
- no hay pruebas suficientes para concluir que la elección de la especialidad y el sexo del estudiante no son independientes entre sí.
- hay pruebas suficientes para concluir que la elección de la especialidad y el sexo del estudiante no son independientes entre sí.
- hay pruebas suficientes para concluir que los estudiantes hallan la economía muy difícil.
- hay pruebas suficientes para concluir que hay más mujeres que prefieren la administración que los hombres.
37. Una agencia informó que la fuerza laboral en todo el país está compuesta por un 10 % de profesionales, un 10 % de administrativos, un 30 % de trabajadores cualificados, un 15 % de trabajadores de servicios y un 35 % de trabajadores semicualificados. Una muestra aleatoria de 100 residentes en San José indicó que había 15 profesionales, 15 administrativos, 40 trabajadores cualificados, 10 trabajadores de servicios y 20 trabajadores semicualificados. Con α = 0,10, ¿parece que la fuerza laboral de San José es coherente con el informe de la agencia para el país? ¿Qué tipo de prueba es?
- Bondad de ajuste de chi2
- Prueba de independencia de chi2
- Proporciones de grupos independientes
- No se puede determinar
Soluciones del examen final de práctica 1
Soluciones
1. b. independiente
2. c.
3. b. Se toman dos medidas del mismo par de personas u objetos.
4. b.
5. d.
6. b.
7. b. 2,78
8. a. 8,25
9. c. 0,2870
10. c. Normal
11. d. Ha: pA ≠ pB
12. b. concluye que el porcentaje de aprobados de Matemáticas 1A es diferente al de Matemáticas 1B cuando, en realidad, los porcentajes de aprobados son iguales.
13. b. no rechazar H0
14. c. Iris
15. c. t de Student
16. b. es de cola izquierda.
17. c. muestreo por conglomerados
18. b. mediana
19. a. la probabilidad de que un resultado de los datos ocurra por pura casualidad cuando la hipótesis nula es verdadera.
20. d. estratificado
21. b. 25
22. c. 4
23. a. (1,85, 2,32)
24. c. Ambas anteriores son correctas.
25. c. 5,8
26. c. 0,6321
27. a. 0,8413
28. a. (0,6030, 0,7954)
29. a.
30. d. 3,66
31. b. 5,1
32. a. 13,46
33. b. Hay un fuerte patrón lineal. Por lo tanto, es muy probable que sea un buen modelo para utilizar.
34. b. .
35. d. 70
36. b. Hay pruebas suficientes para concluir que la elección de la especialidad y el sexo del estudiante no son independientes entre sí.
37. a. bondad de ajuste
Práctica del examen final 2
1. Se hizo un estudio para determinar la proporción de adolescentes que tienen un automóvil. La proporción de población de adolescentes que tienen un automóvil es la:
- estadístico.
- parámetro.
- población.
- variable.
Use la siguiente información para responder los próximos dos ejercicios:
valor | frecuencia |
---|---|
0 | 1 |
1 | 4 |
2 | 7 |
3 | 9 |
6 | 4 |
2. El diagrama de caja para los datos es:
3. Si se suma seis a cada valor de los datos de la tabla, el percentil 15 de la nueva lista de valores es:
- seis
- uno
- siete
- ocho
Use la siguiente información para responder los próximos dos ejercicios: Supongamos que la probabilidad de que se produzca una sequía en cualquier año independiente es del 20 %. De los años en los que se produce una sequía, la probabilidad de racionamiento de agua es del diez por ciento. Sin embargo, en cualquier año, la probabilidad de racionamiento de agua es del cinco por ciento.
4. ¿Cuál es la probabilidad de que se produzca tanto una sequía como racionamiento de agua?
- 0,05
- 0,01
- 0,02
- 0,30
5. ¿Cuál de las siguientes afirmaciones es cierta?
- La sequía y el racionamiento de agua son eventos independientes.
- La sequía y el racionamiento de agua son eventos mutuamente excluyentes.
- Ninguna de las anteriores.
Use la siguiente información para responder los próximos dos ejercicios: Supongamos que una encuesta arroja los siguientes datos:
sexo | manzana | calabaza | pacana |
---|---|---|---|
mujer | 40 | 10 | 30 |
hombre | 20 | 30 | 10 |
6. Supongamos que se elige una persona al azar. La probabilidad de que la tarta favorita de la persona sea de manzana o de que la persona sea hombre es _____.
7. Supongamos que H0 es: La tarta favorita y el sexo son independientes. El valor p es ______.
- ≈ 0
- 1
- 0,05
- no se puede determinar
Use la siguiente información para responder los próximos dos ejercicios: Supongamos que la probabilidad de que un adulto vea las noticias, al menos, una vez a la semana sea de 0,60. Encuestamos 14 personas al azar. Nos interesa el número de personas que ven las noticias, al menos, una vez por semana.
8. ¿Cuál de los siguientes enunciados es FALSO?
- X ~ B(14 0,60)
- Los valores de x son: {1, 2, 3, ..., 14}.
- μ = 8,4
- P(X = 5) = 0,0408
9. Calcule la probabilidad de que al menos seis adultos vean las noticias al menos una vez a la semana.
- 0,8499
- 0,9417
- 0,6429
10. ¿Qué distribución de muestreo es probable que haya generado el siguiente histograma?
- chi-cuadrado con df = 6
- exponencial
- uniforme
- binomial
11. Se sabe que las edades de los estudiantes diurnos y nocturnos del campus se distribuyen normalmente. Una muestra de seis estudiantes diurnos y nocturnos del campus declararon sus edades (en años) como: {18, 35, 27, 45, 20, 20}. ¿Cuál es el límite de error para el intervalo de confianza del 90 % de la edad promedio real?
- 11,2
- 22,3
- 17,5
- 8,7
12. Si una variable aleatoria con distribución normal tiene µ = 0 y σ = 1, entonces el 97,5 % de los valores de la población están por encima de:
- -1,96.
- 1,96.
- 1.
- -1.
Use la siguiente información para responder los próximos tres ejercicios. Se sabe que la cantidad de dinero que un cliente gasta cuando va al supermercado tiene una distribución exponencial. Supongamos que la cantidad promedio de dinero que gasta un cliente cuando va al supermercado es de 72 dólares.
13. ¿Cuál es la probabilidad de que un cliente gaste menos de 72 dólares en un viaje al supermercado?
- 0,6321
- 0,5000
- 0,3714
- 1
14. ¿Cuánto dinero en total espera que gasten los próximos cinco clientes en un solo viaje al supermercado (en dólares)?
- 72
- 5184
- 360
15. Si se quiere calcular la probabilidad de que la cantidad media de dinero que 50 clientes gastan en un viaje al supermercado sea inferior a 60 dólares, la distribución que debería utilizarse es:
- N(72, 72)
- Exp(72)
Use la siguiente información para responder los próximos tres ejercicios: El tiempo que tarda un estudiante de cuarto grado en sacar la basura se distribuye uniformemente en el intervalo de uno a diez minutos.
16. ¿Cuál es la probabilidad de que un estudiante de cuarto grado elegido al azar tarde más de siete minutos en sacar la basura?
17. ¿Qué gráfico muestra mejor la probabilidad de que un estudiante de cuarto grado elegido al azar tarde más de seis minutos en sacar la basura dado que ya ha tardado más de tres minutos?
18. ¿Cuántos minutos deberíamos esperar que un estudiante de cuarto grado tarde en sacar la basura?
- 4,5
- 5,5
- 5
- 10
Use la siguiente información para responder los próximos tres ejercicios: Al principio del trimestre, el tiempo que un estudiante espera en la fila de la cafetería del campus se distribuye normalmente, con una media de cinco minutos y una desviación típica de 1,5 minutos.
19. ¿Cuál es el percentil 90 de los tiempos de espera (en minutos)?
- 1,28
- 90
- 7,47
- 6,92
20. La mediana de tiempo de espera (en minutos) para un estudiante es:
- 5.
- 50.
- 2,5.
- 1,5.
21. Calcule la probabilidad de que el tiempo promedio de espera de diez estudiantes sea como máximo de 5,5 minutos.
- 0,6301
- 0,8541
- 0,3694
- 0,1459
22. Se toma una muestra de 80 ingenieros de software en Silicon Valley y se comprueba que el 20 % de ellos gana 50.000 dólares al año aproximadamente. Una estimación puntual de la verdadera proporción de ingenieros en Silicon Valley que ganan 50.000 dólares al año es:
- 16.
- 0,2.
- 1.
- 0,95.
23. Si P(Z < zα) = 0,1587 donde Z ~ N(0, 1), entonces α es igual a:
- -1.
- 0,1587.
- 0,8413.
- 1.
24. Un profesor hizo una prueba a 35 estudiantes para determinar sus habilidades al inicio del curso. Al final del trimestre, tras completar el curso, se administró la misma prueba a los mismos 35 estudiantes para indagar sobre su mejora. Esta sería una prueba de:
- grupos independientes.
- dos proporciones.
- pares coincidentes, grupos dependientes.
- grupos exclusivos.
Todos los niños de tercer grado que asisten a la escuela ABC presentaron un examen de Matemáticas. Se tomaron dos muestras aleatorias de calificaciones.
n | s | ||
---|---|---|---|
Niños | 55 | 82 | 5 |
Niñas | 60 | 86 | 7 |
25. ¿Cuál de las siguientes opciones describe correctamente los resultados de la comprobación de hipótesis de la afirmación "existe una diferencia entre las puntuaciones medias obtenidas por las niñas y los niños de tercer grado al nivel de significación del 5 %"?
- No rechazar H0. No hay pruebas suficientes para concluir que existe una diferencia en las calificaciones medias.
- No rechazar H0. Hay pruebas suficientes para concluir que existe una diferencia en las calificaciones medias.
- Rechazar H0. No hay pruebas suficientes para concluir que no hay diferencias en las calificaciones medias.
- Rechazar H0. Hay pruebas suficientes para concluir que existe una diferencia en las calificaciones medias.
26. En una encuesta realizada a 80 hombres, 45 habían practicado un deporte organizado durante su infancia. De las 70 mujeres encuestadas, 25 habían practicado un deporte organizado durante su infancia. Nos interesa saber si la proporción de hombres es mayor que la de mujeres. La conclusión correcta es que:
- no hay información suficiente para concluir que la proporción de hombres es igual a la de mujeres.
- no hay información suficiente para concluir que la proporción de hombres no es igual a la de mujeres.
- hay pruebas suficientes para concluir que la proporción de hombres es mayor que la de mujeres.
- no hay suficiente información para llegar a una conclusión.
27. Por experiencia, un maestro de estadística ha comprobado que la calificación promedio en un examen parcial es de 81 con una desviación típica de 5,2. Este trimestre, una clase de 49 estudiantes tuvo una desviación típica de 5 en el examen parcial. ¿Los datos indican que debemos rechazar la afirmación del maestro de que la desviación típica es de 5,2? Utilice α = 0,05.
- Sí
- No
- No se da suficiente información para resolver el problema
28. Se comparan tres máquinas de carga. Se tomaron diez muestras para cada máquina. La máquina I tardó un promedio de 31 minutos en cargar los paquetes con una desviación típica de dos minutos. La máquina II tardó un promedio de 28 minutos en cargar los paquetes con una desviación típica de 1,5 minutos. La máquina III tardó un promedio de 29 minutos en cargar los paquetes con una desviación típica de un minuto. Calcule el valor p al probar que el promedio de los tiempos de carga es el mismo.
- el valor p es cercano a cero
- el valor p es cercano a uno
- no se da suficiente información para resolver el problema
Use la siguiente información para responder los próximos tres ejercicios: Una compañía tiene oficinas en diferentes partes del país. Ha recopilado la siguiente información sobre el número de baños y el número de empleados en siete centros:
Número de empleados x | 650 | 730 | 810 | 900 | 102 | 107 | 1150 |
Número de baños y | 40 | 50 | 54 | 61 | 82 | 110 | 121 |
29. ¿Es significativa la correlación entre el número de empleados y el número de baños?
- Sí
- No
- No hay suficiente información para responder la pregunta
30. La ecuación de regresión lineal es:
- ŷ = 0,0094 − 79,96x
- ŷ = 79,96 + 0,0094x
- ŷ = 79,96 − 0,0094x
- ŷ = −0,0094 + 79,96x
31. Si un centro tiene 1.150 empleados, ¿cuántos baños debería tener aproximadamente?
- 69
- 91
- 91.954
- Aquí no deberíamos hacer estimaciones.
32. Supongamos que se recopila una muestra de tamaño diez, con = 4,4 y s = 1,4. H0: σ2 = 1,6 versus Ha: σ2 ≠ 1,6. ¿Qué gráfico describe mejor los resultados de la prueba?
Se les preguntó a sesenta y cuatro mochileros sobre el número de días transcurridos desde su viaje más reciente. El número de días se indica en Tabla B26:
Número de días | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Frecuencia | 5 | 9 | 6 | 12 | 7 | 10 | 5 | 10 |
33. Realice una prueba adecuada para determinar si la distribución es uniforme.
- El valor p es > 0,10. No hay información suficiente para concluir que la distribución no es uniforme.
- El valor p es < 0,01. Hay suficiente información para concluir que la distribución no es uniforme.
- El valor p está entre 0,01 y 0,10, pero sin alfa (α) no hay suficiente información
- No hay ninguna prueba que se pueda realizar.
34. ¿Cuál de las siguientes afirmaciones es cierta cuando se utiliza el ANOVA de una vía?
- Las poblaciones de las que se seleccionan las muestras tienen distribuciones diferentes.
- El tamaño de las muestras es grande.
- La prueba consiste en determinar si los diferentes grupos tienen las mismas medias.
- Existe una correlación entre los factores del experimento.
Soluciones del examen final de práctica 2
Soluciones
1. b. parámetro.
2. a.
3. c. siete
4. c. 0,02
5. c. ninguna de las anteriores
6. d.
7. a. ≈ 0
8. b. Los valores de x son: {1, 2, 3,..., 14}
9. c. 0,9417.
10. d. binomial
11. d. 8,7
12. a. –1,96
13. a. 0,6321
14. d. 360
15. b.
16. a.
17. d.
18. b. 5,5
19. d. 6,92
20. a. 5
21. b. 0,8541
22. b. 0,2
23. a. –1.
24. c. pares coincidentes, grupos dependientes.
25. d. Rechazar H0. Hay pruebas suficientes para concluir que existe una diferencia en las calificaciones medias.
26. c. hay pruebas suficientes para concluir que la proporción de hombres es mayor que la de mujeres.
27. b. no
28. b. El valor p es cercano a 1.
29. b. No
30. c. = 79,96x – 0,0094
31. d. Aquí no deberíamos hacer estimaciones.
32. a.
33. a. El valor pes > 0,10. No hay información suficiente para concluir que la distribución no es uniforme.
34. c. La prueba consiste en determinar si los diferentes grupos tienen las mismas medias.