Pruebas sobre las medias
Ejemplo 9.8
Translation missing: es.problem
Cuando Jeffrey tenía ocho años estableció un tiempo medio de 16,43 segundos al nadar las 25 yardas en estilo libre, con una desviación típica de 0,8 segundos. Su padre, Frank, pensó que Jeffrey podría nadar más rápido las 25 yardas en estilo libre si utilizaba gafas para nadar. Frank le compró a Jeffrey un nuevo par de gafas para nadar costosas y cronometró 15 veces que nadó las 25 yardas en estilo libre. En las 15 veces, el tiempo medio de Jeffrey fue de 16 segundos. Frank pensó que las gafas para nadar ayudaron a Jeffrey a nadar más rápido que los 16,43 segundos. Realice una prueba de hipótesis con un α preestablecido = 0,05.
Solución
Establezca la prueba de la hipótesis:
Dado que el problema se refiere a una media, se trata de una prueba de una única media poblacional.
Establezca las hipótesis nula y alternativa:
En este caso hay una impugnación o reclamo implícitos. Esto es que las gafas reducirán el tiempo de natación. El efecto es formular la hipótesis como una prueba de una cola. El planteamiento siempre estará en la hipótesis alternativa porque la carga de la prueba siempre recae en la alternativa. Recuerde que el statu quo deberá derrotarse con un alto grado de confianza, en este caso del 95 %. Las hipótesis nula y alternativa son las siguientes:
H0: μ ≥ 16,43 Ha: μ < 16,43
Para que Jeffrey nade más rápido, su tiempo debiera ser inferior a 16,43 segundos. El “<” indica que es de cola izquierda.
Determine la distribución necesaria:
Variable aleatoria: = el tiempo medio para nadar las 25 yardas de estilo libre.
Distribución para el estadístico de prueba:
El tamaño de la muestra es inferior a 30 y no conocemos la desviación típica de la población, por lo que se trata de una prueba t y la fórmula adecuada es:
μ0 = 16,43 proviene de H0 y no de los datos. = 16. s = 0,8; y n = 15.
Nuestro paso 2, establecer el nivel de significación, ya se ha determinado en el problema, 0,05 para un nivel de significación del 95 %. Merece la pena reflexionar sobre el significado de esta elección. El error tipo I consiste en concluir que Jeffrey nada las 25 yardas en estilo libre, en promedio, en menos de 16,43 segundos cuando, en realidad, nada las 25 yardas en estilo libre, en promedio, en 16,43 segundos (rechaza la hipótesis nula cuando la hipótesis nula es verdadera). Para este caso, la única preocupación de un error de tipo I parece ser que el padre de Jeffery puede no apostar por la victoria de su hijo porque no le convence el efecto de las gafas.
Para calcular el valor crítico tenemos que seleccionar la estadística apropiada de la prueba. Hemos llegado a la conclusión de que se trata de una prueba t en función del tamaño de la muestra y de que nos interesa una media poblacional. Ahora podemos dibujar el gráfico de la distribución t y marcar el valor crítico. Para este problema los grados de libertad son n-1, es decir, 14. Al buscar 14 grados de libertad en la columna 0,05 de la tabla t, hallamos 1,761. Este es el valor crítico y podemos ponerlo en nuestro gráfico.
El paso 3 es el cálculo de la estadístico de la prueba con la fórmula seleccionada. Hallamos que el estadístico de prueba es 2,08, lo que significa que la media muestral está a 2,08 desviaciones típicas de la media hipotética de 16,43.
En el paso 4 tenemos que comparar el estadístico de prueba y el valor crítico y marcarlos en el gráfico. Vemos que el estadístico de prueba está en la cola; por ende, pasamos al paso 4 y llegamos a una conclusión. La probabilidad de que el tiempo promedio de 16 minutos proceda de una distribución con una media poblacional de 16,43 minutos es demasiado improbable para que aceptemos la hipótesis nula. No podemos aceptar la hipótesis nula.
El paso 5 nos hace exponer nuestras conclusiones primero de manera formal y luego de manera menos formal. La conclusión formal sería la siguiente: "Con un nivel de significación del 95 %, no podemos aceptar la hipótesis nula de que el tiempo de natación con gafas procede de una distribución con una media poblacional de 16,43 minutos". De manera menos formal: "Con un 95 % de significación, creemos que las gafas mejoran la velocidad de nado".
Si quisiéramos utilizar el sistema de valores p para llegar a una conclusión, calcularíamos la estadística y daríamos el paso adicional de la probabilidad de estar a 2,08 desviaciones típicas de la media en una distribución t. Este valor es de 0,0187. Al compararlo con el nivel α de 0,05, nos damos cuenta de que no podemos aceptar la hipótesis nula. El valor p se ha puesto en el gráfico como el área sombreada más allá de –2,08 y muestra que es menor que el área sombreada, que es el nivel alfa de 0,05. Con ambos métodos se llega a la misma conclusión de que no podemos aceptar la hipótesis nula.
Inténtelo 9.8
La distancia media de lanzamiento de un balón de fútbol para Marco, un mariscal de campo de primer año de escuela secundaria, es de 40 yardas, con una desviación típica de dos yardas. El entrenador del equipo le dice a Marco que ajuste su agarre para conseguir más distancia. El entrenador registra las distancias de 20 lanzamientos. En los 20 lanzamientos, la distancia media de Marco fue de 45 yardas. El entrenador pensó que el agarre diferente ayudó a Marco a lanzar más allá de las 40 yardas. Realice una prueba de hipótesis con un α preestablecido = 0,05. Supongamos que las distancias de lanzamiento de los balones son normales.
En primer lugar, determine de qué tipo de prueba se trata, establezca la prueba de hipótesis, calcule el valor p, dibuje el gráfico y plantee su conclusión.
Ejemplo 9.9
Translation missing: es.problem
Jane acaba de incorporarse al equipo de ventas de una compañía muy competitiva. En una muestra de 16 llamadas de ventas se comprobó que cerró el contrato por un valor promedio de 108 dólares con una desviación típica de 12 dólares. Pruebe al 5 % de significación que la media de la población es de al menos 100 dólares contra la alternativa de que es menor de 100 dólares. La política de la compañía exige que los nuevos integrantes del equipo de ventas superen un promedio de 100 dólares por contrato durante el periodo de prueba del empleo. ¿Podemos concluir que Jane ha cumplido este requisito con un nivel de significación del 95 %?
Solución
- H0: µ ≤ 100
Ha: µ > 100
Las hipótesis nula y alternativa son para el parámetro µ porque el número de dólares de los contratos es una variable aleatoria continua. Además, se trata de una prueba de una cola porque a la compañía solo le interesa si el número de dólares por contacto está por debajo de una cifra determinada, no de una cifra "demasiado alta". Esto se considera una afirmación de que el requisito se cumple; por ende, está en la hipótesis alternativa. - Estadístico de prueba:
- Valor crítico: con n-1 grados de libertad = 15
El estadístico de prueba es una t de Student porque el tamaño de la muestra es inferior a 30; por ende, no podemos utilizar la distribución normal. Al comparar el valor calculado del estadístico de prueba y el valor crítico de a un nivel de significación del 5 %, vemos que el valor calculado está en la cola de la distribución. Así, concluimos que 108 dólares por contrato es significativamente mayor que el valor hipotético de 100; por ende, no podemos aceptar la hipótesis nula. Hay pruebas que apoyan que el desempeño de Jane cumple con los estándares de la compañía.
Inténtelo 9.9
Se cree que el precio de las acciones de una determinada compañía crecerá a un ritmo de 5 dólares por semana con una desviación típica de 1 dólar. Un inversor cree que las acciones no crecerán tan rápido. Las variaciones en el precio de las acciones se registran durante diez semanas y son las siguientes: 4, 3, 2, 3, 1, 7, 2, 1, 1 y 2 dólares. Realice una prueba de hipótesis con un nivel de significación del 5 %. Plantee las hipótesis nula y alternativa, exponga su conclusión e identifique los errores de tipo I.
Ejemplo 9.10
Translation missing: es.problem
Un fabricante de aderezos para ensaladas utiliza máquinas para dispensar ingredientes líquidos en frascos que se mueven a lo largo de una línea de llenado. La máquina que dispensa aderezos para ensaladas funciona correctamente cuando se dispensan 8 onzas. Supongamos que la cantidad promedio dispensada en una muestra concreta de 35 frascos es de 7,91 onzas con una varianza de 0,03 onzas al cuadrado, . ¿Hay pruebas de que la máquina debería detenerse y la producción debería esperar a que se repare? La pérdida de producción por una parada es potencialmente tan grande que la dirección considera que el nivel de significación en el análisis debería ser del 99 %.
De nuevo, seguiremos los pasos de nuestro análisis de este problema.
Solución
PASO 1: Formule las hipótesis nula y alternativa. La variable aleatoria es la cantidad de líquido que se coloca en los frascos. Se trata de una variable aleatoria continua y el parámetro que nos interesa es la media. Por lo tanto, nuestra hipótesis se refiere a la media. En este caso, nos preocupa que la máquina no esté haciendo el llenado correctamente. Por lo que nos dicen, no importa si la máquina está llenando de más o de menos, ambos parecen ser un error igual de malo. Esto nos indica que se trata de una prueba de dos colas: si la máquina funciona mal, se apagará, sea por exceso o insuficiencia de llenado. Las hipótesis nula y alternativa son las siguientes:
PASO 2: Decida el nivel de significación y dibuje el gráfico que muestra el valor crítico.
Este problema ya ha fijado el nivel de significación en el 99 %. La decisión luce apropiada y muestra el proceso de reflexión al establecer el nivel de significación. La dirección quiere estar muy segura, tan segura como la probabilidad le permita, de que no esté cerrando una máquina que no necesita reparación. Para dibujar la distribución y el valor crítico, necesitamos saber qué distribución utilizar. Dado que se trata de una variable aleatoria continua y que nos interesa la media, y que el tamaño de la muestra es superior a 30, la distribución adecuada es la normal y el valor crítico pertinente es 2,575 de la tabla normal o la tabla t con una columna de 0,005 e infinitos grados de libertad. Dibujamos el gráfico y marcamos estos puntos.
PASO 3: Calcule los parámetros de la muestra y el estadístico de prueba. Los parámetros de la muestra se proporcionan, la media muestral es 7,91 y la varianza de la muestra es 0,03 y el tamaño de la muestra es 35. Hay que tener en cuenta que se proporcionó la varianza de la muestra y no la desviación típica de la muestra, que es lo que necesitamos para la fórmula. Al recordar que la desviación típica es simplemente la raíz cuadrada de la varianza, sabemos, por ende, que la desviación típica de la muestra, s, es 0,173. Con esta información calculamos el estadístico de prueba como -3,07, y la marcamos en el gráfico.
PASO 4: Compare el estadístico de prueba y los valores críticos. Ahora comparamos el estadístico de prueba y el valor crítico al colocar el estadístico de prueba en el gráfico. Vemos que el estadístico de prueba está en la cola, decididamente mayor que el valor crítico de 2,575. Observamos que incluso la pequeña diferencia entre el valor hipotético y el valor de la muestra sigue siendo un gran número de desviaciones típicas. La media muestral solo difiere en 0,08 onzas del nivel requerido de 8 onzas, pero está a 3 desviaciones típicas más; en consecuencia, no podemos aceptar la hipótesis nula.
PASO 5: Llegue a una conclusión
Tres desviaciones típicas del estadístico de prueba harán que la prueba falle. La probabilidad de que algo esté dentro de tres desviaciones típicas es casi cero. En realidad, es 0,0026 en la distribución normal, lo que ciertamente es casi cero en un sentido práctico. Nuestra conclusión formal sería: "A un nivel de significación del 99 %, no podemos aceptar la hipótesis de que la media muestral procede de una distribución con una media de 8 onzas". De manera menos formal, y yendo al grano: "A un nivel de significación del 99 %, llegamos a la conclusión de que la máquina no llena bien las botellas y necesita reparación".
Prueba de hipótesis para las proporciones
Al igual que existían intervalos de confianza para las proporciones, o más formalmente, el parámetro poblacional p de la distribución binomial, existe la posibilidad de contrastar hipótesis relativas a p.
El parámetro poblacional para la binomial es p. El valor estimado (estimación puntual) para p es p′ donde p′ = x/n, x es el número de aciertos en la muestra y n es el tamaño de la muestra.
Cuando se realiza una prueba de hipótesis de una proporción poblacional p, se toma una muestra aleatoria simple de la población. Deberán cumplirse las condiciones de la distribución binomial, a saber: que haya un cierto número n de ensayos independientes, lo que significa un muestreo aleatorio; que los resultados de cualquier ensayo sean binarios, éxito o fracaso, y que cada ensayo tenga la misma probabilidad de éxito p. La forma de la distribución binomial debe ser similar a la forma de la distribución normal. Para ello, las cantidades np′ y nq′ deben ser ambas mayores que cinco (np′ > 5 y nq′ > 5). En este caso, la distribución binomial de una proporción muestral (estimada) se calcula aproximadamente por la distribución normal con y . Recuerde que . No hay ninguna distribución que corrija este pequeño sesgo de la muestra; por ende, si no se cumplen estas condiciones, simplemente no podemos probar la hipótesis con los datos disponibles en ese momento. Cumplimos esta condición cuando estimamos por primera vez los intervalos de confianza para p.
Nuevamente, comenzamos con la fórmula normalizadora modificada porque se trata de la distribución de una binomial.
Al sustituir , el valor hipotético de p, tenemos:
Es el estadístico de prueba para comprobar los valores hipotéticos de p, cuando las hipótesis nula y alternativa adoptan una de las siguientes formas:
Prueba de dos colas | Prueba de una cola | Prueba de una cola |
---|---|---|
H0: p = p0 | H0: p ≤ p0 | H0: p ≥ p0 |
Ha: p ≠ p0 | Ha: p > p0 | Ha: p < p0 |
La regla de decisión indicada anteriormente se aplica también en este caso: si el valor calculado de Zc muestra que la proporción de la muestra está a "demasiadas" desviaciones típicas de la proporción hipotética, no se puede aceptar la hipótesis nula. La decisión sobre lo que es "demasiado" está predeterminada por el analista en función del nivel de significación requerido en la prueba.
Ejemplo 9.11
Translation missing: es.problem
El departamento de hipotecas de un gran banco se interesa por la naturaleza de los préstamos de prestatarios primerizos. Esta información se utilizará para adaptar su estrategia de mercadeo. Creen que el 50 % de los prestatarios primerizos piden préstamos más pequeños que los demás. Realizan una prueba de hipótesis para determinar si el porcentaje es igual o diferente del 50 %. Toman una muestra de 100 prestatarios primerizos y concluyen que 53 de estos préstamos son menores que los demás. Para la prueba de la hipótesis, eligen un nivel de significación del 5 %.
Solución
PASO 1: Formule las hipótesis nula y alternativa.
H0: p = 0,50 Ha: p ≠ 0,50
Las palabras “es igual o diferente de” indican que se trata de una prueba de dos colas. Los errores tipo I y II son los siguientes: El error de tipo I consiste en concluir que la proporción de prestatarios es diferente del 50 % cuando, en realidad, la proporción es del 50 %. (Rechaza la hipótesis nula cuando la hipótesis nula es verdadera). El error de tipo II consiste en que no hay pruebas suficientes para concluir que la proporción de prestatarios primerizos difiere del 50 % cuando, de hecho, sí difiere del 50 %. (No se rechaza la hipótesis nula cuando esta es falsa).
PASO 2: Decida el nivel de significación y dibuje el gráfico que muestre el valor crítico.
El nivel de significación se ha fijado por el problema en el 95 %. Por tratarse de una prueba de dos colas, la mitad del valor alfa estará en la cola superior y la otra mitad en la cola inferior, como se muestra en el gráfico. El valor crítico de la distribución normal con un nivel de confianza del 95 % es de 1,96. Esto se halla fácilmente en la tabla t de Student en la parte inferior a infinitos grados de libertad, recordando que en el infinito la distribución t es la distribución normal. Por supuesto, el valor también se halla en la tabla normal, pero hay que buscar la mitad de 95 (0,475) dentro de la tabla y luego leer hacia los lados y la parte superior el número de desviaciones típicas.
PASO 3: Calcule los parámetros de la muestra y el valor crítico del estadístico de prueba.
El estadístico de prueba es una distribución normal, Z, para probar proporciones y es:
En este caso, en la muestra de 100 se determinó que 53 prestatarios primerizos eran diferentes de los demás. La proporción muestral, p′ = 53/100 = 0,53. En consecuencia, la pregunta de la prueba es: "¿Es 0,53 significativamente diferente de 0,50?" Si introducimos estos valores en la fórmula del estadístico de prueba, hallamos que 0,53 está a solo 0,60 desviaciones típicas de 0,50. Esto apenas se aleja de la media de la distribución estándar normal de cero. No hay prácticamente ninguna diferencia entre la proporción de la muestra y la proporción hipotética en términos de desviaciones típicas.
PASO 4: Compare el estadístico de prueba y el valor crítico.
El valor calculado se encuentra dentro de los valores críticos de ± 1,96 desviaciones típicas, por lo que no podemos rechazar la hipótesis nula. Para rechazar la hipótesis nula, la diferencia significativa entre el valor hipotético y el valor de la muestra tiene que ser evidente. En este caso, el valor de la muestra es muy parecido al valor hipotético medido en términos de desviaciones típicas.
PASO 5: Llegue a una conclusión
La conclusión formal sería: "A un nivel de significación del 95 %, no podemos rechazar la hipótesis nula de que el 50 % de los prestatarios primerizos tienen préstamos del mismo tamaño que los demás". De manera menos formal, diríamos que: "No hay pruebas de que la mitad de los prestatarios primerizos sean significativamente diferentes en cuanto al tamaño del préstamo de los demás". Fíjese en lo lejos que llega la conclusión para incluir todas las condiciones correspondientes. Los estadísticos, a pesar de todas las críticas que reciben, se preocupan por ser muy específicos, incluso cuando esto parece trivial. Los estadísticos no pueden decir más de lo que saben y los datos obligan a que la conclusión esté dentro de los límites de los datos.
Inténtelo 9.11
Un maestro cree que el 85 % de los estudiantes de la clase querrán ir de excursión al zoológico local. Realiza una prueba de hipótesis para determinar si el porcentaje es igual o diferente del 85 %. El maestro hace un muestreo de 50 estudiantes y 39 responden que querrían ir al zoológico. Para la prueba de hipótesis utilice un nivel de significación del 1 %.
Ejemplo 9.12
Translation missing: es.problem
Supongamos que un grupo de consumidores estima que la proporción de hogares que tienen tres o más teléfonos móviles es del 30 %. Una compañía de telefonía móvil tiene razones para creer que la proporción no es del 30 %. Antes de iniciar una gran campaña publicitaria realizan una prueba de hipótesis. Su personal de mercadeo realiza una encuesta en 150 hogares, con el resultado de que 43 tienen tres o más teléfonos móviles.
Solución
He aquí una versión abreviada del sistema de resolución de pruebas de hipótesis, aplicado a una prueba de proporciones.
Ejemplo 9.13
Translation missing: es.problem
El Instituto Nacional de Normas y Tecnología proporciona datos exactos sobre las propiedades de conductividad de los materiales. A continuación se muestran las mediciones de conductividad de 11 piezas seleccionadas al azar de un tipo de vidrio en particular.
1,11; 1,07; 1,11; 1,07; 1,12; 1,08; 0,98; 0,98; 1,02; 0,95; 0,95.
¿Hay pruebas convincentes de que la conductividad promedio de este tipo de vidrio sea superior a uno? Utilice un nivel de significación de 0,05.
Solución
Sigamos un proceso de cuatro pasos para responder esta pregunta estadística.
- Plantee la pregunta: Tenemos que determinar si, a un nivel de significación de 0,05, la conductividad promedio del vidrio seleccionado es mayor que uno. Nuestras hipótesis serán
- H0: μ ≤ 1
- Ha: μ > 1
- Plan: Estamos probando una media muestral sin una desviación típica poblacional conocida con menos de 30 observaciones. Por consiguiente, tenemos que utilizar una distribución de la t de Student. Supongamos que la población subyacente es normal.
- Haga los cálculos y dibuje el gráfico.
- Plantee las conclusiones: No podemos aceptar la hipótesis nula. Es razonable afirmar que los datos apoyan la afirmación de que el nivel promedio de conductividad es superior a uno.
Ejemplo 9.14
Translation missing: es.problem
En un estudio de 420.019 usuarios de teléfonos móviles, 172 de los sujetos desarrollaron cáncer cerebral. Pruebe la afirmación de que los usuarios de teléfonos móviles desarrollaron cáncer cerebral a una tasa mayor que la de los no usuarios de teléfonos móviles (la tasa de cáncer cerebral para los no usuarios de teléfonos móviles es del 0,0340 %). Dado que se trata de un asunto crítico utilice un nivel de significación de 0,005. Explique por qué el nivel de significación debe ser tan bajo en términos de un error tipo I.
Solución
- Tenemos que realizar una prueba de hipótesis sobre la tasa de cáncer declarada. Nuestras hipótesis serán
- H0: p ≤ 0,00034
- Ha: p > 0,00034
Si cometemos un error tipo I, estamos aceptando esencialmente una afirmación falsa. Dado que la afirmación describe entornos cancerígenos, queremos minimizar las posibilidades de identificar incorrectamente las causas del cáncer.
- Probemos una proporción de muestra con x = 172 y n = 420.019. La muestra es suficientemente grande porque tenemos np' = 420.019(0,00034) = 142,8; nq' = 420.019(0,99966) = 419.876,2, dos resultados independientes y una probabilidad fija de éxito p' = 0,00034. Así podremos generalizar nuestros resultados a la población.