Hasta ahora nuestro interés se ha centrado exclusivamente en el parámetro poblacional μ o su contrapartida en la binomial, p. Seguramente la media de una población es el dato más crítico que se tiene, pero en algunos casos nos interesa la variabilidad de los resultados de alguna distribución. En casi todos los procesos de producción, la calidad se mide no solo por el grado de adecuación de la máquina al objetivo, sino también por la variabilidad del proceso. Si se llenaran bolsas con patas fritas, no solo interesaría el peso promedio de la bolsa, sino también la variación de los pesos. Nadie quiere que se le asegure que el peso promedio es exacto cuando su bolsa no tiene papas fritas. El voltaje eléctrico puede alcanzar cierto nivel promedio, pero una gran variabilidad, los picos, pueden causar graves daños a las máquinas eléctricas, especialmente a las computadoras. No solo me gustaría obtener una nota media alta en mis clases, sino también una baja variación en torno a esta media. En resumen, las pruebas estadísticas relativas a la varianza de una distribución tienen un gran valor y muchas aplicaciones.
Una prueba de una sola varianza supone que la distribución subyacente es normal. Las hipótesis nula y alternativa se plantean en términos de la varianza de la población. El estadístico de prueba es:
donde:
- n = el número total de observaciones en los datos de la muestra
- s2 = varianza de la muestra
- = valor hipotético de la varianza de la población
Puede pensar en s como la variable aleatoria en esta prueba. El número de grados de libertad es df = n – 1. Una prueba de una sola varianza puede ser de cola derecha, de cola izquierda o de dos colas. El Ejemplo 11.1 le mostrará cómo establecer las hipótesis nula y alternativa. Las hipótesis nula y alternativa contienen afirmaciones sobre la varianza de la población.
Ejemplo 11.1
Translation missing: es.problem
A los instructores de Matemáticas no solo les interesa saber cómo les va a sus estudiantes en los exámenes, en promedio, sino cómo varían las calificaciones. Para muchos instructores, la varianza (o desviación típica) puede ser más importante que el promedio.
Supongamos que un instructor de Matemáticas cree que la desviación típica de su examen final es de cinco puntos. Uno de sus mejores estudiantes piensa otra cosa. El estudiante afirma que la desviación típica es superior a cinco puntos. Si el estudiante tuviera que realizar una prueba de hipótesis, ¿cuáles serían las hipótesis nula y alternativa?
Solución
Aunque se nos da la desviación típica de la población podemos establecer la prueba utilizando la varianza de la población de la siguiente manera.
- H0: σ2 ≤ 52
- Ha: σ2 > 52
Inténtelo 11.1
Un instructor de submarinismo quiere registrar las profundidades colectivas de cada una de las inmersiones de sus estudiantes durante su entrenamiento. Se interesa por cómo varían las profundidades, aunque todos deberían estar a la misma profundidad. Cree que la desviación típica es de tres pies. Su asistente cree que la desviación típica es de menos de tres pies. Si el instructor tuviera que realizar una prueba, ¿cuáles serían las hipótesis nula y alternativa?
Ejemplo 11.2
Translation missing: es.problem
Con filas individuales en sus distintas ventanillas, una oficina de correos comprueba que la desviación típica de los tiempos de espera de los clientes el viernes por la tarde es de 7,2 minutos. La oficina de correos experimenta con una única línea de espera principal y concluye que, para una muestra aleatoria de 25 clientes, el tiempo de espera tiene una desviación típica de 3,5 minutos un viernes por la tarde.
Con un nivel de significación del 5 %, pruebe la afirmación de que una línea única provoca una variación menor entre los tiempos de espera de los clientes.
Solución
Dado que la afirmación es que una sola fila causa menos variación, esta es una prueba de una sola varianza. El parámetro es la varianza de la población, σ2.
Variable aleatoria: La desviación típica de la muestra, s, es la variable aleatoria. Supongamos que s = desviación típica de los tiempos de espera.
- H0: σ2 ≥ 7,22
- Ha: σ2 < 7,22
La palabra “menos” indica que se trata de una prueba de cola izquierda.
Distribución para la prueba: , donde:
- n = el número de clientes muestreados
- df = n – 1 = 25 – 1 = 24
Calcule el estadístico de prueba:
donde n = 25, s = 3,5 y σ = 7,2.
El gráfico de chi-cuadrado muestra la distribución y marca el valor crítico con 24 grados de libertad a un nivel de confianza del 95 %, α = 0,05, 13,85. El valor crítico de 13,85 procede de la tabla de chi-cuadrado, que se lee de forma muy parecida a la tabla t de Student. La diferencia es que la distribución t de Student es simétrica y la distribución de chi-cuadrado no lo es. En la parte superior de la tabla de chi-cuadrado no solo vemos los valores conocidos 0,05, 0,10, etc., sino también 0,95, 0,975, etc. Estas son las columnas que se utilizan para hallar el valor crítico de la izquierda. El gráfico también marca el valor χ2 calculado del estadístico de prueba de 5,67. Al comparar el estadístico de prueba con el valor crítico, como hemos hecho con todas las demás pruebas de hipótesis, llegamos a la conclusión.
Tome una decisión: Como el estadístico de prueba calculado está en la cola, no podemos aceptar H0. Esto significa que se rechaza σ2 ≥ 7,22. En otras palabras, no cree que la variación de los tiempos de espera sea de 7,2 minutos o más, sino que es menor.
Conclusión: A un nivel de significación del 5 %, a partir de los datos, hay pruebas suficientes para concluir que una sola fila provoca una menor variación entre los tiempos de espera o que con una sola fila, los tiempos de espera de los clientes varían menos de 7,2 minutos.
Ejemplo 11.3
El profesor Hadley tiene debilidad por las donas rellenas de crema, pero cree que algunas panaderías no las rellenan adecuadamente. Una muestra de 24 donas revela una cantidad media de relleno igual a 0,04 tazas, y la desviación típica de la muestra es de 0,11 tazas. Obviamente, al profesor Hadley le interesa la cantidad promedio de relleno, pero le angustia el hecho de que una dona sea radicalmente diferente de otra. Al profesor Hadley no le gustan las sorpresas.
Translation missing: es.problem
Pruebe al 95% la hipótesis nula de que la varianza poblacional del relleno de las donas es significativamente diferente de la cantidad promedio de relleno.
Solución
Es evidente que se trata de un problema que tiene que ver con las varianzas. En este caso, estamos analizando una sola muestra en lugar de comparar dos muestras de poblaciones diferentes. Las hipótesis nula y alternativa son las siguientes:
La prueba está configurada como de dos colas porque el profesor Hadley ha expresado su preocupación por una variación excesiva en el relleno, así como por una variación insuficiente: su disgusto por las sorpresas es cualquier nivel de relleno fuera del promedio previsto de 0,04 tazas. Se calcula que el estadístico de prueba es:
El valor calculado del estadístico de prueba de 6,96 está en la cola y, por ende, a un nivel de significación de 0,05. No podemos aceptar la hipótesis nula de que la varianza en el relleno de las donas es igual a 0,04 tazas. Parece que el profesor Hadley está destinado a encontrarse con la decepción en cada bocado.
Inténtelo 11.3
La Comisión Federal de Comunicaciones (Federal Communications Commission, FCC) hace pruebas de velocidad de banda ancha para medir cuántos datos por segundo pasan entre la computadora de un consumidor e internet. En agosto de 2012, la desviación típica de las velocidades de internet entre los proveedores de servicios de internet (PSI) era del 12,2 %. Supongamos que se toma una muestra de 15 PSI y que la desviación típica es de 13,2. Un analista afirma que la desviación típica de las velocidades es mayor que la comunicada. Plantee las hipótesis nula y alternativa, calcule los grados de libertad, el estadístico de prueba, trace el gráfico de la distribución, marque el área asociada al nivel de confianza y extraiga una conclusión. Prueba al nivel de significación del 1 %.