En este tipo de prueba de hipótesis se determina si los datos “se ajustan” a una determinada distribución o no. Por ejemplo, puede sospechar que sus datos desconocidos se ajustan a una distribución binomial. Se utiliza una prueba de chi-cuadrado (lo que significa que la distribución para la prueba de hipótesis es chi-cuadrado) para determinar si hay un ajuste o no. Las hipótesis nula y alternativa de esta prueba se pueden escribir en oraciones o plantear como ecuaciones o desigualdades.
El estadístico de prueba para una prueba de bondad de ajuste es:
donde:
- O = valores observados (datos)
- E = valores esperados (de la teoría)
- k = el número de celdas o categorías de datos diferentes
Los valores observados son los valores de los datos y los valores esperados son los valores que se esperarían obtener si la hipótesis nula fuera cierta. Hay n términos de la forma .
El número de grados de libertad es df = (número de categorías – 1).
La prueba de bondad de ajuste es casi siempre de cola derecha. Si los valores observados y los correspondientes valores esperados no se aproximan entre sí, el estadístico de prueba puede ser muy grande y se situará en la cola derecha de la curva de chi-cuadrado.
Nota
El número de valores esperados dentro de cada celda debe ser al menos cinco para poder utilizar esta prueba.
Ejemplo 11.4
El ausentismo de los estudiantes universitarios a las clases de Matemáticas es una de las principales preocupaciones de los instructores de Matemáticas, ya que ausentarse de clase parece aumentar la tasa de abandono. Supongamos que se realiza un estudio para determinar si la tasa real de ausentismo de los estudiantes sigue la percepción del profesorado. El profesorado esperaba que un grupo de 100 estudiantes se ausentara de clase según se indica en la Tabla 11.1.
Número de ausencias por trimestre | Número previsto de estudiantes |
---|---|
0–2 | 50 |
3–5 | 30 |
6–8 | 12 |
9–11 | 6 |
12+ | 2 |
Luego, se realizó una encuesta aleatoria en todos los cursos de Matemáticas para determinar el número real (observado) de ausencias en un curso. El gráfico de la Tabla 11.2 muestra los resultados de esa encuesta.
Número de ausencias por trimestre | Número real de estudiantes |
---|---|
0–2 | 35 |
3–5 | 40 |
6–8 | 20 |
9–11 | 1 |
12+ | 4 |
Determine las hipótesis nula y alternativa necesarias para realizar una prueba de bondad de ajuste.
H0: El ausentismo de los estudiantes se ajusta a la percepción del profesorado.
La hipótesis alternativa es la opuesta a la hipótesis nula.
Ha: El ausentismo de los estudiantes no se ajusta a la percepción del profesorado.
Translation missing: es.problem
a. ¿Puede utilizar la información tal y como aparece en los gráficos para realizar la prueba de bondad de ajuste?
Solución
a. No. Tome nota que el número de ausencias previsto para la entrada “más de 12” es inferior a cinco (es dos). Combine ese grupo con el de “9-11” para crear nuevas tablas en las que el número de estudiantes de cada entrada sea de cinco como mínimo. Los nuevos resultados están en la Tabla 11.3 y la Tabla 11.4.
Número de ausencias por trimestre | Número previsto de estudiantes |
---|---|
0–2 | 50 |
3–5 | 30 |
6–8 | 12 |
9+ | 8 |
Número de ausencias por trimestre | Número real de estudiantes |
---|---|
0–2 | 35 |
3–5 | 40 |
6–8 | 20 |
9+ | 5 |
Translation missing: es.problem
b. ¿Cuál es el número de grados de libertad (df)?
Solución
b. Hay cuatro “celdas” o categorías en cada una de las nuevas tablas.
df = número de celdas – 1 = 4 – 1 = 3
Inténtelo 11.4
El gerente de una fábrica necesita saber cuántos productos son defectuosos frente a cuántos se producen. El número de defectos previstos figura en la Tabla 11.5.
Número producido | Número defectuoso |
---|---|
0–100 | 5 |
101–200 | 6 |
201–300 | 7 |
301–400 | 8 |
401–500 | 10 |
Se tomó una muestra aleatoria para determinar el número real de defectos. La Tabla 11.6 muestra los resultados de la encuesta.
Número producido | Número defectuoso |
---|---|
0–100 | 5 |
101–200 | 7 |
201–300 | 8 |
301–400 | 9 |
401–500 | 11 |
Indique las hipótesis nula y alternativa necesarias para llevar a cabo una prueba de bondad de ajuste, e indique los grados de libertad.
Ejemplo 11.5
Translation missing: es.problem
Los empleadores quieren saber qué días de la semana se ausentan los empleados en una semana laboral de cinco días. La mayoría de los empleadores quiere creer que los empleados se ausentan por igual durante la semana. Supongamos que se pregunta a una muestra aleatoria de 60 gerentes qué día de la semana tienen el mayor número de ausencias de empleados. Los resultados se distribuyeron como en la Tabla 11.7. Para la población de empleados, ¿los días de mayor número de ausencias se producen con igual frecuencia durante una semana laboral de cinco días? Pruebe con un nivel de significación del 5 %.
Lunes | Martes | Miércoles | Jueves | Viernes | |
---|---|---|---|---|---|
Número de ausencias | 15 | 12 | 9 | 9 | 15 |
Solución
Las hipótesis nula y alternativa son:
- H0: Los días ausentes se producen con igual frecuencia, es decir, se ajustan a una distribución uniforme.
- Ha: Los días ausentes se producen con frecuencias desiguales, es decir, no se ajustan a una distribución uniforme.
Si los días de ausencia se producen con igual frecuencia, entonces, de los 60 días de ausencia (el total de la muestra: 15 + 12 + 9 + 9 + 15 = 60), habría 12 ausencias el lunes, 12 el martes, 12 el miércoles, 12 el jueves y 12 el viernes. Estos números son los valores esperados (E). Los valores de la tabla son los valores o datos observados (O).
Esta vez, calcule el estadístico de prueba χ2 a mano. Haga un cuadro con los siguientes títulos y rellene las columnas:
- Valores esperados (E) (12, 12, 12, 12, 12)
- Valores observados (O) (15, 12, 9, 9, 15)
- (O – E)
- (O – E)2
Ahora, añada (sume) la última columna. La suma es de tres. Se trata del estadístico de prueba χ2.
El valor calculado del estadístico de prueba es 3 y el valor crítico de la distribución χ2 a 4 grados de libertad; el nivel de confianza de 0,05 es 9,48. Este valor se encuentra en la tabla χ2 en la columna 0,05 de la fila 4 de grados de libertad.
Los grados de libertad son el número de celdas – 1 = 5 – 1 = 4
Luego, complete un gráfico como el siguiente con el identificado y el sombreado adecuados (debería sombrear la cola derecha).
La decisión es no rechazar la hipótesis nula porque el valor calculado del estadístico de prueba no está en la cola de la distribución.
Conclusión: A un nivel de significación del 5 %, a partir de los datos de la muestra, no hay pruebas suficientes para concluir que los días de ausencia no se producen con igual frecuencia.
Inténtelo 11.5
Los maestros quieren saber qué noche de la semana sus estudiantes hacen la mayor parte de las tareas para la casa. La mayoría de los maestros piensan que los estudiantes hacen las tareas para la casa por igual a lo largo de la semana. Supongamos que se pregunta a una muestra aleatoria de 56 estudiantes en qué noche de la semana hacen más tareas para la casa. Los resultados se distribuyeron como en la Tabla 11.8.
Domingo | Lunes | Martes | Miércoles | Jueves | Viernes | Sábado | |
---|---|---|---|---|---|---|---|
Número de estudiantes | 11 | 8 | 10 | 7 | 10 | 5 | 5 |
De la población de estudiantes, ¿las noches en las que el mayor número de estudiantes hace la mayoría de sus tareas para la casa ocurren con igual frecuencia durante una semana? ¿Qué tipo de prueba de hipótesis debe utilizar?
Ejemplo 11.6
Un estudio indica que el número de televisores que tienen las familias estadounidenses se distribuye (esta es la distribución dada para la población estadounidense) como en la Tabla 11.9.
Número de televisores | Porcentaje |
---|---|
0 | 10 |
1 | 16 |
2 | 55 |
3 | 11 |
4+ | 8 |
La tabla contiene los porcentajes esperados (E).
Una muestra aleatoria de 600 familias del extremo oeste de Estados Unidos dio como resultado los datos que figuran en la Tabla 11.10.
Número de televisores | Frecuencia |
---|---|
0 | 66 |
1 | 119 |
2 | 340 |
3 | 60 |
4+ | 15 |
Total = 600 |
La tabla contiene los valores de frecuencia observados (O).
Translation missing: es.problem
Al nivel de significación del 1 %, ¿parece que la distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución de la población estadounidense en su conjunto?
Solución
Este problema le pide que compruebe si la distribución de las familias del extremo oeste de Estados Unidos se ajusta a la distribución de las familias del resto del país. Esta prueba es siempre de cola derecha.
La primera tabla contiene los porcentajes previstos. Para obtener las frecuencias esperadas (E), multiplique el porcentaje por 600. Las frecuencias esperadas se muestran en la Tabla 11.11.
Número de televisores | Porcentaje | Frecuencia esperada |
---|---|---|
0 | 10 | (0,10)(600) = 60 |
1 | 16 | (0,16)(600) = 96 |
2 | 55 | (0,55)(600) = 330 |
3 | 11 | (0,11)(600) = 66 |
más de 3 | 8 | (0,08)(600) = 48 |
Por lo tanto, las frecuencias esperadas son 60, 96, 330, 66 y 48.
H0: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es igual a la distribución del “número de televisores” de la población estadounidense.
Ha: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución del “número de televisores” de la población estadounidense.
Distribución para la prueba: donde df = (el número de celdas) – 1 = 5 – 1 = 4.
Calcule el estadístico de prueba: χ2 = 29,65
Gráfico:
El gráfico de chi-cuadrado muestra la distribución y marca el valor crítico con cuatro grados de libertad a un nivel de confianza del 99 %, α = 0,01; 13,277. El gráfico también marca el valor calculado del estadístico de prueba de chi-cuadrado en 29,65. Al comparar el estadístico de prueba con el valor crítico, como hemos hecho con todas las demás pruebas de hipótesis, llegamos a la conclusión.
Tome una decisión: Dado que el estadístico de prueba está en la cola de la distribución, no podemos aceptar la hipótesis nula.
Esto significa que usted rechaza la creencia de que la distribución para los estados del extremo oeste es igual a la de la población estadounidense en su conjunto.
Conclusión: Al nivel de significación del 1 %, a partir de los datos, hay pruebas suficientes para concluir que la distribución del “número de televisores” para el extremo oeste de Estados Unidos es diferente de la distribución del “número de televisores” para el conjunto de la población estadounidense.
Inténtelo 11.6
El porcentaje esperado del número de mascotas que tienen los estudiantes en sus hogares se distribuye (es la distribución dada para la población estudiantil de Estados Unidos) como en la Tabla 11.12.
Número de mascotas | Porcentaje |
---|---|
0 | 18 |
1 | 25 |
2 | 30 |
3 | 18 |
4+ | 9 |
Una muestra aleatoria de 1.000 estudiantes del este de Estados Unidos dio como resultado los datos que figuran en la Tabla 11.13.
Número de mascotas | Frecuencia |
---|---|
0 | 210 |
1 | 240 |
2 | 320 |
3 | 140 |
4+ | 90 |
Al nivel de significación del 1 %, ¿parece que la distribución “número de mascotas” de los estudiantes del este de Estados Unidos es diferente de la distribución para el conjunto de la población estudiantil de Estados Unidos?
Ejemplo 11.7
Translation missing: es.problem
Supongamos que lanza dos monedas 100 veces. Los resultados son 20 HH, 27 HT, 30 TH y 23 TT. ¿Las monedas son imparciales? Pruebe con un nivel de significación del 5 %.
Solución
Este problema se puede plantear como un problema de bondad de ajuste. El espacio muestral para lanzar dos monedas imparciales es {HH, HT, TH, TT}. De cada 100 lanzamientos, se esperan 25 HH, 25 HT, 25 TH y 25 TT. Esta es la distribución esperada de probabilidad binomial. La pregunta “¿las monedas son imparciales?” es lo mismo que decir “¿la distribución de las monedas (20 HH, 27 HT, 30 TH, 23 TT) se ajusta a la distribución esperada?”.
Variable aleatoria: Supongamos que X = el número de caras en un lanzamiento de las dos monedas. X toma los valores 0, 1, 2 (hay 0, 1 o 2 caras en el lanzamiento de dos monedas). Por lo tanto, el número de celdas es tres. Como X = el número de caras, las frecuencias observadas son 20 (para dos caras), 57 (para una cara) y 23 (para cero caras o dos cruces). Las frecuencias esperadas son 25 (para dos caras), 50 (para una cara) y 25 (para cero caras o dos cruces). Esta prueba es de cola derecha.
H0: Las monedas son imparciales.
Ha: Las monedas no son imparciales.
Distribución para la prueba: donde df = 3 – 1 = 2.
Calcule el estadístico de prueba: χ2 = 2,14
Gráfico:
El gráfico de chi-cuadrado muestra la distribución y marca el valor crítico con dos grados de libertad a un nivel de confianza del 95 %, α = 0,05; 5,991. El gráfico también marca el valor calculado del estadístico de prueba χ2 en 2,14. Al comparar el estadístico de prueba con el valor crítico, como hemos hecho con todas las demás pruebas de hipótesis, llegamos a la conclusión.
Conclusión: No hay pruebas suficientes para concluir que las monedas no son justas: no podemos rechazar la hipótesis nula de que las monedas son justas.