Barbara Illowsky; Susan Dean

11.2 Prueba de bondad de ajuste

En este tipo de prueba de hipótesis se determina si los datos “se ajustan” a una determinada distribución o no. Por ejemplo, puede sospechar que sus datos desconocidos se ajustan a una distribución binomial. Se utiliza una prueba de chi-cuadrado (lo que significa que la distribución para la prueba de hipótesis es chi-cuadrado) para determinar si hay un ajuste o no. Las hipótesis nula y alternativa de esta prueba se pueden escribir en oraciones o plantear como ecuaciones o desigualdades.

El estadístico de prueba para una prueba de bondad de ajuste es:

\underset{k}{Σ} \frac{{(O - E)}^{2}}{E}

donde:

O = valores observados (datos)
E = valores esperados (de la teoría)
k = el número de celdas o categorías de datos diferentes

Los valores observados son los valores de los datos y los valores esperados son los valores que se esperarían obtener si la hipótesis nula fuera cierta. Hay n términos de la forma $\frac{{(O - E)}^{2}}{E}$ .

El número de grados de libertad es df = (número de categorías – 1).

La prueba de bondad de ajuste es casi siempre de cola derecha. Si los valores observados y los correspondientes valores esperados no se aproximan entre sí, el estadístico de prueba puede ser muy grande y se situará en la cola derecha de la curva de chi-cuadrado.

Nota

El valor esperado de cada celda debe ser, al menos, cinco para poder utilizar esta prueba.

Ejemplo 11.1

El ausentismo de los estudiantes universitarios a las clases de Matemáticas es una de las principales preocupaciones de los instructores de Matemáticas, ya que ausentarse de clase parece aumentar la tasa de abandono. Supongamos que se realiza un estudio para determinar si la tasa real de ausentismo de los estudiantes sigue la percepción del profesorado. El profesorado esperaba que un grupo de 100 estudiantes se ausentara de clase según se indica en la Tabla 11.1.

Número de ausencias por trimestre	Número previsto de estudiantes
0–2	50
3–5	30
6–8	12
9–11	6
12+	2

Tabla 11.1

Luego, se realizó una encuesta aleatoria en todos los cursos de Matemáticas para determinar el número real (observado) de ausencias en un curso. El gráfico de la Tabla 11.2 muestra los resultados de esa encuesta.

Número de ausencias por trimestre	Número real de estudiantes
0–2	35
3–5	40
6–8	20
9–11	1
12+	4

Tabla 11.2

Determine las hipótesis nula y alternativa necesarias para realizar una prueba de bondad de ajuste.

H₀: El ausentismo de los estudiantes se ajusta a la percepción del profesorado.

La hipótesis alternativa es la opuesta a la hipótesis nula.

H_a: El ausentismo de los estudiantes no se ajusta a la percepción del profesorado.

Translation missing: es.problem

a. ¿Puede utilizar la información tal y como aparece en los gráficos para realizar la prueba de bondad de ajuste?

Solución

a. No. Tome nota que el número de ausencias previsto para la entrada “más de 12” es inferior a cinco (es dos). Combine ese grupo con el de “9-11” para crear nuevas tablas en las que el número de estudiantes de cada entrada sea de cinco como mínimo. Los nuevos resultados están en la Tabla 11.3 y la Tabla 11.4.

Número de ausencias por trimestre	Número previsto de estudiantes
0–2	50
3–5	30
6–8	12
9+	8

Tabla 11.3

Número de ausencias por trimestre	Número real de estudiantes
0–2	35
3–5	40
6–8	20
9+	5

Tabla 11.4

Translation missing: es.problem

b. ¿Cuál es el número de grados de libertad (df)?

Solución

b. Hay cuatro “celdas” o categorías en cada una de las nuevas tablas.

df = número de celdas – 1 = 4 – 1 = 3

Inténtelo 11.1

El gerente de una fábrica necesita saber cuántos productos son defectuosos frente a cuántos se producen. El número de defectos previstos figura en la Tabla 11.5.

Número producido	Número defectuoso
0–100	5
101–200	6
201–300	7
301–400	8
401–500	10

Tabla 11.5

Se tomó una muestra aleatoria para determinar el número real de defectos. La Tabla 11.6 muestra los resultados de la encuesta.

Número producido	Número defectuoso
0–100	5
101–200	7
201–300	8
301–400	9
401–500	11

Tabla 11.6

Indique las hipótesis nula y alternativa necesarias para llevar a cabo una prueba de bondad de ajuste, e indique los grados de libertad.

Ejemplo 11.2

Translation missing: es.problem

Los empleadores quieren saber qué días de la semana se ausentan los empleados en una semana laboral de cinco días. La mayoría de los empleadores quiere creer que los empleados se ausentan por igual durante la semana. Supongamos que se pregunta a una muestra aleatoria de 60 gerentes qué día de la semana tienen el mayor número de ausencias de empleados. Los resultados se distribuyeron como en la Tabla 11.7. Para la población de empleados, ¿los días de mayor número de ausencias se producen con igual frecuencia durante una semana laboral de cinco días? Pruebe con un nivel de significación del 5 %.

	Lunes	Martes	Miércoles	Jueves	Viernes
Número de ausencias	15	12	9	9	15

Tabla 11.7 Día de la semana en que los empleados estuvieron más ausentes

Solución

Las hipótesis nula y alternativa son:

H₀: Los días ausentes se producen con igual frecuencia, es decir, se ajustan a una distribución uniforme.
H_a: Los días ausentes se producen con frecuencias desiguales, es decir, no se ajustan a una distribución uniforme.

Si los días de ausencia se producen con igual frecuencia, entonces, de los 60 días de ausencia (el total de la muestra: 15 + 12 + 9 + 9 + 15 = 60), habría 12 ausencias el lunes, 12 el martes, 12 el miércoles, 12 el jueves y 12 el viernes. Estos números son los valores esperados (E). Los valores de la tabla son los valores o datos observados (O).

Esta vez, calcule el estadístico de prueba χ² a mano. Haga un cuadro con los siguientes títulos y rellene las columnas:

Valores esperados (E) (12, 12, 12, 12, 12)
Valores observados (O) (15, 12, 9, 9, 15)
(O – E)
(O – E)²
$\frac{{(O – E)}^{2}}{E}$

Ahora, añada (sume) la última columna. La suma es de tres. Se trata del estadístico de prueba χ².

Para hallar el valor p, calcule P(χ² > 3). Esta prueba es de cola derecha. (Utilice una computadora o una calculadora para hallar el valor p. Debería obtener un valor p = 0,5578)

Los dfs son el número de celdas - 1 = 5 - 1 = 4

Uso de las calculadoras TI-83, 83+, 84, 84+

Pulse 2nd DISTR. Flecha hacia abajo χ²cdf. Pulse ENTER. Enter (3,10^99,4). Redondeado a cuatro decimales, debería ver 0,5578, que es el valor p.

Luego, complete un gráfico como el siguiente con el identificado y el sombreado adecuados (debería sombrear la cola derecha).

Esta es una curva chi-cuadrado no simétrica en blanco para el estadístico de prueba de los días de la semana y las ausencias. — Figura 11.4

La decisión es no rechazar la hipótesis nula.

Conclusión: A un nivel de significación del 5 %, a partir de los datos de la muestra, no hay pruebas suficientes para concluir que los días de ausencia no se producen con igual frecuencia.

Uso de las calculadoras TI-83, 83+, 84, 84+

Las calculadoras TI-83+ y algunas TI-84 no tienen un programa especial para el estadístico de prueba para la prueba de bondad de ajuste. El Ejemplo 11.3 tiene las instrucciones de la calculadora. Las nuevas calculadoras TI-84 tienen en STAT TESTS la prueba Chi2 GOF. Para ejecutar la prueba, ponga los valores observados (los datos) en una primera lista y los valores esperados (los valores que espera si la hipótesis nula es verdadera) en una segunda lista. Pulse STAT TESTS y Chi2 GOF. Introduzca los nombres de la lista observada y de la lista esperada. Introduzca los grados de libertad y pulse calculate (calcular) o draw (dibujar). Asegúrese de borrar cualquier lista antes de empezar. Para borrar las listas en las calculadoras: Entre en STAT EDIT y pulse la flecha hacia arriba hasta el área del nombre de la lista en particular. Pulse CLEAR y luego la flecha hacia abajo. La lista se borrará. Como alternativa, puede pulsar STAT y pulsar 4 (para ClrList). Introduzca el nombre de la lista y pulse ENTER.

Inténtelo 11.2

Los maestros quieren saber qué noche de la semana sus estudiantes hacen la mayor parte de las tareas para la casa. La mayoría de los maestros piensan que los estudiantes hacen las tareas para la casa por igual a lo largo de la semana. Supongamos que se pregunta a una muestra aleatoria de 56 estudiantes en qué noche de la semana hacen más tareas para la casa. Los resultados se distribuyeron como en la Tabla 11.8.

	Domingo	Lunes	Martes	Miércoles	Jueves	Viernes	Sábado
Número de estudiantes	11	8	10	7	10	5	5

Tabla 11.8

De la población de estudiantes, ¿las noches en las que el mayor número de estudiantes hace la mayoría de sus tareas para la casa ocurren con igual frecuencia durante una semana? ¿Qué tipo de prueba de hipótesis debe utilizar?

Ejemplo 11.3

Un estudio indica que el número de televisores que tienen las familias estadounidenses se distribuye (esta es la distribución dada para la población estadounidense) como en la Tabla 11.9.

Número de televisores	Porcentaje
0	10
1	16
2	55
3	11
4+	8

Tabla 11.9

La tabla contiene los porcentajes esperados (E).

Una muestra aleatoria de 600 familias del extremo oeste de Estados Unidos dio como resultado los datos que figuran en la Tabla 11.10.

Número de televisores	Frecuencia
0	66
1	119
2	340
3	60
4+	15
	Total = 600

Tabla 11.10

La tabla contiene los valores de frecuencia observados (O).

Translation missing: es.problem

Al nivel de significación del 1 %, ¿parece que la distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución de la población estadounidense en su conjunto?

Solución

Este problema le pide que compruebe si la distribución de las familias del extremo oeste de Estados Unidos se ajusta a la distribución de las familias del resto del país. Esta prueba es siempre de cola derecha.

La primera tabla contiene los porcentajes previstos. Para obtener las frecuencias esperadas (E), multiplique el porcentaje por 600. Las frecuencias esperadas se muestran en la Tabla 11.11.

Número de televisores	Porcentaje	Frecuencia esperada
0	10	(0,10)(600) = 60
1	16	(0,16)(600) = 96
2	55	(0,55)(600) = 330
3	11	(0,11)(600) = 66
más de 3	8	(0,08)(600) = 48

Tabla 11.11

Por lo tanto, las frecuencias esperadas son 60, 96, 330, 66 y 48. En las calculadoras TI, puede dejar que estas hagan los cálculos. Por ejemplo, en lugar de 60, introduzca 0,10*600.

H₀: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es igual a la distribución del “número de televisores” de la población estadounidense.

H_a: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución del “número de televisores” de la población estadounidense.

Distribución para la prueba: $χ_{4}^{2}$ donde df = (el número de celdas) – 1 = 5 – 1 = 4.

Nota

df ≠ 600 - 1

Calcule el estadístico de prueba: χ2 = 29,65

Gráfico:

Se trata de una curva de chi-cuadrado no simétrica con valores de 0, 4 y 29,65 marcados en el eje horizontal. El valor 4 coincide con el pico de la curva. Una línea vertical ascendente se extiende desde 29,65 hasta la curva, y la región a la derecha de esta línea está sombreada. El área sombreada es igual al valor p. — Figura 11.5

Declaración de probabilidad: valor p = P(χ² > 29,65) = 0,000006

Compare α y el valor p:

α = 0,01
valor p = 0,000006

Así que, α > valor p.

Tome una decisión: Dado que α > valor p, rechace H_o.

Esto significa que usted rechaza la creencia de que la distribución para los estados del extremo oeste es igual a la de la población estadounidense en su conjunto.

Conclusión: Al nivel de significación del 1 %, a partir de los datos, hay pruebas suficientes para concluir que la distribución del “número de televisores” para el extremo oeste de Estados Unidos es diferente de la distribución del “número de televisores” para el conjunto de la población estadounidense.

Uso de las calculadoras TI-83, 83+, 84, 84+

Pulse STAT y ENTER. Borre las listas L1, L2, y L3 si tienen datos en ellas (vea la nota al final del Ejemplo 11.2). En L1, ponga las frecuencias observadas 66, 119, 340, 60, 15. En L2, ponga las frecuencias esperadas .10*600, .16*600, .55*600, .11*600, .08*600. Flecha hacia la lista L3 y hasta el área de nombres "L3". Enter (L1-L2)^2/L2 y ENTER. Pulse 2nd QUIT. Pulse 2nd LIST y flecha hacia MATH. Pulse 5. Debería ver "sum" (Introduzca L3). Redondeando a 2 decimales, debería ver 29,65. Pulse 2nd DISTR. Pulse 7 o flecha hacia abajo a 7:χ2cdf y pulse ENTER. Enter (29.65,1E99,4). Redondeado a cuatro cifras, debería ver 5.77E-6 = 0,000006 (redondeado a seis decimales), que es el valor p.

Las nuevas calculadoras TI-84 tienen en STAT TESTS la prueba Chi2 GOF. Para ejecutar la prueba, ponga los valores observados (los datos) en una primera lista y los valores esperados (los valores que espera si la hipótesis nula es verdadera) en una segunda lista. Pulse STAT TESTS y Chi2 GOF. Introduzca los nombres de la lista observada y de la lista esperada. Introduzca los grados de libertad y pulse calculate (calcular) o draw (dibujar). Asegúrese de borrar cualquier lista antes de empezar.

Inténtelo 11.3

El porcentaje esperado del número de mascotas que tienen los estudiantes en sus hogares se distribuye (es la distribución dada para la población estudiantil de Estados Unidos) como en la Tabla 11.12.

Número de mascotas	Porcentaje
0	18
1	25
2	30
3	18
4+	9

Tabla 11.12

Una muestra aleatoria de 1.000 estudiantes del este de Estados Unidos dio como resultado los datos que figuran en la Tabla 11.13.

Número de mascotas	Frecuencia
0	210
1	240
2	320
3	140
4+	90

Tabla 11.13

Al nivel de significación del 1 %, ¿parece que la distribución “número de mascotas” de los estudiantes del este de Estados Unidos es diferente de la distribución para el conjunto de la población estudiantil de Estados Unidos? ¿Cuál es el valor p?

Ejemplo 11.4

Translation missing: es.problem

Supongamos que lanza dos monedas 100 veces. Los resultados son 20 HH, 27 HT, 30 TH y 23 TT. ¿Las monedas son imparciales? Pruebe con un nivel de significación del 5 %.

Solución

Este problema se puede plantear como un problema de bondad de ajuste. El espacio muestral para lanzar dos monedas imparciales es {HH, HT, TH, TT}. De cada 100 lanzamientos, se esperan 25 HH, 25 HT, 25 TH y 25 TT. Esta es la distribución esperada. La pregunta “¿las monedas son imparciales?” es lo mismo que decir “¿la distribución de las monedas (20 HH, 27 HT, 30 TH, 23 TT) se ajusta a la distribución esperada?”.

Variable aleatoria: Supongamos que X = el número de caras en un lanzamiento de las dos monedas. X toma los valores 0, 1, 2 (hay 0, 1 o 2 caras en el lanzamiento de dos monedas). Por lo tanto, el número de celdas es tres. Como X = el número de caras, las frecuencias observadas son 20 (para dos caras), 57 (para una cara) y 23 (para cero caras o dos cruces). Las frecuencias esperadas son 25 (para dos caras), 50 (para una cara) y 25 (para cero caras o dos cruces). Esta prueba es de cola derecha.

H₀: Las monedas son imparciales.

H_a: Las monedas no son imparciales.

Distribución para la prueba: $χ_{2}^{2}$ donde df = 3 – 1 = 2.

Calcule el estadístico de prueba: χ² = 2,14

Gráfico:

Se trata de una curva de chi-cuadrado no simétrica con valores de 0 y 2,14 marcados en el eje horizontal. Una línea vertical ascendente se extiende desde 2,14 hasta la curva y la región a la derecha de esta línea está sombreada. El área sombreada es igual al valor p. — Figura 11.6

Declaración de probabilidad: valor p = P(χ² > 2,14) = 0,3430

Compare α y el valor p:

α = 0,05
valor p = 0,3430

α < valor p.

Tome una decisión: Dado que α < valor p, no se rechaza H₀.

Conclusión: No hay pruebas suficientes para concluir que las monedas no son imparciales.

Uso de las calculadoras TI-83, 83+, 84, 84+

Pulse STAT y ENTER. Borre las listas L1, L2, y L3 si tienen datos en ellas. En L1, ponga las frecuencias observadas 20, 57, 23. En L2, ponga las frecuencias esperadas 25, 50, 25. Flecha hacia la lista L3 y hasta el área de nombres "L3". Enter (L1-L2)^2/L2 y ENTER. Pulse 2nd QUIT. Pulse 2nd LIST y flecha hacia MATH. Pulse 5. Debería ver "sum".Introduzca L3. Redondeado a dos decimales, debería ver 2,14. Pulse 2nd DISTR. Flecha hacia abajo 7:χ2cdf (o pulse 7). Pulse ENTER. Enter 2,14, 1E99,2). Redondeado a cuatro cifras, debería ver 0,3430, que es el valor p.

Las nuevas calculadoras TI-84 tienen en STAT TESTS la prueba Chi2 GOF. Para ejecutar la prueba, ponga los valores observados (los datos) en una primera lista y los valores esperados (los valores que espera si la hipótesis nula es verdadera) en una segunda lista. Pulse STAT TESTS y Chi2 GOF. Introduzca los nombres de la lista observada y de la lista esperada. Introduzca los grados de libertad y pulse calculate (calcular) o draw (dibujar). Asegúrese de borrar cualquier lista antes de empezar.

Inténtelo 11.4

Los estudiantes de una clase de estudios sociales plantean la hipótesis de que las tasas de alfabetización en todo el mundo para cada región son del 82 %. La Tabla 11.14 muestra las tasas reales de alfabetización en todo el mundo desglosadas por regiones. ¿Cuáles son el estadístico de prueba y los grados de libertad?

Región de los Objetivos de Desarrollo del Milenio (ODM)	Tasa de alfabetización de adultos (%)
Regiones desarrolladas	99,0
Comunidad de Estados Independientes	99,5
Norte de África	67,3
África subsahariana	62,5
América Latina y el Caribe	91,0
Asia oriental	93,8
Asia meridional	61,9
Sudeste de Asia	91,9
Asia occidental	84,5
Oceanía	66,4

Tabla 11.14