En este tipo de prueba de hipótesis se determina si los datos “se ajustan” a una determinada distribución o no. Por ejemplo, puede sospechar que sus datos desconocidos se ajustan a una distribución binomial. Se utiliza una prueba de chi-cuadrado (lo que significa que la distribución para la prueba de hipótesis es chi-cuadrado) para determinar si hay un ajuste o no. Las hipótesis nula y alternativa de esta prueba se pueden escribir en oraciones o plantear como ecuaciones o desigualdades.
El estadístico de prueba para una prueba de bondad de ajuste es:
donde:
- O = valores observados (datos)
- E = valores esperados (de la teoría)
- k = el número de celdas o categorías de datos diferentes
Los valores observados son los valores de los datos y los valores esperados son los valores que se esperarían obtener si la hipótesis nula fuera cierta. Hay n términos de la forma .
El número de grados de libertad es df = (número de categorías – 1).
La prueba de bondad de ajuste es casi siempre de cola derecha. Si los valores observados y los correspondientes valores esperados no se aproximan entre sí, el estadístico de prueba puede ser muy grande y se situará en la cola derecha de la curva de chi-cuadrado.
Nota
El valor esperado de cada celda debe ser, al menos, cinco para poder utilizar esta prueba.
Ejemplo 11.1
El ausentismo de los estudiantes universitarios a las clases de Matemáticas es una de las principales preocupaciones de los instructores de Matemáticas, ya que ausentarse de clase parece aumentar la tasa de abandono. Supongamos que se realiza un estudio para determinar si la tasa real de ausentismo de los estudiantes sigue la percepción del profesorado. El profesorado esperaba que un grupo de 100 estudiantes se ausentara de clase según se indica en la Tabla 11.1.
Número de ausencias por trimestre | Número previsto de estudiantes |
---|---|
0–2 | 50 |
3–5 | 30 |
6–8 | 12 |
9–11 | 6 |
12+ | 2 |
Luego, se realizó una encuesta aleatoria en todos los cursos de Matemáticas para determinar el número real (observado) de ausencias en un curso. El gráfico de la Tabla 11.2 muestra los resultados de esa encuesta.
Número de ausencias por trimestre | Número real de estudiantes |
---|---|
0–2 | 35 |
3–5 | 40 |
6–8 | 20 |
9–11 | 1 |
12+ | 4 |
Determine las hipótesis nula y alternativa necesarias para realizar una prueba de bondad de ajuste.
H0: El ausentismo de los estudiantes se ajusta a la percepción del profesorado.
La hipótesis alternativa es la opuesta a la hipótesis nula.
Ha: El ausentismo de los estudiantes no se ajusta a la percepción del profesorado.
Translation missing: es.problem
a. ¿Puede utilizar la información tal y como aparece en los gráficos para realizar la prueba de bondad de ajuste?
Solución
a. No. Tome nota que el número de ausencias previsto para la entrada “más de 12” es inferior a cinco (es dos). Combine ese grupo con el de “9-11” para crear nuevas tablas en las que el número de estudiantes de cada entrada sea de cinco como mínimo. Los nuevos resultados están en la Tabla 11.3 y la Tabla 11.4.
Número de ausencias por trimestre | Número previsto de estudiantes |
---|---|
0–2 | 50 |
3–5 | 30 |
6–8 | 12 |
9+ | 8 |
Número de ausencias por trimestre | Número real de estudiantes |
---|---|
0–2 | 35 |
3–5 | 40 |
6–8 | 20 |
9+ | 5 |
Translation missing: es.problem
b. ¿Cuál es el número de grados de libertad (df)?
Solución
b. Hay cuatro “celdas” o categorías en cada una de las nuevas tablas.
df = número de celdas – 1 = 4 – 1 = 3
Inténtelo 11.1
El gerente de una fábrica necesita saber cuántos productos son defectuosos frente a cuántos se producen. El número de defectos previstos figura en la Tabla 11.5.
Número producido | Número defectuoso |
---|---|
0–100 | 5 |
101–200 | 6 |
201–300 | 7 |
301–400 | 8 |
401–500 | 10 |
Se tomó una muestra aleatoria para determinar el número real de defectos. La Tabla 11.6 muestra los resultados de la encuesta.
Número producido | Número defectuoso |
---|---|
0–100 | 5 |
101–200 | 7 |
201–300 | 8 |
301–400 | 9 |
401–500 | 11 |
Indique las hipótesis nula y alternativa necesarias para llevar a cabo una prueba de bondad de ajuste, e indique los grados de libertad.
Ejemplo 11.2
Translation missing: es.problem
Los empleadores quieren saber qué días de la semana se ausentan los empleados en una semana laboral de cinco días. La mayoría de los empleadores quiere creer que los empleados se ausentan por igual durante la semana. Supongamos que se pregunta a una muestra aleatoria de 60 gerentes qué día de la semana tienen el mayor número de ausencias de empleados. Los resultados se distribuyeron como en la Tabla 11.7. Para la población de empleados, ¿los días de mayor número de ausencias se producen con igual frecuencia durante una semana laboral de cinco días? Pruebe con un nivel de significación del 5 %.
Lunes | Martes | Miércoles | Jueves | Viernes | |
---|---|---|---|---|---|
Número de ausencias | 15 | 12 | 9 | 9 | 15 |
Solución
Las hipótesis nula y alternativa son:
- H0: Los días ausentes se producen con igual frecuencia, es decir, se ajustan a una distribución uniforme.
- Ha: Los días ausentes se producen con frecuencias desiguales, es decir, no se ajustan a una distribución uniforme.
Si los días de ausencia se producen con igual frecuencia, entonces, de los 60 días de ausencia (el total de la muestra: 15 + 12 + 9 + 9 + 15 = 60), habría 12 ausencias el lunes, 12 el martes, 12 el miércoles, 12 el jueves y 12 el viernes. Estos números son los valores esperados (E). Los valores de la tabla son los valores o datos observados (O).
Esta vez, calcule el estadístico de prueba χ2 a mano. Haga un cuadro con los siguientes títulos y rellene las columnas:
- Valores esperados (E) (12, 12, 12, 12, 12)
- Valores observados (O) (15, 12, 9, 9, 15)
- (O – E)
- (O – E)2
Ahora, añada (sume) la última columna. La suma es de tres. Se trata del estadístico de prueba χ2.
Para hallar el valor p, calcule P(χ2 > 3). Esta prueba es de cola derecha. (Utilice una computadora o una calculadora para hallar el valor p. Debería obtener un valor p = 0,5578)
Los dfs son el número de celdas - 1 = 5 - 1 = 4
Uso de las calculadoras TI-83, 83+, 84, 84+
Pulse 2nd DISTR
. Flecha hacia abajo χ2cdf
. Pulse ENTER
. Enter (3,10^99,4)
. Redondeado a cuatro decimales, debería ver 0,5578, que es el valor p.
Luego, complete un gráfico como el siguiente con el identificado y el sombreado adecuados (debería sombrear la cola derecha).
La decisión es no rechazar la hipótesis nula.
Conclusión: A un nivel de significación del 5 %, a partir de los datos de la muestra, no hay pruebas suficientes para concluir que los días de ausencia no se producen con igual frecuencia.
Uso de las calculadoras TI-83, 83+, 84, 84+
Las calculadoras TI-83+ y algunas TI-84 no tienen un programa especial para el estadístico de prueba para la prueba de bondad de ajuste. El Ejemplo 11.3 tiene las instrucciones de la calculadora. Las nuevas calculadoras TI-84 tienen en STAT TESTS
la prueba Chi2 GOF
. Para ejecutar la prueba, ponga los valores observados (los datos) en una primera lista y los valores esperados (los valores que espera si la hipótesis nula es verdadera) en una segunda lista. Pulse STAT TESTS
y Chi2 GOF
. Introduzca los nombres de la lista observada y de la lista esperada. Introduzca los grados de libertad y pulse calculate (calcular)
o draw (dibujar)
. Asegúrese de borrar cualquier lista antes de empezar. Para borrar las listas en las calculadoras: Entre en STAT EDIT
y pulse la flecha hacia arriba hasta el área del nombre de la lista en particular. Pulse CLEAR
y luego la flecha hacia abajo. La lista se borrará. Como alternativa, puede pulsar STAT
y pulsar 4 (para ClrList
). Introduzca el nombre de la lista y pulse ENTER
.
Inténtelo 11.2
Los maestros quieren saber qué noche de la semana sus estudiantes hacen la mayor parte de las tareas para la casa. La mayoría de los maestros piensan que los estudiantes hacen las tareas para la casa por igual a lo largo de la semana. Supongamos que se pregunta a una muestra aleatoria de 56 estudiantes en qué noche de la semana hacen más tareas para la casa. Los resultados se distribuyeron como en la Tabla 11.8.
Domingo | Lunes | Martes | Miércoles | Jueves | Viernes | Sábado | |
---|---|---|---|---|---|---|---|
Número de estudiantes | 11 | 8 | 10 | 7 | 10 | 5 | 5 |
De la población de estudiantes, ¿las noches en las que el mayor número de estudiantes hace la mayoría de sus tareas para la casa ocurren con igual frecuencia durante una semana? ¿Qué tipo de prueba de hipótesis debe utilizar?
Ejemplo 11.3
Un estudio indica que el número de televisores que tienen las familias estadounidenses se distribuye (esta es la distribución dada para la población estadounidense) como en la Tabla 11.9.
Número de televisores | Porcentaje |
---|---|
0 | 10 |
1 | 16 |
2 | 55 |
3 | 11 |
4+ | 8 |
La tabla contiene los porcentajes esperados (E).
Una muestra aleatoria de 600 familias del extremo oeste de Estados Unidos dio como resultado los datos que figuran en la Tabla 11.10.
Número de televisores | Frecuencia |
---|---|
0 | 66 |
1 | 119 |
2 | 340 |
3 | 60 |
4+ | 15 |
Total = 600 |
La tabla contiene los valores de frecuencia observados (O).
Translation missing: es.problem
Al nivel de significación del 1 %, ¿parece que la distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución de la población estadounidense en su conjunto?
Solución
Este problema le pide que compruebe si la distribución de las familias del extremo oeste de Estados Unidos se ajusta a la distribución de las familias del resto del país. Esta prueba es siempre de cola derecha.
La primera tabla contiene los porcentajes previstos. Para obtener las frecuencias esperadas (E), multiplique el porcentaje por 600. Las frecuencias esperadas se muestran en la Tabla 11.11.
Número de televisores | Porcentaje | Frecuencia esperada |
---|---|---|
0 | 10 | (0,10)(600) = 60 |
1 | 16 | (0,16)(600) = 96 |
2 | 55 | (0,55)(600) = 330 |
3 | 11 | (0,11)(600) = 66 |
más de 3 | 8 | (0,08)(600) = 48 |
Por lo tanto, las frecuencias esperadas son 60, 96, 330, 66 y 48. En las calculadoras TI, puede dejar que estas hagan los cálculos. Por ejemplo, en lugar de 60, introduzca 0,10*600.
H0: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es igual a la distribución del “número de televisores” de la población estadounidense.
Ha: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución del “número de televisores” de la población estadounidense.
Distribución para la prueba: donde df = (el número de celdas) – 1 = 5 – 1 = 4.
Nota
df ≠ 600 - 1
Calcule el estadístico de prueba: χ2 = 29,65
Gráfico:
Declaración de probabilidad: valor p = P(χ2 > 29,65) = 0,000006
Compare α y el valor p:
- α = 0,01
- valor p = 0,000006
Así que, α > valor p.
Tome una decisión: Dado que α > valor p, rechace Ho.
Esto significa que usted rechaza la creencia de que la distribución para los estados del extremo oeste es igual a la de la población estadounidense en su conjunto.
Conclusión: Al nivel de significación del 1 %, a partir de los datos, hay pruebas suficientes para concluir que la distribución del “número de televisores” para el extremo oeste de Estados Unidos es diferente de la distribución del “número de televisores” para el conjunto de la población estadounidense.
Uso de las calculadoras TI-83, 83+, 84, 84+
Pulse STAT
y ENTER
. Borre las listas L1
, L2
, y L3
si tienen datos en ellas (vea la nota al final del Ejemplo 11.2). En L1
, ponga las frecuencias observadas 66
, 119
, 340
, 60
, 15
. En L2
, ponga las frecuencias esperadas .10*600, .16*600
, .55*600
, .11*600
, .08*600
. Flecha hacia la lista L3
y hasta el área de nombres "L3"
. Enter (L1-L2)^2/L2
y ENTER
. Pulse 2nd QUIT
. Pulse 2nd LIST
y flecha hacia MATH
. Pulse 5
. Debería ver "sum" (Introduzca L3)
. Redondeando a 2 decimales, debería ver 29,65
. Pulse 2nd DISTR
. Pulse 7
o flecha hacia abajo a 7:χ2cdf
y pulse ENTER
. Enter (29.65,1E99,4)
. Redondeado a cuatro cifras, debería ver 5.77E-6 = 0,000006
(redondeado a seis decimales), que es el valor p.
Las nuevas calculadoras TI-84 tienen en STAT TESTS
la prueba Chi2 GOF
. Para ejecutar la prueba, ponga los valores observados (los datos) en una primera lista y los valores esperados (los valores que espera si la hipótesis nula es verdadera) en una segunda lista. Pulse STAT TESTS
y Chi2 GOF
. Introduzca los nombres de la lista observada y de la lista esperada. Introduzca los grados de libertad y pulse calculate (calcular)
o draw (dibujar)
. Asegúrese de borrar cualquier lista antes de empezar.
Inténtelo 11.3
El porcentaje esperado del número de mascotas que tienen los estudiantes en sus hogares se distribuye (es la distribución dada para la población estudiantil de Estados Unidos) como en la Tabla 11.12.
Número de mascotas | Porcentaje |
---|---|
0 | 18 |
1 | 25 |
2 | 30 |
3 | 18 |
4+ | 9 |
Una muestra aleatoria de 1.000 estudiantes del este de Estados Unidos dio como resultado los datos que figuran en la Tabla 11.13.
Número de mascotas | Frecuencia |
---|---|
0 | 210 |
1 | 240 |
2 | 320 |
3 | 140 |
4+ | 90 |
Al nivel de significación del 1 %, ¿parece que la distribución “número de mascotas” de los estudiantes del este de Estados Unidos es diferente de la distribución para el conjunto de la población estudiantil de Estados Unidos? ¿Cuál es el valor p?
Ejemplo 11.4
Translation missing: es.problem
Supongamos que lanza dos monedas 100 veces. Los resultados son 20 HH, 27 HT, 30 TH y 23 TT. ¿Las monedas son imparciales? Pruebe con un nivel de significación del 5 %.
Solución
Este problema se puede plantear como un problema de bondad de ajuste. El espacio muestral para lanzar dos monedas imparciales es {HH, HT, TH, TT}. De cada 100 lanzamientos, se esperan 25 HH, 25 HT, 25 TH y 25 TT. Esta es la distribución esperada. La pregunta “¿las monedas son imparciales?” es lo mismo que decir “¿la distribución de las monedas (20 HH, 27 HT, 30 TH, 23 TT) se ajusta a la distribución esperada?”.
Variable aleatoria: Supongamos que X = el número de caras en un lanzamiento de las dos monedas. X toma los valores 0, 1, 2 (hay 0, 1 o 2 caras en el lanzamiento de dos monedas). Por lo tanto, el número de celdas es tres. Como X = el número de caras, las frecuencias observadas son 20 (para dos caras), 57 (para una cara) y 23 (para cero caras o dos cruces). Las frecuencias esperadas son 25 (para dos caras), 50 (para una cara) y 25 (para cero caras o dos cruces). Esta prueba es de cola derecha.
H0: Las monedas son imparciales.
Ha: Las monedas no son imparciales.
Distribución para la prueba: donde df = 3 – 1 = 2.
Calcule el estadístico de prueba: χ2 = 2,14
Gráfico:
Declaración de probabilidad: valor p = P(χ2 > 2,14) = 0,3430
Compare α y el valor p:
- α = 0,05
- valor p = 0,3430
α < valor p.
Tome una decisión: Dado que α < valor p, no se rechaza H0.
Conclusión: No hay pruebas suficientes para concluir que las monedas no son imparciales.
Uso de las calculadoras TI-83, 83+, 84, 84+
Pulse STAT
y ENTER
. Borre las listas L1
, L2
, y L3
si tienen datos en ellas. En L1
, ponga las frecuencias observadas 20
, 57
, 23
. En L2
, ponga las frecuencias esperadas 25
, 50
, 25
. Flecha hacia la lista L3
y hasta el área de nombres "L3"
. Enter (L1-L2)^2/L2
y
ENTER
. Pulse 2nd QUIT
. Pulse 2nd LIST
y flecha hacia MATH
. Pulse
5
. Debería ver "sum"
.Introduzca L3
. Redondeado a dos decimales, debería ver 2,14
. Pulse 2nd DISTR
. Flecha hacia abajo 7:χ2cdf
(o pulse 7
). Pulse
ENTER
. Enter 2,14, 1E99,2)
. Redondeado a cuatro cifras, debería ver 0,3430
, que es el valor p.
Las nuevas calculadoras TI-84 tienen en STAT TESTS
la prueba Chi2 GOF
. Para ejecutar la prueba, ponga los valores observados (los datos) en una primera lista y los valores esperados (los valores que espera si la hipótesis nula es verdadera) en una segunda lista. Pulse STAT TESTS
y Chi2 GOF
. Introduzca los nombres de la lista observada y de la lista esperada. Introduzca los grados de libertad y pulse calculate (calcular)
o draw (dibujar)
. Asegúrese de borrar cualquier lista antes de empezar.
Inténtelo 11.4
Los estudiantes de una clase de estudios sociales plantean la hipótesis de que las tasas de alfabetización en todo el mundo para cada región son del 82 %. La Tabla 11.14 muestra las tasas reales de alfabetización en todo el mundo desglosadas por regiones. ¿Cuáles son el estadístico de prueba y los grados de libertad?
Región de los Objetivos de Desarrollo del Milenio (ODM) | Tasa de alfabetización de adultos (%) |
---|---|
Regiones desarrolladas | 99,0 |
Comunidad de Estados Independientes | 99,5 |
Norte de África | 67,3 |
África subsahariana | 62,5 |
América Latina y el Caribe | 91,0 |
Asia oriental | 93,8 |
Asia meridional | 61,9 |
Sudeste de Asia | 91,9 |
Asia occidental | 84,5 |
Oceanía | 66,4 |