Las pruebas de independencia implican el uso de una tabla de contingencia de valores observados (datos).
El estadístico de prueba de independencia es similar al de la prueba de bondad de ajuste:
donde:
- O = valores observados
- E = valores esperados
- i = el número de filas de la tabla
- j = el número de columnas de la tabla
Hay términos de la forma .
Una prueba de independencia determina si dos factores son independientes o no. La primera vez que vio el término independencia fue en la A modo de repaso, considere el siguiente ejemplo. A modo de repaso, considere el siguiente ejemplo.
Nota
El valor esperado dentro de cada celda debe ser, al menos, cinco para que pueda usar esta prueba.
Ejemplo 11.8
Supongamos que A = una infracción por exceso de velocidad en el último año y B = un usuario de teléfono móvil mientras conduce. Si A y B son independientes, entonces P(A B) = P(A)P(B). A B es el caso de que un conductor recibiera una infracción por exceso de velocidad el año pasado y también utilizara un teléfono móvil mientras conducía. Supongamos que se encuestaron 755 personas en un estudio sobre conductores que recibieron infracciones por exceso de velocidad durante el año pasado que usaron el teléfono móvil mientras conducían. De los 755, 70 tenían una infracción por exceso de velocidad y 685 no; 305 usaba el teléfono móvil mientras conducían y 450 no.
Supongamos que y = número esperado de conductores que usaron un teléfono móvil mientras conducían y recibieron infracciones por exceso de velocidad.
Si A y B son independientes, entonces P(A B) = P(A)P(B). Por sustitución,
Resuelva para y: y =
Se espera que unas 28 personas de la muestra usen teléfonos móviles mientras conducen y reciban infracciones por exceso de velocidad.
En una prueba de independencia planteamos las hipótesis nula y alternativa con palabras. Dado que la tabla de contingencia consta de dos factores, la hipótesis nula afirma que los factores son independientes y la hipótesis alternativa afirma que no son independientes (dependientes). Si hacemos una prueba de independencia usando el ejemplo, entonces la hipótesis nula es:
: Ser usuario de un teléfono móvil mientras se conduce y recibir una infracción por exceso de velocidad son hechos independientes; en otras palabras, no tienen ningún efecto entre sí.
Si la hipótesis nula fuera cierta, esperaríamos que unas 28 personas usaran el móvil mientras conducen y recibieran una infracción por exceso de velocidad.
La prueba de independencia es siempre de cola derecha debido al cálculo del estadístico de prueba. Si los valores esperados y observados no están cerca, entonces el estadístico de prueba es muy grande y se encuentra en la cola derecha de la curva de chi-cuadrado, al igual que en una bondad de ajuste.
El número de grados de libertad para la prueba de independencia es:
df = (número de columnas – 1)(número de filas – 1)
La siguiente fórmula calcula el número esperado (E):
Inténtelo 11.8
Se toma una muestra de 300 estudiantes. De los estudiantes encuestados, 50 estudiaban música, mientras que 250 no. Noventa y siete de los 300 encuestados estaban en el cuadro de honor, mientras que 203 no estaban. Si suponemos que ser estudiante de música y estar en el cuadro de honor son hechos independientes, ¿cuál es el número esperado de estudiantes de música que también están en el cuadro de honor?
Ejemplo 11.9
Un grupo de voluntarios dedica de una a nueve horas cada semana a personas mayores con discapacidades. El programa recluta entre estudiantes de colegios comunitarios, estudiantes de institutos universitarios de cuatro años y no estudiantes. En la Tabla 11.14 se encuentra una muestra de los voluntarios adultos y el número de horas que ofrecen a la semana.
Tipo de voluntario | de 1 a 3 horas | de 4 a 6 horas | de 7 a 9 horas | Total de la fila |
---|---|---|---|---|
Estudiantes de colegios comunitarios | 111 | 96 | 48 | 255 |
Estudiantes de institutos universitarios de cuatro años | 96 | 133 | 61 | 290 |
No estudiantes | 91 | 150 | 53 | 294 |
Total de la columna | 298 | 379 | 162 | 839 |
Translation missing: es.problem
¿El número de horas de voluntariado es independiente del tipo de voluntario?
Solución
La tabla observada y la pregunta al final del problema: “¿El número de horas de voluntariado es independiente del tipo de voluntario?”, le indican que se trata de una prueba de independencia. Los dos factores son el número de horas de voluntariado y el tipo de voluntario. Esta prueba es siempre de cola derecha.
H0: El número de horas de voluntariado es independiente del tipo de voluntario.
Ha: El número de horas de voluntariado depende del tipo de voluntario.
Los resultados esperados están en la Tabla 11.15.
Tipo de voluntario | de 1 a 3 horas | de 4 a 6 horas | de 7 a 9 horas |
---|---|---|---|
Estudiantes de colegios comunitarios | 90,57 | 115,19 | 49,24 |
Estudiantes de institutos universitarios de cuatro años | 103,00 | 131,00 | 56,00 |
No estudiantes | 104,42 | 132,81 | 56,77 |
Por ejemplo, el cálculo de la frecuencia esperada para la celda superior izquierda es
Calcule el estadístico de prueba: χ2 = 12,99 (calculadora o computadora)
Distribución para la prueba:
df = (3 columnas – 1)(3 filas – 1) = (2)(2) = 4
Gráfico:
El gráfico de chi-cuadrado muestra la distribución y marca el valor crítico con cuatro grados de libertad a un nivel de confianza del 95 %, α = 0,05; 9,488. El gráfico también marca el valor calculado del estadístico de prueba de 12,99. Al comparar el estadístico de prueba con el valor crítico, como hemos hecho con todas las demás pruebas de hipótesis, llegamos a la conclusión.
Tome una decisión: Como el estadístico de prueba calculado está en la cola, no podemos aceptar H0. Esto significa que los factores no son independientes.
Conclusión: A un nivel de significación del 5 %, a partir de los datos, hay pruebas suficientes para concluir que el número de horas de voluntariado y el tipo de voluntariado dependen el uno del otro.
Para el ejemplo de la Tabla 11.15, de haber otro tipo de voluntarios, adolescentes, ¿cuáles serían los grados de libertad?
Inténtelo 11.9
La Oficina de Estadísticas Laborales recopila datos sobre empleo en Estados Unidos. Se toma una muestra para calcular el número de ciudadanos de EE. UU. que trabajan en uno de varios sectores industriales a lo largo del tiempo. La Tabla 11.16 muestra los resultados:
Sector industrial | 2000 | 2010 | 2020 | Total |
---|---|---|---|---|
Sueldos y salarios no agrícolas | 13.243 | 13.044 | 15.018 | 41.305 |
Producción de bienes, excluida la agricultura | 2.457 | 1.771 | 1.950 | 6.178 |
Prestación de servicios | 10.786 | 11.273 | 13.068 | 35.127 |
Agricultura, silvicultura, pesca y caza | 240 | 214 | 201 | 655 |
Autónomos no agrícolas y trabajadores familiares no remunerados | 931 | 894 | 972 | 2.797 |
Empleos secundarios asalariados en agricultura e industrias domésticas privadas | 14 | 11 | 11 | 36 |
Trabajos secundarios como autónomo o trabajador familiar no remunerado | 196 | 144 | 152 | 492 |
Total | 27.867 | 27.351 | 31.372 | 86.590 |
Queremos saber si el cambio en el número de empleos es independiente del cambio en los años. Indique las hipótesis nula y alternativa y los grados de libertad.
Ejemplo 11.10
El De Anza College está interesado en la relación entre el nivel de ansiedad y la necesidad de tener éxito en la escuela. Una muestra aleatoria de 400 estudiantes realizó una prueba que medía el nivel de ansiedad y la necesidad de tener éxito en la escuela. La Tabla 11.17 muestra los resultados. El De Anza College quiere saber si el nivel de ansiedad y la necesidad de tener éxito en la escuela son eventos independientes.
Necesidad de tener éxito en la escuela | Ansiedad alta |
Ansiedad media alta |
Ansiedad media |
Ansiedad media baja |
Ansiedad baja |
Total de la fila |
---|---|---|---|---|---|---|
Necesidad alta | 35 | 42 | 53 | 15 | 10 | 155 |
Necesidad media | 18 | 48 | 63 | 33 | 31 | 193 |
Necesidad baja | 4 | 5 | 11 | 15 | 17 | 52 |
Total de la columna | 57 | 95 | 127 | 63 | 58 | 400 |
Translation missing: es.problem
a. ¿Cuántos estudiantes con alto nivel de ansiedad se espera que tengan una alta necesidad de tener éxito en la escuela?
Solución
a. El total de la columna para un alto nivel de ansiedad es de 57. El total de filas para la alta necesidad de tener éxito en la escuela es de 155. El tamaño de la muestra o el total de encuestados es de 400.
El número esperado de estudiantes que tienen un alto nivel de ansiedad y una alta necesidad de tener éxito en la escuela es de unos 22.
Translation missing: es.problem
b. Si las dos variables son independientes, ¿cuántos estudiantes espera que tengan una baja necesidad de tener éxito en la escuela y un nivel medio-bajo de ansiedad?
Solución
b. El total de la columna para un nivel de ansiedad medio-bajo es de 63. El total de filas para una baja necesidad de éxito en la escuela es de 52. El tamaño de la muestra o el total de encuestados es de 400.
Translation missing: es.problem
c. = ________
Solución
c.
Translation missing: es.problem
d. El número esperado de estudiantes que tienen un nivel de ansiedad medio-bajo y una baja necesidad de tener éxito en la escuela es aproximadamente ________.
Solución
d. 8