Las pruebas de independencia implican el uso de una tabla de contingencia de valores observados (datos).
El estadístico de prueba de independencia es similar al de la prueba de bondad de ajuste:
donde:
- O = valores observados
- E = valores esperados
- i = el número de filas de la tabla
- j = el número de columnas de la tabla
Hay términos de la forma .
Una prueba de independencia determina si dos factores son independientes o no. La primera vez que se topó con el término independencia fue en Temas de probabilidad. A modo de repaso, considere el siguiente ejemplo.
Nota
El valor esperado de cada celda debe ser, al menos, cinco para poder utilizar esta prueba.
Ejemplo 11.5
Supongamos que A = una infracción por exceso de velocidad en el último año y B = un usuario de teléfono móvil mientras conduce. Si A y B son independientes, entonces P(A Y B) = P(A)P(B). A Y B es el evento en que un conductor recibió una infracción por exceso de velocidad el año pasado y también utilizaba el teléfono móvil mientras conducía. Supongamos que se encuestaron 755 personas en un estudio sobre conductores que recibieron infracciones por exceso de velocidad durante el año pasado que usaron el teléfono móvil mientras conducían. De los 755, 70 tenían una infracción por exceso de velocidad y 685 no; 305 usaba el teléfono móvil mientras conducían y 450 no.
Supongamos que y = número esperado de conductores que usaron un teléfono móvil mientras conducían y recibieron infracciones por exceso de velocidad.
Si A y B son independientes, entonces P(A Y B) = P(A)P(B). Por sustitución,
Resuelva para y: y =
Se espera que unas 28 personas de la muestra usen teléfonos móviles mientras conducen y reciban infracciones por exceso de velocidad.
En una prueba de independencia planteamos las hipótesis nula y alternativa con palabras. Dado que la tabla de contingencia consta de dos factores, la hipótesis nula afirma que los factores son independientes y la hipótesis alternativa afirma que no son independientes (dependientes). Si hacemos una prueba de independencia usando el ejemplo, entonces la hipótesis nula es:
H0: Hablar por el teléfono móvil mientras se conduce y recibir una infracción por exceso de velocidad son eventos independientes.
Si la hipótesis nula fuera cierta, esperaríamos que unas 28 personas usaran el móvil mientras conducen y recibieran una infracción por exceso de velocidad.
La prueba de independencia es siempre de cola derecha debido al cálculo del estadístico de prueba. Si los valores esperados y observados no están cerca, entonces el estadístico de prueba es muy grande y se encuentra en la cola derecha de la curva de chi-cuadrado, al igual que en una bondad de ajuste.
El número de grados de libertad para la prueba de independencia es:
df = (número de columnas – 1)(número de filas – 1)
La siguiente fórmula calcula el número esperado (E):
Inténtelo 11.5
Se toma una muestra de 300 estudiantes. De los estudiantes encuestados, 50 estudiaban música, mientras que 250 no. Un total de 97 estaban en el cuadro de honor, mientras que 203 no. Si suponemos que ser estudiante de música y estar en el cuadro de honor son hechos independientes, ¿cuál es el número esperado de estudiantes de música que también están en el cuadro de honor?
Ejemplo 11.6
En un grupo de voluntariado, los adultos de 21 años o más se ofrecen como voluntarios de una a nueve horas cada semana para pasar el tiempo con una persona mayor discapacitada. El programa recluta entre estudiantes de colegios comunitarios, estudiantes de institutos universitarios de cuatro años y no estudiantes. En la Tabla 11.15 se encuentra una muestra de los voluntarios adultos y el número de horas que ofrecen a la semana.
Tipo de voluntario | de 1 a 3 horas | de 4 a 6 horas | de 7 a 9 horas | Total de la fila |
---|---|---|---|---|
Estudiantes de colegios comunitarios | 111 | 96 | 48 | 255 |
Estudiantes de institutos universitarios de cuatro años | 96 | 133 | 61 | 290 |
No estudiantes | 91 | 150 | 53 | 294 |
Total de la columna | 298 | 379 | 162 | 839 |
Translation missing: es.problem
¿El número de horas de voluntariado es independiente del tipo de voluntario?
Solución
La tabla observada y la pregunta al final del problema: “¿El número de horas de voluntariado es independiente del tipo de voluntario?”, le indican que se trata de una prueba de independencia. Los dos factores son el número de horas de voluntariado y el tipo de voluntario. Esta prueba es siempre de cola derecha.
H0: El número de horas de voluntariado es independiente del tipo de voluntario.
Ha: El número de horas de voluntariado depende del tipo de voluntario.
Los resultados esperados están en la Tabla 11.16.
Tipo de voluntario | de 1 a 3 horas | de 4 a 6 horas | de 7 a 9 horas |
---|---|---|---|
Estudiantes de colegios comunitarios | 90,57 | 115,19 | 49,24 |
Estudiantes de institutos universitarios de cuatro años | 103,00 | 131,00 | 56,00 |
No estudiantes | 104,42 | 132,81 | 56,77 |
Por ejemplo, el cálculo de la frecuencia esperada para la celda superior izquierda es
Calcule el estadístico de prueba: χ2 = 12,99 (calculadora o computadora)
Distribución para la prueba:
df = (3 columnas – 1)(3 filas – 1) = (2)(2) = 4
Gráfico:
Declaración de probabilidad: valor p=P(χ2 > 12,99) = 0,0113
Compare α y el valor p: Ya que no se da α, suponga que α = 0,05. valor p = 0,0113. α > valor p.
Tome una decisión: Dado el valor de α > p, se rechaza H0. Esto significa que los factores no son independientes.
Conclusión: A un nivel de significación del 5 %, a partir de los datos, hay pruebas suficientes para concluir que el número de horas de voluntariado y el tipo de voluntariado dependen el uno del otro.
Para el ejemplo de la Tabla 11.15, de haber otro tipo de voluntarios, adolescentes, ¿cuáles serían los grados de libertad?
Uso de las calculadoras TI-83, 83+, 84, 84+
Pulse MATRX
y flecha hacia EDIT
. Pulse 1:[A]
. Pulse 3 ENTER 3 ENTER
. Introduzca los valores de la tabla por fila, desde la Tabla 11.15. Pulse ENTER
después de cada uno. Pulse 2nd QUIT
. Pulse STAT
y flecha hacia TESTS
. Flecha hacia abajo C:χ2-TEST
. Pulse ENTER
. Debería ver Observed:[A] y Expected:[B]
. Si es necesario, utilice las teclas de flecha para mover el cursor después de Observed: (Observado:)
y pulse 2nd MATRX
. Pulse 1:[A]
para seleccionar la matriz A. No es necesario introducir los valores esperados. La matriz que aparece después de Expected: (Previsto:)
puede estar en blanco. Flecha hacia abajo Calculate
. Pulse ENTER
. El estadístico de prueba es 12,9909 y el valor p = 0,0113. Repita el procedimiento, pero con la flecha hacia abajo a Dibujar
en vez de calcular
.
Inténtelo 11.6
La Oficina de Estadísticas Laborales recopila datos sobre empleo en Estados Unidos. Se toma una muestra para calcular el número de ciudadanos de EE. UU. que trabajan en uno de varios sectores industriales a lo largo del tiempo. La Tabla 11.17 muestra los resultados:
Sector industrial | 2000 | 2010 | 2020 | Total |
---|---|---|---|---|
Sueldos y salarios no agrícolas | 13.243 | 13.044 | 15.018 | 41.305 |
Producción de bienes, excluida la agricultura | 2.457 | 1.771 | 1.950 | 6.178 |
Prestación de servicios | 10.786 | 11.273 | 13.068 | 35.127 |
Agricultura, silvicultura, pesca y caza | 240 | 214 | 201 | 655 |
Autónomos no agrícolas y trabajadores familiares no remunerados | 931 | 894 | 972 | 2.797 |
Empleos secundarios asalariados en agricultura e industrias domésticas privadas | 14 | 11 | 11 | 36 |
Trabajos secundarios como autónomo o trabajador familiar no remunerado | 196 | 144 | 152 | 492 |
Total | 27.867 | 27.351 | 31.372 | 86.590 |
Queremos saber si el cambio en el número de empleos es independiente del cambio en los años. Indique las hipótesis nula y alternativa y los grados de libertad.
Ejemplo 11.7
El De Anza College está interesado en la relación entre el nivel de ansiedad y la necesidad de tener éxito en la escuela. Una muestra aleatoria de 400 estudiantes realizó una prueba que medía el nivel de ansiedad y la necesidad de tener éxito en la escuela. La Tabla 11.18 muestra los resultados. El De Anza College quiere saber si el nivel de ansiedad y la necesidad de tener éxito en la escuela son eventos independientes.
Necesidad de tener éxito en la escuela | Ansiedad alta |
Ansiedad media-alta |
Ansiedad media |
Ansiedad media-baja |
Ansiedad baja |
Total de la fila |
---|---|---|---|---|---|---|
Necesidad alta | 35 | 42 | 53 | 15 | 10 | 155 |
Necesidad media | 18 | 48 | 63 | 33 | 31 | 193 |
Necesidad baja | 4 | 5 | 11 | 15 | 17 | 52 |
Total de la columna | 57 | 95 | 127 | 63 | 58 | 400 |
Translation missing: es.problem
a. ¿Cuántos estudiantes con alto nivel de ansiedad se espera que tengan una alta necesidad de tener éxito en la escuela?
Solución
a. El total de la columna para un alto nivel de ansiedad es de 57. El total de filas para la alta necesidad de tener éxito en la escuela es de 155. El tamaño de la muestra o el total de encuestados es de 400.
El número esperado de estudiantes que tienen un alto nivel de ansiedad y una alta necesidad de tener éxito en la escuela es de unos 22.
Translation missing: es.problem
b. Si las dos variables son independientes, ¿cuántos estudiantes espera que tengan una baja necesidad de tener éxito en la escuela y un nivel medio-bajo de ansiedad?
Solución
b. El total de la columna para un nivel de ansiedad medio-bajo es de 63. El total de filas para una baja necesidad de éxito en la escuela es de 52. El tamaño de la muestra o el total de encuestados es de 400.
Translation missing: es.problem
c. = ________
Solución
c.
Translation missing: es.problem
d. El número esperado de estudiantes que tienen un nivel de ansiedad medio-bajo y una baja necesidad de tener éxito en la escuela es aproximadamente ________.
Solución
d. 8
Inténtelo 11.7
Consulte la información en el INTÉNTELO 11.6. ¿Cuántos puestos de trabajo en el sector de los servicios se espera que haya en 2020? ¿Cuántos empleos asalariados no relacionados con la agricultura se espera que haya en 2020?