Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

11.3 Prueba de independencia

Introducción a la estadística11.3 Prueba de independencia

Menú
Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Frecuencia, tablas de frecuencia y niveles de medición
    5. 1.4 Diseño experimental y ética
    6. 1.5 Experimento de recopilación de datos
    7. 1.6 Experimento de muestreo
    8. Términos clave
    9. Repaso del capítulo
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
    3. 2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
    4. 2.3 Medidas de la ubicación de los datos
    5. 2.4 Diagramas de caja
    6. 2.5 Medidas del centro de los datos
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. 2.8 Estadística descriptiva
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia
    6. 3.5 Diagramas de árbol y de Venn
    7. 3.6 Temas de probabilidad
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Uniéndolo todo: Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
    3. 4.2 Media o valor esperado y desviación típica
    4. 4.3 Distribución binomial
    5. 4.4 Distribución geométrica
    6. 4.5 Distribución hipergeométrica
    7. 4.6 Distribución de Poisson
    8. 4.7 Distribución discreta (experimento con cartas)
    9. 4.8 Distribución discreta (experimento de los dados de la suerte)
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Referencias
    16. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Funciones de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. 5.4 Distribución continua
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Distribución normal (tiempos de vuelta)
    5. 6.4 Distribución normal (longitud del meñique)
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de medias muestrales (promedios)
    3. 7.2 El teorema del límite central para las sumas
    4. 7.3 Uso del teorema del límite central
    5. 7.4 Teorema del límite central (monedas en el bolsillo)
    6. 7.5 Teorema del límite central (recetas de galletas)
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 La media de una población utilizando la distribución normal
    3. 8.2 La media de una población utilizando la distribución t de Student
    4. 8.3 Una proporción de la población
    5. 8.4 Intervalo de confianza (costos de hogares)
    6. 8.5 Intervalo de confianza (lugar de nacimiento)
    7. 8.6 Intervalo de confianza (altura de las mujeres)
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Eventos poco comunes, la muestra, decisión y conclusión
    6. 9.5 Información adicional y ejemplos de pruebas de hipótesis completas
    7. 9.6 Pruebas de hipótesis de una sola media y una sola proporción
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Medias de dos poblaciones con desviaciones típicas desconocidas
    3. 10.2 Dos medias poblacionales con desviaciones típicas conocidas
    4. 10.3 Comparación de dos proporciones de población independientes
    5. 10.4 Muestras coincidentes o emparejadas
    6. 10.5 Prueba de hipótesis para dos medias y dos proporciones
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de bondad de ajuste
    4. 11.3 Prueba de independencia
    5. 11.4 Prueba de homogeneidad
    6. 11.5 Comparación de las pruebas chi-cuadrado
    7. 11.6 Prueba de una sola varianza
    8. 11.7 Laboratorio 1: Bondad de ajuste de chi-cuadrado
    9. 11.8 Laboratorio 2: prueba de independencia de chi-cuadrado
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  13. 12 Regresión lineal y correlación
    1. Introducción
    2. 12.1 Ecuaciones lineales
    3. 12.2 Diagramas de dispersión
    4. 12.3 La ecuación de regresión
    5. 12.4 Comprobación de la importancia del coeficiente de correlación
    6. 12.5 Predicción
    7. 12.6 Valores atípicos
    8. 12.7 Regresión (distancia desde la escuela)
    9. 12.8 Regresión (costo de los libros de texto)
    10. 12.9 Regresión (eficiencia del combustible)
    11. Términos clave
    12. Repaso del capítulo
    13. Repaso de fórmulas
    14. Práctica
    15. Tarea para la casa
    16. Resúmalo todo: tarea para la casa
    17. Referencias
    18. Soluciones
  14. 13 Distribución F y análisis de varianza anova de una vía
    1. Introducción
    2. 13.1 ANOVA de una vía
    3. 13.2 La distribución F y el cociente F
    4. 13.3 Datos sobre la distribución F
    5. 13.4 Prueba de dos varianzas
    6. 13.5 Laboratorio: ANOVA de una vía
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  15. A Ejercicios de repaso (caps. 3-13)
  16. B Pruebas prácticas (de la 1 a la 4) y exámenes finales
  17. C Conjuntos de datos
  18. D Proyectos de grupos y asociaciones
  19. E Hojas de soluciones
  20. F Oraciones, símbolos y fórmulas matemáticas
  21. G Notas para las calculadoras TI-83, 83+, 84 y 84+
  22. H Tablas
  23. Índice

Las pruebas de independencia implican el uso de una tabla de contingencia de valores observados (datos).

El estadístico de prueba de independencia es similar al de la prueba de bondad de ajuste:

Σ (ij) (OE) 2 E Σ (ij) (OE) 2 E

donde:

  • O = valores observados
  • E = valores esperados
  • i = el número de filas de la tabla
  • j = el número de columnas de la tabla

Hay ijij términos de la forma (OE) 2 E (OE) 2 E .

Una prueba de independencia determina si dos factores son independientes o no. La primera vez que se topó con el término independencia fue en Temas de probabilidad. A modo de repaso, considere el siguiente ejemplo.

Nota

El valor esperado de cada celda debe ser, al menos, cinco para poder utilizar esta prueba.

Ejemplo 11.5

Supongamos que A = una infracción por exceso de velocidad en el último año y B = un usuario de teléfono móvil mientras conduce. Si A y B son independientes, entonces P(A Y B) = P(A)P(B). A Y B es el evento en que un conductor recibió una infracción por exceso de velocidad el año pasado y también utilizaba el teléfono móvil mientras conducía. Supongamos que se encuestaron 755 personas en un estudio sobre conductores que recibieron infracciones por exceso de velocidad durante el año pasado que usaron el teléfono móvil mientras conducían. De los 755, 70 tenían una infracción por exceso de velocidad y 685 no; 305 usaba el teléfono móvil mientras conducían y 450 no.

Supongamos que y = número esperado de conductores que usaron un teléfono móvil mientras conducían y recibieron infracciones por exceso de velocidad.

Si A y B son independientes, entonces P(A Y B) = P(A)P(B). Por sustitución,

y 755 =( 70 755 )( 305 755 ) y 755 =( 70 755 )( 305 755 )

Resuelva para y: y = (70)(305) 755 =28,3 (70)(305) 755 =28,3

Se espera que unas 28 personas de la muestra usen teléfonos móviles mientras conducen y reciban infracciones por exceso de velocidad.

En una prueba de independencia planteamos las hipótesis nula y alternativa con palabras. Dado que la tabla de contingencia consta de dos factores, la hipótesis nula afirma que los factores son independientes y la hipótesis alternativa afirma que no son independientes (dependientes). Si hacemos una prueba de independencia usando el ejemplo, entonces la hipótesis nula es:

H0: Hablar por el teléfono móvil mientras se conduce y recibir una infracción por exceso de velocidad son eventos independientes.

Si la hipótesis nula fuera cierta, esperaríamos que unas 28 personas usaran el móvil mientras conducen y recibieran una infracción por exceso de velocidad.

La prueba de independencia es siempre de cola derecha debido al cálculo del estadístico de prueba. Si los valores esperados y observados no están cerca, entonces el estadístico de prueba es muy grande y se encuentra en la cola derecha de la curva de chi-cuadrado, al igual que en una bondad de ajuste.

El número de grados de libertad para la prueba de independencia es:

df = (número de columnas – 1)(número de filas – 1)

La siguiente fórmula calcula el número esperado (E):

E=(total de filas)(total de columnas)número total de encuestadosE=(total de filas)(total de columnas)número total de encuestados

Inténtelo 11.5

Se toma una muestra de 300 estudiantes. De los estudiantes encuestados, 50 estudiaban música, mientras que 250 no. Un total de 97 estaban en el cuadro de honor, mientras que 203 no. Si suponemos que ser estudiante de música y estar en el cuadro de honor son hechos independientes, ¿cuál es el número esperado de estudiantes de música que también están en el cuadro de honor?

Ejemplo 11.6

En un grupo de voluntariado, los adultos de 21 años o más se ofrecen como voluntarios de una a nueve horas cada semana para pasar el tiempo con una persona mayor discapacitada. El programa recluta entre estudiantes de colegios comunitarios, estudiantes de institutos universitarios de cuatro años y no estudiantes. En la Tabla 11.15 se encuentra una muestra de los voluntarios adultos y el número de horas que ofrecen a la semana.

Tipo de voluntario de 1 a 3 horas de 4 a 6 horas de 7 a 9 horas Total de la fila
Estudiantes de colegios comunitarios 111 96 48 255
Estudiantes de institutos universitarios de cuatro años 96 133 61 290
No estudiantes 91 150 53 294
Total de la columna 298 379 162 839
Tabla 11.15 Número de horas trabajadas por semana por tipo de voluntario (observado). La tabla contiene valores (datos) observados (O).

translation missing: es.problem

¿El número de horas de voluntariado es independiente del tipo de voluntario?

Inténtelo 11.6

La Oficina de Estadísticas Laborales recopila datos sobre empleo en Estados Unidos. Se toma una muestra para calcular el número de ciudadanos de EE. UU. que trabajan en uno de varios sectores industriales a lo largo del tiempo. La Tabla 11.17 muestra los resultados:

Sector industrial 2000 2010 2020 Total
Sueldos y salarios no agrícolas 13.243 13.044 15.018 41.305
Producción de bienes, excluida la agricultura 2.457 1.771 1.950 6.178
Prestación de servicios 10.786 11.273 13.068 35.127
Agricultura, silvicultura, pesca y caza 240 214 201 655
Autónomos no agrícolas y trabajadores familiares no remunerados 931 894 972 2.797
Empleos secundarios asalariados en agricultura e industrias domésticas privadas 14 11 11 36
Trabajos secundarios como autónomo o trabajador familiar no remunerado 196 144 152 492
Total 27.867 27.351 31.372 86.590
Tabla 11.17

Queremos saber si el cambio en el número de empleos es independiente del cambio en los años. Indique las hipótesis nula y alternativa y los grados de libertad.

Ejemplo 11.7

El De Anza College está interesado en la relación entre el nivel de ansiedad y la necesidad de tener éxito en la escuela. Una muestra aleatoria de 400 estudiantes realizó una prueba que medía el nivel de ansiedad y la necesidad de tener éxito en la escuela. La Tabla 11.18 muestra los resultados. El De Anza College quiere saber si el nivel de ansiedad y la necesidad de tener éxito en la escuela son eventos independientes.

Necesidad de tener éxito en la escuela Ansiedad
alta
Ansiedad
media-alta
Ansiedad
media
Ansiedad
media-baja
Ansiedad
baja
Total de la fila
Necesidad alta 35 42 53 15 10 155
Necesidad media 18 48 63 33 31 193
Necesidad baja 4 5 11 15 17 52
Total de la columna 57 95 127 63 58 400
Tabla 11.18 Necesidad de tener éxito en la escuela versus nivel de ansiedad

translation missing: es.problem

a. ¿Cuántos estudiantes con alto nivel de ansiedad se espera que tengan una alta necesidad de tener éxito en la escuela?

translation missing: es.problem

b. Si las dos variables son independientes, ¿cuántos estudiantes espera que tengan una baja necesidad de tener éxito en la escuela y un nivel medio-bajo de ansiedad?

translation missing: es.problem

c. E=(total de filas)(total de columnas) total de encuestadosE=(total de filas)(total de columnas) total de encuestados = ________

translation missing: es.problem

d. El número esperado de estudiantes que tienen un nivel de ansiedad medio-bajo y una baja necesidad de tener éxito en la escuela es aproximadamente ________.

Inténtelo 11.7

Consulte la información en el INTÉNTELO 11.6. ¿Cuántos puestos de trabajo en el sector de los servicios se espera que haya en 2020? ¿Cuántos empleos asalariados no relacionados con la agricultura se espera que haya en 2020?

Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.