Cuando se realiza una prueba de hipótesis que compara dos proporciones de población independientes se deben dar las siguientes características:
- Las dos muestras independientes son muestras aleatorias que son independientes.
- El número de aciertos es, al menos, cinco y el número de fallos es, al menos, cinco para cada una de las muestras.
- La bibliografía, cada vez más extensa, afirma que la población deberá ser, como mínimo, 10 y hasta 20 veces el tamaño de la muestra. Así se evita que cada población sea objeto de un muestreo excesivo y que los resultados sean sesgados.
La comparación de dos proporciones, al igual que la comparación de dos medias, es de uso común. Si dos proporciones estimadas son diferentes, puede deberse a una diferencia en las poblaciones o al azar en el muestreo. La comprobación de la hipótesis permite determinar si una diferencia en las proporciones estimadas refleja una diferencia en las dos proporciones de la población.
Al igual que en el caso de las diferencias de medias muestrales, construimos una distribución muestral para las diferencias de proporciones muestrales: donde y son las proporciones de la muestra para los dos conjuntos de datos en cuestión. XA y XB son el número de aciertos en cada grupo de la muestra, respectivamente, y nA y nB son los tamaños de muestra respectivos de los dos grupos. De nuevo acudimos al teorema del límite central para hallar la distribución muestral con respecto a las diferencias en las proporciones de la muestra. También nos encontramos con que esta distribución muestral, al igual que las anteriores, se distribuye normalmente, tal y como demuestra el teorema del límite central, como se ve en la Figura 10.5.
En general, la hipótesis nula permite probar una diferencia de un valor determinado, 𝛿0, tal como hicimos para el caso de las diferencias de medias.
Sin embargo, lo más común es la prueba de que las dos proporciones son iguales. Esto es,
Para llevar a cabo la prueba utilizamos una proporción combinada, pc.
donde δ0 son las diferencias hipotéticas entre las dos proporciones y pc es la varianza agrupada de la fórmula anterior.
Ejemplo 10.6
Translation missing: es.problem
Un banco acaba de adquirir otra sucursal, por lo que tiene clientes en este nuevo territorio. Les interesa la tasa de morosidad en su nuevo territorio. Desean comprobar la hipótesis de que la tasa de morosidad es diferente a la de su actual base de clientes. Hacen un muestreo de 200 expedientes en el área A, sus clientes actuales, y descubren que 20 han incumplido. En el área B, la de los nuevos clientes, otra muestra de 200 expedientes muestra que 12 han dejado de pagar sus préstamos. A un nivel de significación del 10 %, ¿podemos decir que los índices de impago son iguales o diferentes?
Solución
Esto es una prueba de proporciones. Lo sabemos porque la variable aleatoria subyacente es binaria: impago o no impago. Además, sabemos que se trata de una prueba de diferencias de proporciones porque tenemos dos grupos de muestra, la base de clientes actual y la recién adquirida. Supongamos que A y B son los subíndices de los dos grupos de clientes. Entonces pA y pB son las dos proporciones de la población que deseamos probar.
Variable aleatoria:
P′A – P′B = diferencia en las proporciones de clientes con impago en los dos grupos.
Las palabras “es una diferencia” le indican que la prueba es de dos colas.
Distribución para la prueba: como se trata de una prueba de dos proporciones poblacionales binomiales, la distribución es normal:
(p′A – p′B) = 0,04 sigue una distribución normal aproximada.
Proporción estimada para el grupo A:
Proporción estimada para el grupo B:
La diferencia estimada entre los dos grupos es: p′A – p′B = 0,1 – 0,06 = 0,04.
El valor calculado del estadístico de prueba es de 1,47 y no se encuentra en la cola de la distribución.
Tome una decisión: Dado que el valor calculado del estadístico de prueba no está en la cola de la distribución, no podemos rechazar H0.
Conclusión: A un nivel de significación del 1 %, a partir de los datos de la muestra, no hay pruebas suficientes para concluir que exista una diferencia entre las proporciones de clientes con impagos en los dos grupos.
Inténtelo 10.6
Se están probando dos tipos de válvulas para determinar si hay una diferencia en las tolerancias de presión. Quince de una muestra aleatoria de 100 de la válvula A se agrietaron por debajo de 4.500 psi. Seis de una muestra aleatoria de 100 de la válvula B se agrietaron por debajo de 4.500 psi. Pruebe con un nivel de significación del 5 %.