Ya hemos visto que varias funciones de densidad de probabilidad son las distribuciones límite de otras; por tanto, podemos estimar una con otra en determinadas circunstancias. Aquí veremos que la distribución normal puede utilizarse para estimar un proceso binomial. La Poisson se utilizó para estimar la binomial previamente, y la binomial se utilizó para estimar la distribución hipergeométrica.
En el caso de la relación entre la distribución hipergeométrica y la binomial, tuvimos que reconocer que un proceso binomial asume que la probabilidad de un éxito permanece constante de un ensayo a otro: una cara en el último lanzamiento no puede tener un efecto en la probabilidad de una cara en el siguiente lanzamiento. En la distribución hipergeométrica esta es la esencia de la cuestión porque el experimento asume que cualquier "extracción" es sin reemplazo. Si se extrae sin reemplazo, todos las "extracciones" posteriores son probabilidades condicionales. Descubrimos que si el experimento hipergeométrico saca extrae un pequeño porcentaje del total de objetos, entonces podemos ignorar el impacto en la probabilidad de una extracción a otra.
Imagine que hay 312 cartas en una baraja compuesta por 6 mazos normales. Si el experimento exigía extraer solo 10 cartas, menos del 5% del total, entonces aceptaremos la estimación binomial de la probabilidad, aunque en realidad se trata de una distribución hipergeométrica porque las cartas se extraen presumiblemente sin reemplazo.
La Poisson también se consideró una estimación adecuada de la binomial en determinadas circunstancias. En el capítulo 4 encontramos que si el número de ensayos de interés es grande y la probabilidad de éxito es pequeña, tal que < , la Poisson puede utilizarse para estimar la binomial con buenos resultados. Una vez más, estas reglas empíricas no pretenden en modo alguno que la probabilidad real sea la que determina la estimación, sino que la diferencia está en el tercer o cuarto decimal y, por tanto, es de minimus.
Aquí, de nuevo, encontramos que la distribución normal hace estimaciones particularmente precisas de un proceso binomial bajo ciertas circunstancias. La Figura 6.10 es una distribución de frecuencia de un proceso binomial para el experimento de lanzar tres monedas donde la variable aleatoria es el número de caras. El espacio muestral se encuentra debajo de la distribución. En el experimento se ha asumido que la probabilidad de éxito es de 0,5; por tanto, la probabilidad de fracaso, de cola, es también de 0,5. Al observar la Figura 6.10 nos llama la atención que la distribución sea simétrica. La raíz de este resultado es que las probabilidades de éxito y de fracaso son las mismas, 0,5. Si la probabilidad de éxito fuera inferior a 0,5, la distribución se vuelve sesgada hacia la derecha. De hecho, a medida que la probabilidad de éxito disminuye, el grado de asimetría aumenta. Si la probabilidad de éxito aumenta a partir de 0,5, la asimetría aumenta en la cola inferior, lo que da lugar a una distribución sesgada a la izquierda.
La razón por la que la asimetría de la distribución binomial es importante es porque si se va a estimar con una distribución normal, entonces tenemos que reconocer que la distribución normal es simétrica. Cuanto más se acerque la distribución binomial subyacente a ser simétrica, mejor será la estimación producida por la distribución normal. La Figura 6.11 muestra una distribución normal simétrica transpuesta en un gráfico de una distribución binomial donde p = 0,2 y n = 5. La discrepancia entre la probabilidad estimada utilizando una distribución normal y la probabilidad de la distribución binomial original es evidente. El criterio para utilizar una distribución normal para estimar una binomial aborda, pues, este problema al exigir que TANTO np COMO n(1 - p) sean mayores que cinco. De nuevo, se trata de una regla general, pero es eficaz y da lugar a estimaciones aceptables de la probabilidad binomial.
Ejemplo 6.7
Imagínese que se sabe que solo el 10 % de los cachorros de pastor australiano nacen con lo que se llama "simetría perfecta" en sus tres colores, negro, blanco y cobre. La simetría perfecta se define como una cobertura igual en todas las partes del perro cuando se mira en la cara y se mide a la izquierda y a la derecha por la línea central. Un criadero tendría una buena reputación en la cría de pastores australianos si tuviera un alto porcentaje de perros que cumplieran este criterio. Durante los últimos 5 años y de los 100 perros nacidos en Dundee Kennels, 16 han nacido con esta característica de coloración.
Translation missing: es.problem
¿Cuál es la probabilidad de que, en 100 nacimientos, más de 16 tengan esta característica?
Solución
Si suponemos que la coloración de un perro es independiente de la de los demás, una suposición un poco valiente, esto se convierte en un problema clásico de probabilidad binomial.
El enunciado de la probabilidad solicitada es 1 - [p(X = 0) + p(X = 1) + p(X = 2) + ... + p(X = 16)]. Para ello debemos calcular 17 fórmulas binomiales y sumarlas y luego restar a una para obtener la parte derecha de la distribución. Como alternativa, podemos utilizar la distribución normal para obtener una respuesta aceptable y en mucho menos tiempo.
En primer lugar, tenemos que comprobar si la distribución binomial es lo suficientemente simétrica como para utilizar la distribución normal. Sabemos que la binomial de este problema está sesgada porque la probabilidad de éxito, 0,1, no es la misma que la probabilidad de fracaso, 0,9. Sin embargo, tanto como son mayores que 5, el límite para utilizar la distribución normal para estimar la binomial.
La Figura 6.12 a continuación muestra la distribución binomial y se marca el área que queremos conocer. También se marca la media de la binomial, 10, y se escribe la desviación típica en el lateral del gráfico: σ = = 3. El área bajo la distribución de cero a 16 es la probabilidad solicitada, y se ha sombreado. Debajo de la distribución binomial hay una distribución normal que se utiliza para estimar esta probabilidad. Esa probabilidad también ha sido sombreada.
Al estandarizar de la distribución binomial a la normal, como se hizo en el pasado, se muestra que estamos pidiendo la probabilidad de 16 a infinito positivo, o 100 en este caso. Tenemos que calcular el número de desviaciones típicas que 16 se aleja de la media: 10.
Estamos preguntando por la probabilidad más allá de dos desviaciones típicas, un evento muy improbable. Buscamos dos desviaciones típicas en la tabla normal estándar y encontramos que el área de cero a dos desviaciones típicas es 0,4772. Sin embargo, nos interesa la cola, así que restamos 0,4772 de 0,5 y así encontramos el área de la cola. Nuestra conclusión es que la probabilidad de que un criadero tenga 16 perros con "simetría perfecta" es de 0,0228. Dundee Kennels tiene un historial extraordinario en este sentido.
Matemáticamente, lo escribimos como: