La función de densidad de probabilidad más sencilla es la hipergeométrica. Es la más básica porque se crea combinando nuestro conocimiento de las probabilidades a partir de los diagramas de Venn, las reglas de adición y multiplicación y la fórmula de recuento combinatorio.
Para hallar el número de formas de obtener 2 ases de los cuatro que hay en la baraja, calculamos:
Y si no nos importara qué más tenemos en la mano para las otras tres cartas calcularíamos:
Uniendo todo esto, podemos calcular la probabilidad de obtener exactamente dos ases en una mano de póquer de 5 cartas como:
Esta solución es en realidad la distribución de probabilidad conocida como hipergeométrica. La fórmula generalizada es:
donde x = el número que nos interesa procedente del grupo con A objetos.
h(x) es la probabilidad de x aciertos, en n intentos, cuando los aciertos A (ases en este caso) están en una población que contiene N elementos. La distribución hipergeométrica es un ejemplo de distribución de probabilidad discreta porque no hay posibilidad de éxito parcial, es decir, no puede haber manos de póquer con 2 1/2 ases. Dicho de otro modo, una variable aleatoria discreta tiene que ser un número entero, o que se pueda contar, solamente. Esta distribución de probabilidad funciona en los casos en que la probabilidad de éxito cambia con cada extracción de cartas. Otra forma de decir esto es que los eventos NO son independientes. Al utilizar una baraja de cartas, estamos haciendo un muestreo SIN reemplazo. Si volvemos a poner cada carta después de haberla sacado, la distribución hipergeométrica sería una pdf inadecuada.
Para que el hipergeométrico funcione,
- la población debe ser divisible en dos y solo dos subconjuntos independientes (ases y no ases en nuestro ejemplo). La variable aleatoria X = el número de elementos del grupo de interés.
- el experimento debe tener probabilidades cambiantes de éxito con cada experimento (el hecho de que las cartas no sean reemplazadas después de la extracción en nuestro ejemplo hace que esto sea cierto en este caso). Otra forma de decir esto es que se muestrea sin reemplazo y, por lo tanto, cada selección no es independiente.
- la variable aleatoria debe ser discreta, en lugar de continua.
Ejemplo 4.1
Translation missing: es.problem
Un plato de caramelos contiene 30 gominolas y 20 pastillas de goma. Se eligen diez caramelos al azar. ¿Cuál es la probabilidad de que 5 de los 10 sean pastillas de goma? Los dos grupos son gominolas y pastillas de goma. Dado que la pregunta de probabilidad pide la probabilidad de elegir gominolas, el grupo de interés (primer grupo A en la fórmula) son las gominolas. El tamaño del grupo de interés (primer grupo) es de 30. El tamaño del segundo grupo es de 20. El tamaño de la muestra es de 10 (gominolas o pastillas de goma). Supongamos que X = el número de pastillas de goma en la muestra de 10. X toma los valores x = 0, 1, 2, ..., 10. a. ¿Cuál es el enunciado de la probabilidad escrito matemáticamente? b. ¿Cuál es la función de densidad de probabilidad hipergeométrica escrita para resolver este problema? c. ¿Cuál es la respuesta a la pregunta "¿Cuál es la probabilidad de extraer del plato 5 pastillas de goma en 10 intentos?"
Solución
a.
b.
c.
Inténtelo 4.1
Una bolsa contiene fichas de letras. Cuarenta y cuatro de las fichas son vocales y 56 son consonantes. Se eligen siete fichas al azar. Quiere saber la probabilidad de que cuatro de las siete fichas sean vocales. ¿Cuál es el grupo de interés, el tamaño del grupo de interés y el tamaño de la muestra?