El gráfico de una distribución de probabilidad continua es una curva. La probabilidad se representa mediante el área que está debajo de la curva. Ya conocimos este concepto cuando desarrollamos las frecuencias relativas con histogramas en el Capítulo 2. El área relativa para un rango de valores era la probabilidad de extraer al azar una observación en ese grupo. De nuevo con la distribución de Poisson del Capítulo 4, el gráfico del Ejemplo 4.14 utilizó cajas para representar la probabilidad de valores específicos de la variable aleatoria. En este caso, estábamos siendo poco estrictos porque las variables aleatorias de una distribución de Poisson son discretas, números enteros, y una caja tiene anchura. Observe que el eje horizontal, la variable aleatoria x, deliberadamente no marcó los puntos a lo largo del eje. La probabilidad de un valor específico de una variable aleatoria continua será cero porque el área bajo un punto es cero. La probabilidad es el área.
La curva se denomina función de densidad de probabilidad (abreviada como pdf). Utilizamos el símbolo f(x) para representar la curva. f(x) es la función que corresponde al gráfico; utilizamos la función de densidad f(x) para dibujar el gráfico de la distribución de probabilidad.
El área debajo de la curva viene dada por una función diferente llamada función de distribución acumulativa (cdf). La función de distribución acumulativa se utiliza para evaluar la probabilidad como área. Matemáticamente, la función de densidad de probabilidad acumulada es la integral de la pdf, y la probabilidad entre dos valores de una variable aleatoria continua será la integral de la pdf entre estos dos valores: el área bajo la curva entre estos valores. Recuerde que el área bajo la pdf para todos los valores posibles de la variable aleatoria es uno, la certeza. Por tanto, la probabilidad puede verse como el porcentaje relativo de certeza entre los dos valores de interés.
- Los resultados se miden, no se cuentan.
- Toda el área debajo de la curva y sobre el eje x es igual a uno.
- La probabilidad se calcula para intervalos de valores de x en vez de para valores individuales de x.
- P(c < x < d) es la probabilidad de que la variable aleatoria X se calcule en el intervalo entre los valores c y d. P(c < x < d) es el área debajo de la curva, por encima del eje x, a la derecha de c y a la izquierda de d.
- P(x = c) = 0 significa que es la probabilidad de que x tome cualquier valor individual es cero. El área por debajo de la curva, por encima del eje x y entre x = c y x = c no tiene ancho, y por tanto no tiene área (área = 0). Como la probabilidad es igual al área, la probabilidad también es cero.
- P(c < x < d) es lo mismo que P(c ≤ x ≤ d) porque la probabilidad es igual al área.
Hallaremos el área que representa la probabilidad mediante geometría, fórmulas, tecnología o tablas de probabilidad. En general, el cálculo integral es necesario para hallar el área bajo la curva de muchas funciones de densidad de probabilidad. Cuando usamos fórmulas para hallar el área en este libro de texto, las fórmulas fueron halladas mediante técnicas del cálculo integral.
Hay muchas distribuciones de probabilidad continuas. Cuando se utiliza una distribución de probabilidad continua para modelar la probabilidad, la distribución utilizada se selecciona para modelar y ajustarse a la situación particular de la mejor manera.
En este capítulo y en el siguiente estudiaremos la distribución uniforme, la exponencial y la normal. Los siguientes gráficos ilustran estas distribuciones.
Para distribuciones de probabilidad continuas, PROBABILIDAD = ÁREA.
Ejemplo 5.1
Consideremos la función f(x) = para 0 ≤ x ≤ 20. x = un número real. El gráfico de f(x) = es una línea horizontal. Sin embargo, como 0 ≤ x ≤ 20, f(x) se restringe a la porción entre x = 0 y x = 20, inclusive.
f(x) = para 0 ≤ x ≤ 20.
El gráfico de f(x) = es un segmento de línea horizontal cuando 0 ≤ x ≤ 20.
El área entre f(x) = donde 0 ≤ x ≤ 20 y el eje x es el área de un rectángulo con base = 20 y altura = .
Supongamos que queremos hallar el área entre f(x) = y el eje xdonde 0 < x < 2.
Recordatorio
área de un rectángulo = (base)(altura).
El área corresponde a una probabilidad. La probabilidad de que x esté entre cero y dos es 0,1, lo que se puede escribir matemáticamente como P(0 < x < 2) = P(x < 2) = 0,1.
Supongamos que queremos hallar el área entre f(x) = y el eje x donde 4 < x < 15.
El área corresponde a la probabilidad P(4 < x < 15) = 0,55.
Supongamos que queremos hallar P(x = 15). En un gráfico x-y, x = 15 es una línea vertical. Una línea vertical no tiene ancho (o tiene ancho cero). Por lo tanto, P(x = 15) = (base)(altura) = (0) = 0
P(X ≤ x), que también se puede escribir como P(X < x) para distribuciones continuas, se denomina función de distribución acumulativa o cdf. Fíjese en el símbolo “menor que o igual a”. También podemos utilizar la cdf para calcular P(X > x). La cdf da el “área a la izquierda” y P(X > x) da el “área a la derecha”. Calculamos P(X > x) para distribuciones continuas de la siguiente manera: P(X > x) = 1 – P (X < x).
Identifique el gráfico con f(x) y x. Escale los ejes x y y con los valores máximos de x y y. f(x) = , 0 ≤ x ≤ 20.
Para calcular la probabilidad de que x esté entre dos valores, observe el siguiente gráfico. Sombree la región entre x = 2,3 y x = 12,7. Luego, calcule el área sombreada de un rectángulo.
Inténtelo 5.1
Consideremos la función f(x) = para 0 ≤ x ≤ 8. Dibuje el gráfico de f(x) y calcule P(2,5 < x < 7,5).