El área sombreada en el siguiente gráfico indica el área a la derecha de x. Esta zona está representada por la probabilidad P(X > x). Las tablas normales proporcionan la probabilidad entre la media, cero para la distribución normal estándar y un valor específico como . Esta es la parte no sombreada del gráfico desde la media hasta .
Como la distribución normal es simétrica, si estuviera a la misma distancia a la izquierda de la media, el área (la probabilidad) en la cola izquierda, sería la misma que el área sombreada en la cola derecha. Además, hay que tener en cuenta que, debido a la simetría de esta distribución, la mitad de la probabilidad está a la derecha de la media y la otra mitad a la izquierda.
Cálculo de probabilidades
Para hallar la probabilidad de las funciones de densidad de probabilidad con una variable aleatoria continua necesitamos calcular el área bajo la función a través de los valores de X que nos interesan. Para la distribución normal esto parece una tarea difícil dada la complejidad de la fórmula. Sin embargo, hay una forma sencilla de conseguir lo que queremos. Aquí tenemos de nuevo la fórmula de la distribución normal:
Al observar la fórmula de la distribución normal no está claro cómo vamos a resolver la probabilidad haciéndolo de la misma manera que lo hicimos con las funciones de probabilidad anteriores. Allí pusimos los datos en la fórmula e hicimos las cuentas.
Para resolver este rompecabezas, desde el principio sabemos que el área bajo una función de densidad de probabilidad es la probabilidad.
Esto demuestra que el área entre X1 y X2 es la probabilidad que se indica en la fórmula: P (X1 ≤ x ≤ X2)
La herramienta matemática necesaria para calcular el área bajo una curva es el cálculo integral. La integral de la función de densidad de probabilidad normal entre los dos puntos x1 y x2 es el área bajo la curva entre estos dos puntos y es la probabilidad entre estos dos puntos.
Hacer estas integrales no es divertido y puede llevar mucho tiempo. Pero ahora, recordando que hay un número infinito de distribuciones normales, podemos considerar la que tiene una media de cero y una desviación típica de 1. Esta particular distribución normal recibe el nombre de distribución normal estándar. Al poner estos valores en la fórmula se reduce a una ecuación muy sencilla. Ahora podemos calcular fácilmente todas las probabilidades para cualquier valor de x en esta distribución normal particular, que tiene una media de cero y una desviación típica de 1. Se han elaborado y están disponibles aquí en el apéndice del texto o en cualquier lugar de la web. Se presentan de varias maneras. La tabla de este texto es la presentación más habitual y se establece con las probabilidades de la mitad de la distribución, que comienza por el cero, la media, y moviéndose hacia fuera. El área sombreada en el gráfico de la parte superior de la tabla en Tablas estadísticas representa la probabilidad desde cero hasta el valor Z específico anotado en el eje horizontal, Z.
El único problema es que, incluso con esta tabla, sería una ridícula coincidencia que nuestros datos tuvieran una media de cero y una desviación típica de uno. La solución es convertir la distribución que tenemos con su media y desviación típica a esta nueva distribución normal estándar. La normal estándar tiene una variable aleatoria llamada Z.
Al usar la tabla normal estándar, que por lo general se llama tabla normal, para hallar la probabilidad de una desviación típica, vaya a la columna Z, lea hasta 1,0 y luego lea en la columna 0. Ese número, 0,3413 es la probabilidad de cero a 1 desviación típica. En la parte superior de la tabla se encuentra la zona sombreada de la distribución que es la probabilidad para una desviación típica. La tabla ha resuelto nuestro problema de cálculo integral, pero solo si nuestros datos tienen una media de cero y una desviación típica de 1.
Sin embargo, el punto esencial aquí es que la probabilidad de una desviación típica en una distribución normal es la misma en todas las distribuciones normales. Si el conjunto de datos de la población tiene una media de 10 y una desviación típica de 5, entonces la probabilidad de 10 a 15, una desviación típica, es la misma que de cero a 1, una desviación típica en la distribución normal estándar. Para calcular las probabilidades, las áreas, para cualquier distribución normal, solo tenemos que convertir la distribución normal particular a la distribución normal estándar y buscar la respuesta en las tablas. Como revisión, aquí está de nuevo la fórmula de normalización:
donde Z es el valor de la distribución normal estándar, X es el valor de una distribución normal que se desea convertir a la normal estándar, μ y σ son, respectivamente, la media y la desviación típica de esa población. Tenga en cuenta que la ecuación utiliza μ y σ lo que denota parámetros poblacionales. Esto sigue tratando con la probabilidad, por lo que siempre estamos tratando con la población, con valores de parámetros conocidos y una distribución conocida. También es importante tener en cuenta que, como la distribución normal es simétrica, no importa si la puntuación z es positiva o negativa a la hora de calcular una probabilidad. Una desviación típica a la izquierda (puntuación Z negativa) cubre la misma área que una desviación típica a la derecha (puntuación Z positiva). Este hecho es la razón por la que las tablas de la normal estándar no proporcionan áreas para el lado izquierdo de la distribución. Debido a esta simetría, la fórmula de la puntuación Z se escribe a veces como
Las líneas verticales de la ecuación significan el valor absoluto del número.
Lo que realmente hace la fórmula de estandarización es calcular el número de desviaciones típicas que tiene X respecto a la media de su propia distribución. La fórmula de estandarización y el concepto de contar desviaciones típicas de la media es el secreto de todo lo que haremos en esta clase de Estadística. La razón de esto es que toda la estadística se reduce a la variación, y el recuento de las desviaciones típicas es una medida de variación.
Esta fórmula, con muchas apariencias, reaparecerá una y otra vez a lo largo de este curso.
Ejemplo 6.3
Las calificaciones del examen final de una clase de Estadística se distribuyeron normalmente, con una media de 63 y una desviación típica de cinco.
Translation missing: es.problem
a. Halle la probabilidad de que un estudiante seleccionado al azar obtenga más de 65 puntos en el examen.
b. Calcule la probabilidad de que un estudiante seleccionado al azar obtenga una calificación inferior a 85.
Solución
a. Supongamos que X = una calificación en el examen final. X ~ N(63, 5), donde μ = 63 y σ = 5.
Dibuje un gráfico.
Entonces, calcule P(x > 65).
P(x > 65) = 0,3446
P(x ≥ x1) = P(Z ≥ Z1) = 0,3446
La probabilidad de que cualquier estudiante seleccionado al azar obtenga una calificación superior a 65 es de 0,3446. Así es como hemos hallado esta respuesta.
La tabla normal proporciona probabilidades desde cero hasta el valor Z1. Para este problema la pregunta se puede escribir como P(X ≥ 65) = P(Z ≥ Z1), que es el área de la cola. Para calcular esta área la fórmula sería 0,5 – P(X ≤ 65). La mitad de la probabilidad está por encima del valor medio porque se trata de una distribución simétrica. El gráfico muestra cómo hallar el área en la cola restando esa porción de la media, cero, al valor Z1. La respuesta final es: P(X ≥ 63) = P(Z ≥ 0,4) = 0,3446
z = = 0,4
El área a la izquierda de Z1 a la media de cero es 0,1554
P(x > 65) = P(z > 0,4) = 0,5 - 0,1554 = 0,3446
Translation missing: es.problem
Solución
b.
que es mayor que el valor máximo de la tabla normalizada. Por lo tanto, la probabilidad de que un estudiante obtenga una calificación inferior a 85 es aproximadamente de uno o del 100 %.
Una calificación de 85 está a 4,4 desviaciones típicas de la media de 63, lo que está fuera del rango de la tabla normal estándar. Por lo tanto, la probabilidad de que un estudiante obtenga una calificación inferior a 85 es aproximadamente uno (o el 100 %).
Inténtelo 6.3
Las puntuaciones de golf de un equipo escolar se distribuyen normalmente, con una media de 68 y una desviación típica de tres.
Calcule la probabilidad de que un golfista seleccionado al azar obtenga una puntuación inferior a 65.
Ejemplo 6.4
Una computadora personal se utiliza para trabajo de oficina en casa, investigación, comunicación, finanzas personales, educación, entretenimiento, redes sociales y un sinfín de cosas más. Supongamos que el número promedio de horas que se utiliza una computadora personal en un hogar para el entretenimiento es de dos horas al día. Supongamos que los tiempos de entretenimiento se distribuyen normalmente y la desviación típica de los tiempos es de media hora.
Translation missing: es.problem
a. Calcule la probabilidad de que una computadora personal en un hogar se utilice para el entretenimiento entre 1,8 y 2,75 horas al día.
Solución
a. Supongamos que X = la cantidad de tiempo (en horas) que se utiliza una computadora personal en un hogar para el entretenimiento. X ~ N(2, 0,5) donde μ = 2 y σ = 0,5.
Calcule P(1,8 < x < 2,75).
La probabilidad que se busca es el área entre x = 1,8 y x = 2,75. P(1,8 < x < 2,75) = 0,5886
P(1,8 ≤ x ≤ 2,75) = P(Zi ≤ Z ≤ Z2)
La probabilidad de que una computadora personal en un hogar se utilice entre 1,8 y 2,75 horas al día para el entretenimiento es de 0,5886
Translation missing: es.problem
b. Calcule el número máximo de horas al día que el cuartil inferior de los hogares utiliza una computadora personal para entretenerse.
Solución
b. Para hallar el número máximo de horas al día que el cuartil inferior de los hogares utiliza una computadora personal para entretenerse, calcule el percentil 25, k, donde P(x < k) = 0,25.
, por lo que Z(o simplemente 0,67 utilizando la tabla) , por lo tanto x horas.
El número máximo de horas al día que el cuartil inferior de los hogares utiliza una computadora personal para entretenerse es de 1,66 horas.
Inténtelo 6.4
Las puntuaciones de golf de un equipo escolar se distribuyen normalmente, con una media de 68 y una desviación típica de tres. Calcule la probabilidad de que un golfista obtenga una puntuación entre 66 y 70.
Ejemplo 6.5
En Estados Unidos los usuarios de teléfonos inteligentes con edades comprendidas entre los 13 y los 55 años siguen aproximadamente una distribución normal con una media y una desviación típica aproximadas de 36,9 años y 13,9 años, respectivamente.
Translation missing: es.problem
a. Determine la probabilidad de que un usuario aleatorio de teléfono inteligente en el rango de edad de 13 a 55 o más tenga entre 23 y 64,7 años.
Solución
a. 0,8186
Translation missing: es.problem
b. Determine la probabilidad de que un usuario de teléfono inteligente seleccionado al azar en el rango de edad de 13 a 55 o más tenga como máximo 50,8 años.
Solución
b. 0,8413
Ejemplo 6.6
Un agricultor de cítricos que cultiva mandarinas comprueba que los diámetros de las mandarinas cosechadas en su finca siguen una distribución normal con un diámetro medio de 5,85 cm y una desviación típica de 0,24 cm.
Translation missing: es.problem
a. Calcule la probabilidad de que una mandarina seleccionada al azar de esta finca tenga un diámetro superior a 6,0 cm. Dibuje el gráfico.
Solución
P(x ≥ 6) = P(z ≥ 0,625) = 0,2670
b. El 20 % de las mandarinas de esta finca tienen diámetros entre ______ y ______.
Por lo tanto, Z