Es importante que entienda cuándo utilizar el teorema del límite central. Si se le pide que halle la probabilidad de la media, utilice el TLC para la media. Si se le pide que halle la probabilidad de una suma o un total, utilice el TLC para sumas. Esto también se aplica a los percentiles para las medias y las sumas.
NOTA
Si se le pide que halle la probabilidad de un valor individual, no utilice el TLC. Utilice la distribución de su variable aleatoria.
Ejemplos del teorema del límite central
Ley de los grandes números
La ley de los grandes números indica que si se toman muestras cada vez más grandes de cualquier población, entonces la media de la muestra tiende a acercarse cada vez más a μ. Por el teorema del límite central, sabemos que a medida que n se hace más grande, las medias muestrales siguen una distribución normal. Cuanto mayor sea n, menor será la desviación típica (recuerde que la desviación típica para es ). Esto significa que la media muestral debe estar cerca de la media poblacional μ. Podemos decir que μ es el valor al que se acercan las medias muestrales a medida que n es mayor. El teorema del límite central ilustra la ley de los grandes números.
Teorema del límite central para los ejemplos de media y suma
Ejemplo 7.8
Se realiza un estudio sobre el estrés entre los estudiantes de un campus universitario. Las puntuaciones de estrés siguen una distribución uniforme con la puntuación de estrés más baja igual a uno y la más alta igual a cinco. Utilizando una muestra de 75 estudiantes, calcule:
- La probabilidad de que la puntuación media de estrés de los 75 estudiantes sea inferior a dos.
- El percentil 90 de la puntuación media de estrés de los 75 estudiantes.
- La probabilidad de que el total de las 75 puntuaciones de estrés sea inferior a 200.
- El percentil 90 de la puntuación total de estrés de los 75 estudiantes.
Supongamos que X = una puntuación de estrés.
En los problemas a y b se pide calcular una probabilidad o un percentil para una media. En los problemas c y d se pide calcular una probabilidad o un percentil para un total o una suma. El tamaño de la muestra, n, es igual a 75.
Dado que las puntuaciones individuales de estrés siguen una distribución uniforme, X ~ U(1, 5) donde a = 1 y b = 5 (vea Variables aleatorias continuas para una explicación de la distribución uniforme).
μX = = = 3
σX = = = 1,15
Para los problemas a. y b., sea = la puntuación media de estrés de los 75 estudiantes. Entonces,
∼ N
Translation missing: es.problem
a. Halle P( < 2). Dibuje el gráfico.
Solución
a. P( < 2) = 0
La probabilidad de que la puntuación media de estrés sea inferior a dos es aproximadamente cero.
normalcdf
= 0
Recordatorio
La menor puntuación de estrés es uno.
Translation missing: es.problem
b. Calcule el percentil 90 para la media de 75 puntuaciones de estrés. Dibuje un gráfico.
Solución
b. Supongamos que k = el percentil 90.
Calcule k, donde P( < k) = 0,90.
k = 3,2
El percentil 90 de la media de las 75 puntuaciones es de aproximadamente 3,2. Esto nos indica que el 90 % de todas las medias de 75 puntuaciones de estrés son como máximo 3,2, y que el 10 % son como mínimo 3,2.
invNorm
= 3,2
Para los problemas c y d, sea ΣX = la suma de las 75 puntuaciones de tensión. Entonces, ΣX ~ N[(75)(3),(1,15)]
Translation missing: es.problem
c. Calcule P(Σx < 200). Dibuje el gráfico.
Solución
c. La media de la suma de las 75 puntuaciones de estrés es (75)(3) = 225
La desviación típica de la suma de 75 puntuaciones de estrés es (1,15) = 9,96
P(Σx < 200) = 0
La probabilidad de que el total de 75 puntuaciones sea inferior a 200 es aproximadamente cero.
normalcdf
(75.200,(75)(3),(1,15)).
Recordatorio
El total más pequeño de 75 puntuaciones de estrés es 75, porque la puntuación individual más pequeña es uno.
Translation missing: es.problem
d. Calcule el percentil 90 para el total de las 75 puntuaciones de estrés. Dibuje un gráfico.
Solución
d. Supongamos que k = el percentil 90.
Calcule k donde P(Σx < k) = 0,90.
k = 237,8
El percentil 90 de la suma de las 75 puntuaciones es de aproximadamente 237,8. Esto nos indica que el 90 % de todas las sumas de 75 puntuaciones no son superiores a 237,8 y el 10 % no son inferiores a 237,8.
invNorm
(0,90,(75)(3),(1,15)) = 237,8
Inténtelo 7.8
Utilice la información del Ejemplo 7.8, pero utilice un tamaño de muestra de 55 para responder las siguientes preguntas.
- Halle P( < 7).
- Calcule P(Σx > 170).
- Calcule el percentil 80 para la media de 55 puntuaciones.
- Calcule el percentil 85 para la suma de 55 puntuaciones.
Ejemplo 7.9
Supongamos que un analista de investigación de mercado de una compañía de telefonía móvil realiza un estudio sobre sus clientes que superan el tiempo incluido en su contrato básico de telefonía móvil; el analista descubre que, para las personas que superan el tiempo incluido en su contrato básico, el exceso de tiempo utilizado sigue una distribución exponencial con una media de 22 minutos.
Consideremos una muestra aleatoria de 80 clientes que superan el límite de tiempo incluido en su contrato básico de telefonía móvil.
Supongamos que X = el exceso de tiempo utilizado por un cliente de telefonía móvil INDIVIDUAL que supera su asignación de tiempo contratada.
X ∼ Exp. Por los capítulos anteriores, sabemos que μ = 22 y σ = 22.
Supongamos que = el exceso de la media de tiempo utilizado por una muestra de n = 80 clientes que superan el tiempo contratado.
~ N por el teorema del límite central para las medias muestrales
Translation missing: es.problem
Utilice el TLC para calcular la probabilidad
- Calcule la probabilidad de que el exceso de la media de tiempo utilizado por los 80 clientes de la muestra sea superior a 20 minutos. Esto nos pide calcular P( > 20). Dibuje el gráfico.
- Supongamos que se selecciona aleatoriamente un cliente que supera el límite de tiempo de su contrato de telefonía móvil. Calcule la probabilidad de que el exceso de tiempo de este cliente individual sea superior a 20 minutos. Esto nos pide calcular P(x > 20).
- Explique por qué las probabilidades de las partes a y b son diferentes.
Solución
-
Calcule: P( > 20)
P( > 20) = 0,79199 utilizando
normalcdf
La probabilidad de que el exceso de tiempo medio utilizado sea superior a 20 minutos es de 0,7919, para una muestra de 80 clientes que superan el tiempo contratado.
Recordatorio
1E99 = 1099 y –1E99 = –1099. Pulse
EE
la tecla para la E. O simplemente utilice 1099 en lugar de 1E99. -
Calcule P(x > 20). Recuerde utilizar la distribución exponencial para un individuo: .
o e(-0,04545(20)) = 0,4029 -
- P(x > 20) = 0,4029 pero P( > 20) = 0,7919
- Las probabilidades no son iguales porque utilizamos diferentes distribuciones para calcular la probabilidad de los individuos y de las medias.
- Cuando se le pida que calcule la probabilidad de un valor individual, utilice la distribución indicada de su variable aleatoria; no utilice el TLC. Utilice el TLC con la distribución normal cuando le pidan calcular la probabilidad de una media.
Translation missing: es.problem
Uso del TLC para calcular percentiles
Calcule el percentil 95 de la media muestral del exceso de tiempo para las muestras de 80 clientes que exceden sus asignaciones de tiempo de contrato básico. Dibuje un gráfico.Solución
Supongamos que k = el percentil 95. Calcule k donde P( < k) = 0,95
k = 26,0 utilizando invNorm
= 26,0
El percentil 95 de la media muestral del exceso de tiempo utilizado es de unos 26,0 minutos para muestras aleatorias de 80 clientes que superan su tiempo permitido por contrato.
El noventa y cinco por ciento de esas muestras tendrían medias inferiores a 26 minutos; solo el cinco por ciento de esas muestras tendrían medias superiores a 26 minutos.
Inténtelo 7.9
Utilice la información del Ejemplo 7.9, pero cambie el tamaño de la muestra a 144.
- Calcule P(20 < < 30).
- Calcule P(Σx es al menos 3.000).
- Calcule el percentil 75 para la media muestral del exceso de tiempo de 144 clientes.
- Calcule el percentil 85 para la suma de los 144 excesos de tiempo utilizados por los clientes.
Ejemplo 7.10
En Estados Unidos, alguien sufre una agresión sexual cada dos minutos, en promedio, según varios estudios. Supongamos que la desviación típica es de 0,5 minutos y el tamaño de la muestra es de 100.
Translation missing: es.problem
- Calcule la mediana, el primer cuartil y el tercer cuartil para la media de tiempo de la muestra de las agresiones sexuales en Estados Unidos.
- Calcule la mediana, el primer cuartil y el tercer cuartil para la suma de los tiempos de muestra de las agresiones sexuales en Estados Unidos.
- Calcule la probabilidad de que una agresión sexual se produzca en un promedio de entre 1,75 y 1,85 minutos.
- Calcule el valor que está dos desviaciones típicas por encima de la media de la muestra.
- Calcule el IQR para la suma de los tiempos de la muestra.
Solución
- Tenemos, μx = μ = 2 y σx = = = 0,05. Por lo tanto:
- Percentil 50 = μx = μ = 2
- Percentil 25 = invNorm(0,25;2;0,05) = 1,97
- Percentil 75 = invNorm(0,75;2;0,05) = 2,03
- Tenemos μΣx = n(μx) = 100(2) = 200 y σμx = (σx) = 10(0,5) = 5. Por lo tanto,
- Percentil 50 = μΣx = n(μx) = 100(2) = 200
- Percentil 25 = invNorm(0,25;200;5) = 196,63
- Percentil 75 = invNorm(0,75;200;5) = 203,37
- P(1,75 < < 1,85) =
normalcdf
(1.75,1.85,2,0.05) = 0,0013 - Usando la ecuación de la puntuación z, , y resolver x, tenemos x = 2(0,05) + 2 = 2,1
- El IQR es percentil 75 - percentil 25 = 203,37 - 196,63 = 6,74
Inténtelo 7.10
Según los datos de la Encuesta Nacional de Salud, las mujeres de entre 18 y 24 años tienen una presión arterial sistólica promedio (en mm Hg) de 114,8 con una desviación típica de 13,1. La presión arterial sistólica de las mujeres de entre 18 y 24 años sigue una distribución normal.
- Si se selecciona aleatoriamente una mujer de esta población, calcule la probabilidad de que su presión arterial sistólica sea superior a 120.
- Si se seleccionan aleatoriamente 40 mujeres de esta población, calcule la probabilidad de que su presión arterial sistólica media sea superior a 120.
- Si la muestra fuera de cuatro mujeres de entre 18 y 24 años y no conociéramos la distribución original, ¿se podría utilizar el teorema del límite central?
Ejemplo 7.11
Translation missing: es.problem
Se realizó un estudio sobre la violencia contra las prostitutas y los síntomas del estrés postraumático que desarrollaron. El rango de edad de las prostitutas era de 14 a 61 años. La edad media era de 30,9 años, con una desviación típica de nueve años.
- En una muestra de 25 prostitutas, ¿cuál es la probabilidad de que la media de edad de las prostitutas sea inferior a 35 años?
- ¿Es probable que la media de edad del grupo de la muestra sea superior a 50 años? Interprete los resultados.
- En una muestra de 49 prostitutas, ¿cuál es la probabilidad de que la suma de las edades no sea inferior a 1.600?
- ¿Es probable que la suma de las edades de las 49 prostitutas sea como máximo 1.595? Interprete los resultados.
- Calcule el percentil 95 de la media de edad de la muestra de 65 prostitutas. Interprete los resultados.
- Calcule el percentil 90 de la suma de las edades de 65 prostitutas. Interprete los resultados.
Solución
- P( < 35) =
normalcdf
(-E99,35,30.9,1.8) = 0,9886 - P( > 50) =
normalcdf
(50, E99,30.9,1.8) ≈ 0. Para este grupo de muestra es casi imposible que el promedio de edad del grupo sea superior a 50 años. Sin embargo, todavía es posible que un individuo de este grupo tenga una edad superior a los 50 años. - P(Σx ≥ 1.600) =
normalcdf
(1600,E99,1514.10,63) = 0,0864 - P(Σx ≤ 1.595) =
normalcdf
(-E99,1595,1514.10,63) = 0,9005. Esto significa que hay un 90 % de posibilidades de que la suma de las edades para el grupo de muestra n = 49 sea como máximo 1595. - El percentil 95 =
invNorm
(0.95,30.9,1.1) = 32,7. Esto indica que el 95 % de las prostitutas de la muestra de 65 son menores de 32,7 años, en promedio. - El percentil 90 =
invNorm
(0.90,2008.5,72.56) = 2101,5. Esto indica que el 90 % de las prostitutas de la muestra de 65 tienen una suma de edades inferior a 2.101,5 años.
Inténtelo 7.11
Según los datos de Boeing, el avión 757 transporta 200 pasajeros y tiene puertas con una altura de 72 pulgadas. Supongamos que para una determinada población de hombres tenemos una altura media de 69,0 pulgadas y una desviación típica de 2,8 pulgadas.
- ¿Qué altura de la puerta permitiría al 95 % de los hombres entrar en el avión sin agacharse?
- Supongamos que la mitad de los 200 pasajeros son hombres. ¿Qué altura media de la puerta satisface la condición de que existe una probabilidad de 0,95 de que esta altura sea mayor que la altura media de 100 hombres?
- Para los ingenieros que diseñan el 757, ¿qué resultado es más relevante: la altura de la parte a o la de la parte b? ¿Por qué?
NOTA HISTÓRICA
Aproximación normal a la binomial
Históricamente, poder calcular las probabilidades binomiales era una de las aplicaciones más importantes del teorema del límite central. Las probabilidades binomiales con un valor pequeño para n(digamos, 20) se mostraban en una tabla en un libro. Para calcular las probabilidades con valores grandes de n, había que utilizar la fórmula binomial, que podía ser muy complicada. El uso de la aproximación normal a la distribución binomial simplificó el proceso. Para calcular la aproximación normal a la distribución binomial, tome una muestra aleatoria simple de una población. Debe cumplir las condiciones de una distribución binomial:
- hay un cierto número n de ensayos independientes
- los resultados de cualquier ensayo son aciertos o fallos
- cada ensayo tiene la misma probabilidad de un acierto p
Recordemos que si X es la variable aleatoria binomial, entonces X ~ B(n, p). La forma de la distribución binomial debe ser similar a la de la distribución normal. Para ello, las cantidades np y nq deben ser mayores que cinco (np > 5 y nq > 5; la aproximación es mejor si ambas son mayores o iguales a 10). Entonces la binomial puede ser aproximada por la distribución normal con media μ = np y desviación típica σ = . Recuerde que q = 1 - p. Para obtener la mejor aproximación, sume 0,5 a x o reste 0,5 a x (utilice x + 0,5 o x - 0,5). El número 0,5 se denomina factor de corrección de continuidad y se utiliza en el siguiente ejemplo.
Ejemplo 7.12
Supongamos que en un distrito escolar local desde kínder hasta 12.º grado (K-12), el 53 % de la población está a favor de una escuela chárter de kínder a 5.º grado (K-5). Se realiza una encuesta con una muestra aleatoria simple de 300 personas.
- Calcule la probabilidad de que al menos 150 estén a favor de una escuela chárter.
- Calcule la probabilidad de que como máximo 160 estén a favor de una escuela chárter.
- Calcule la probabilidad de que más de 155 estén a favor de una escuela chárter.
- Calcule la probabilidad de que menos de 147 estén a favor de una escuela chárter.
- Calcule la probabilidad de que exactamente 175 estén a favor de una escuela chárter.
Supongamos que X = el número de los que están a favor de una escuela chárter de K-5. X ~ B(n, p) donde n = 300 y p = 0,53. Como np > 5 y nq > 5, utilice la aproximación normal a la binomial. Las fórmulas para la media y la desviación típica son μ = np y σ = . La media es de 159 desviación típica es de 8,6447. La variable aleatoria de la distribución normal es Y. Y ~ N(159; 8,6447). Consulte La distribución normal para obtener ayuda con las instrucciones de la calculadora.
Para la parte a, se incluye 150 por lo que P(X ≥ 150) tiene aproximación normal P(Y ≥ 149,5) = 0,8641.
normalcdf
(149,5,10^99,159,8.6447) = 0,8641.
Para la parte b, se incluye 160 por lo que P(X ≤ 160) tiene una aproximación normal P(Y ≤ 160,5) = 0,5689.
normalcdf
(0,160.5,159,8.6447) = 0,5689
Para la parte c, se excluye 155 por lo que P(X > 155) tiene una aproximación normal P(y > 155,5) = 0,6572.
normalcdf
(155,5,10^99,159,8.6447) = 0,6572.
Para la parte d, se excluye 147 por lo que P(X < 147) tiene una aproximación normal P(Y < 146,5) = 0,0741.
normalcdf
(0,146.5,159,8.6447) = 0,0741
Para la parte e,P(X = 175) tiene una aproximación normal P(174,5 < Y < 175,5) = 0,0083.
normalcdf
(174.5,175.5,159,8.6447) = 0,0083
Gracias a las calculadoras y a los softwares que permiten calcular fácilmente las probabilidades binomiales para grandes valores de n, no es necesario utilizar la aproximación normal a la distribución binomial, siempre que se tenga acceso a estas herramientas tecnológicas. La mayoría de los laboratorios escolares disponen de Microsoft Excel, un ejemplo de software que calcula probabilidades binomiales. Muchos estudiantes tienen acceso a las calculadoras de la serie TI-83 u 84, y calculan fácilmente las probabilidades de la distribución binomial. Si escribe "cálculo de la distribución de probabilidad binomial" en un navegador de internet, podrá encontrar al menos una calculadora en línea para la binomial.
Para el Ejemplo 7.10, las probabilidades se calculan utilizando la siguiente distribución binomial: (n = 300 y p = 0,53). Compare las respuestas de la distribución binomial y la normal. Vea Variables aleatorias discretas para ayudar con las instrucciones de la calculadora para la binomial.
P(X ≥ 150) :1 – binomialcdf
(300,0.53,149) = 0,8641
P(X ≤ 160) :binomialcdf
(300,0.53,160) = 0,5684
P(X > 155) :1 – binomialcdf
(300,0.53,155) = 0,6576
P(X < 147) :binomialcdf
(300,0.53,146) = 0,0742
P(X = 175) : (Se utiliza la función de densidad de probabilidad [probability density function, pdf] binomial).binomialpdf
(300,0.53,175) = 0,0083
Inténtelo 7.12
En una ciudad, el 46 % de la población está a favor del titular, Dawn Morgan, para la alcaldía. Se toma una muestra aleatoria simple de 500 personas. Utilizando el factor de corrección de la continuidad, halle la probabilidad de que al menos 250 favorezcan a Dawn Morgan como alcaldesa.