Supongamos que X es una variable aleatoria con una distribución que puede ser conocida o desconocida (puede ser cualquier distribución). Utilizando un subíndice que coincida con la variable aleatoria, supongamos:
- μX = la media de X
- σX = la desviación típica de X
Si se extraen muestras aleatorias de tamaño n, a medida que n aumenta, la variable aleatoria que consiste en las medias muestrales, tiende a distribuirse normalmente y
~ N.
El teorema del límite central para las medias muestrales indica que si se extraen repetidamente muestras de un tamaño determinado (como lanzar repetidamente diez dados) y se calculan sus medias, estas tienden a seguir una distribución normal (la distribución muestral). A medida que aumenta el tamaño de la muestra, la distribución de las medias se ajusta más a la distribución normal. La distribución normal tiene la misma media que la distribución original y una varianza que es igual a la varianza original dividida por el tamaño de la muestra. La desviación típica es la raíz cuadrada de la varianza, por lo que la desviación típica de la distribución muestral es la desviación típica de la distribución original dividida por la raíz cuadrada de n. La variable n es el número de valores que se promedian juntos, no el número de veces que se realiza el experimento.
Para decirlo de manera más formal, si se extraen muestras aleatorias de tamaño n, la distribución de la variable aleatoria , que consiste en las medias muestrales, se denomina distribución muestral de la media. La distribución muestral de la media se aproxima a una distribución normal a medida que aumenta n, el tamaño de la muestra.
La variable aleatoria tiene asociada una puntuación z diferente a la de la variable aleatoria X. La media es el valor de en una muestra.
μX es el promedio de X y .
= desviación típica de y se denomina error estándar de la media.
Uso de las calculadoras TI-83, 83+, 84, 84+
Para calcular las probabilidades de las medias en la calculadora, siga estos pasos.
2.º DISTR
2:normalcdf
donde:
- la media es la media de la distribución original
- la desviación típica es la desviación típica de la distribución original
- el tamaño de la muestra = n
Ejemplo 7.1
Una distribución desconocida tiene una media de 90 y una desviación típica de 15. Las muestras de tamaño n = 25 se extraen aleatoriamente de la población.
Translation missing: es.problem
a. Calcule la probabilidad de que la media de la muestra esté entre 85 y 92.
Solución
a. Supongamos que X = un valor de la población original desconocida. La pregunta de probabilidad le pide que calcule una probabilidad para la media de la muestra.
Supongamos que = la media de una muestra de tamaño 25. Dado que μX = 90, σX = 15 y n = 25,
~ N.
Calcule P(85 < < 92). Dibuje un gráfico.
P(85 < < 92) = 0,6997
La probabilidad de que la media de la muestra esté entre 85 y 92 es de 0,6997.
Uso de las calculadoras TI-83, 83+, 84, 84+
normalcdf
(valor inferior, valor superior, media, error estándar de la media)
La lista de parámetros se abrevia (valor inferior, valor superior, μ, )
normalcdf
(85,92,90,) = 0,6997
Translation missing: es.problem
b. Calcule el valor que está dos desviaciones típicas por encima del valor esperado, 90, de la media de la muestra.
Solución
b. Para calcular el valor que está dos desviaciones típicas por encima del valor esperado 90, utilice la fórmula:
valor = μx + (#deTSDEVs)
valor = 90 + 2 = 96
El valor que está dos desviaciones típicas por encima del valor esperado es 96.
El error estándar de la media es = = 3. Recordemos que el error estándar de la media es una descripción de la distancia (en promedio) que la media de la muestra estará de la media de la población en muestras aleatorias simples repetidas de tamaño n.
Inténtelo 7.1
Una distribución desconocida tiene una media de 45 y una desviación típica de ocho. Las muestras de tamaño n = 30 se extraen aleatoriamente de la población. Calcule la probabilidad de que la media de la muestra esté entre 42 y 50.
Ejemplo 7.2
Translation missing: es.problem
El tiempo, en horas, que tarda un grupo de personas "mayores de 40 años" en jugar un partido de fútbol se distribuye normalmente con una media de dos horas y una desviación típica de 0,5 horas. Una muestra de tamaño n = 50 se extrae aleatoriamente de la población. Calcule la probabilidad de que la media de la muestra esté entre 1,8 horas y 2,3 horas.
Solución
Supongamos que X = el tiempo, en horas, que se necesita para jugar un partido de fútbol.
La pregunta de probabilidad le pide que calcule una probabilidad para la media de tiempo de la muestra, en horas, que se necesita para jugar un partido de fútbol.
Supongamos que = la media de tiempo, en horas, que se necesita para jugar un partido de fútbol.
Si μX = _________, σX = __________, y n = ~ N(______, ______) por el teorema del límite central para las medias muestrales
μX = 2, σX = 0,5, n = 50, y X ~ N
Calcule P(1,8 < < 2,3). Dibuje un gráfico.
P(1,8 < < 2,3) = 0,9977
normalcdf
= 0,9977
La probabilidad de que la media de tiempo esté entre 1,8 horas y 2,3 horas es de 0,9977.
Inténtelo 7.2
La duración de la prueba SAT para un grupo de estudiantes se distribuye normalmente con una media de 2,5 horas y una desviación típica de 0,25 horas. Una muestra de tamaño n = 60 se extrae aleatoriamente de la población. Calcule la probabilidad de que la media muestral esté entre dos horas y tres horas.
Uso de las calculadoras TI-83, 83+, 84, 84+
Para calcular los percentiles de las medias en la calculadora, siga estos pasos.
2nd DIStR
3:invNorm
k = invNorm
donde:
- k = el percentil k
- la media es la media de la distribución original
- la desviación típica es la desviación típica de la distribución original
- el tamaño de la muestra = n
Ejemplo 7.3
Translation missing: es.problem
En un estudio reciente publicado el 29 de octubre de 2012 en el blog de Flurry, la edad media de los usuarios de tabletas es de 34 años. Supongamos que la desviación típica es de 15 años. Tome una muestra de tamaño n = 100.
- ¿Cuál es la media y la desviación típica de la muestra de edades medias de los usuarios de tabletas?
- ¿Cómo es la distribución?
- Calcule la probabilidad de que la media de edad de la muestra sea superior a 30 años (la media de edad declarada de los usuarios de tabletas en este estudio en particular).
- Calcule el percentil 95 de la edad media de la muestra (con un decimal).
Solución
- Como la media muestral tiende a apuntar a la media poblacional, tenemos μχ = μ = 34. La desviación típica de la muestra viene dada por σχ = = = = 1,5
- El teorema del límite central establece que para tamaños de muestra grandes (n), la distribución de la muestra será aproximadamente normal.
- La probabilidad de que la edad media de la muestra sea superior a 30 años viene dada por =
normalcdf
(30,E99,34;1,5) = 0,9962 - Supongamos que k = el percentil 95.
k = invNorm = 36,5
Inténtelo 7.3
En un artículo del blog de Flurry, se identifica una brecha en el mercadeo del juego para los hombres de entre 30 y 40 años. Investiga un juego de una empresa emergente dirigido al público de 35 años. Su idea es desarrollar un juego de estrategia que puedan jugar hombres de entre 20 y 30 años. Según los datos del artículo, la investigación del sector muestra que el jugador promedio de estrategia tiene 28 años, con una desviación típica de 4,8 años. Se toma una muestra de 100 jugadores seleccionados aleatoriamente. Si su mercado objetivo es de 29 a 35 años, ¿debe seguir con su estrategia de desarrollo?
Ejemplo 7.4
Translation missing: es.problem
El número medio de minutos de participación en la aplicación por parte de un usuario de tableta es de 8,2 minutos. Supongamos que la desviación típica es de un minuto. Tome una muestra de 60.
- ¿Cuál es la media y la desviación típica de la muestra del número de la media de participación en aplicaciones por parte de un usuario de tableta?
- ¿Cuál es el error estándar de la media?
- Calcule el percentil 90 para la media de tiempo de la muestra para la participación en la aplicación para un usuario de la tableta. Interprete este valor en una oración completa.
- Calcule la probabilidad de que la media de la muestra esté entre 8 minutos y 8,5 minutos.
Solución
- Esto nos permite calcular la probabilidad de que las medias muestrales estén a una determinada distancia de la media, en muestras repetidas de tamaño 60.
- Supongamos que k = el percentil 90
k =invNorm
= 8.37. Estos valores indican que el 90 por ciento del tiempo promedio de interacción en la aplicación para los usuarios de la mesa es inferior a 8,37 minutos. - P(X < 5)
< 8,5) =
normalcdf
= 0,9293
Inténtelo 7.4
Las latas de una bebida de cola dicen contener 16 onzas. Se miden las cantidades de una muestra y la estadística es n = 34, = 16,01 onzas. Si las latas se llenan de forma que μ = 16,00 onzas (como se indica en la etiqueta) y σ = 0,143 onzas, halle la probabilidad de que una muestra de 34 latas tenga una cantidad promedio superior a 16,01 onzas. ¿Los resultados sugieren que las latas se llenan con una cantidad superior a las 16 onzas?