¿Por qué nos preocupan tanto las medias? Hay dos razones: nos dan un punto medio de comparación y son fáciles de calcular. En este capítulo, estudiará las medias y el teorema del límite central.
El teorema del límite central es una de las ideas más poderosas y útiles de toda la estadística. El teorema central del límite es un teorema, lo que significa que NO es una teoría o simplemente la idea de alguien sobre cómo funcionan las cosas. Como teorema, está a la altura del teorema de Pitágoras, o el teorema que nos dice que la suma de los ángulos de un triángulo debe sumar 180. Son hechos de las formas del mundo rigurosamente demostrados con precisión matemática y lógica. Como veremos, este poderoso teorema determinará lo que podemos y no podemos decir en la estadística inferencial. El teorema del límite central se ocupa de extraer muestras finitas de tamaño n de una población con una media conocida, μ, y una desviación típica conocida, σ. La conclusión es que si recogemos muestras de tamaño n con un "n suficientemente grande", calculamos la media de cada muestra y creamos un histograma (distribución) de esas medias, la distribución resultante tenderá a tener una distribución normal aproximada.
El resultado asombroso es que no importa cuál es la distribución de la población original, ni siquiera es necesario conocerla. El hecho importante es que la distribución de las medias muestrales tiende a seguir la distribución normal.
El tamaño de la muestra, n, que se requiere para ser “suficientemente grande” depende de la población original de la que se extraen las muestras (el tamaño de la muestra debe ser, al menos, 30 o los datos deben proceder de una distribución normal). Si la población original está lejos de la normal, se necesitan más observaciones para las medias de la muestra. El muestreo se realiza de forma aleatoria y con reemplazo en el modelo teórico.