Objetivos del capítulo
Al final de este capítulo el estudiante podrá:
- Reconocer los problemas del teorema central del límite.
- Clasificar los problemas de palabras continuas por sus distribuciones.
- Aplicar e interpretar el teorema del límite central para las medias.
- Aplicar e interpretar el teorema del límite central para las sumas.
¿Por qué nos preocupan tanto las medias? Hay dos razones: nos dan un punto medio de comparación y son fáciles de calcular. En este capítulo estudiará las medias y el teorema del límite central.
El teorema del límite central (central limit theorem, TLC) es una de las ideas más poderosas y útiles de toda la estadística. Hay dos formas alternativas del teorema, y ambas alternativas se refieren a la extracción de muestras finitas de tamaño n de una población con una media conocida, μ, y una desviación típica conocida, σ. La primera alternativa indica que si recogemos muestras de tamaño n con una "n suficientemente grande", calculamos la media de cada muestra y creamos un histograma de esas medias, entonces el histograma resultante tenderá a tener una forma de campana normal aproximada. La segunda alternativa indica que si volvemos a recoger muestras de tamaño n que sean "suficientemente grandes", calculamos la suma de cada muestra y creamos un histograma, entonces el histograma resultante volverá a tener una forma de campana normal.
El tamaño de la muestra, n, que se requiere para ser “suficientemente grande” depende de la población original de la que se extraen las muestras (el tamaño de la muestra debe ser, al menos, 30 o los datos deben proceder de una distribución normal). Si la población original está lejos de ser normal, se necesitan más observaciones para que las medias o sumas de la muestra sean normales. El muestreo se realiza con sustitución.
Sería difícil exagerar la importancia del teorema del límite central en la teoría estadística. Saber que los datos, aunque su distribución no sea normal, se comportan de forma predecible es una herramienta poderosa.
Ejercicio colaborativo
Supongamos que ocho de ustedes tiran un dado justo diez veces, siete de ustedes tiran dos dados justos diez veces, nueve de ustedes tiran cinco dados justos diez veces y 11 de ustedes tiran diez dados justos diez veces.
Cada vez que una persona tira más de un dado, calcule la media muestral de las caras que aparecen. Por ejemplo, una persona puede tirar cinco dados justos y obtener 2, 2, 3, 4, 6 en una tirada.
La media es = 3,4. El 3,4 es una media cuando se tiran cinco dados justos. Esta misma persona lanzaría los cinco dados nueve veces más y calcularía otras nueve medias para un total de diez medias.
Su instructor repartirá los dados entre varias personas. Tire los dados diez veces. Para cada tiro, anote las caras y halle la media. Redondee al 0,5 más cercano.
Su instructor (y posiblemente usted) dibujará un gráfico (puede ser un histograma) para un dado, un gráfico para dos dados, un gráfico para cinco dados y un gráfico para diez dados. Dado que la "media" al lanzar un dado es solo la cara de este, ¿qué distribución parecen representar estas medias?
Dibuje el gráfico de las medias utilizando dos dados. ¿Las medias de las muestras muestran algún tipo de patrón?
Dibuje el gráfico de las medias utilizando cinco dados. ¿Ve algún patrón emergente?
Por último, dibuje el gráfico de las medias utilizando diez dados. ¿Ve algún patrón en el gráfico? ¿Qué puede concluir al aumentar el número de dados?
A medida que el número de dados lanzados aumenta de uno a dos y de cinco a diez, ocurre lo siguiente:
- La media de las medias de las muestras sigue siendo aproximadamente la misma.
- La dispersión de las medias muestrales (la desviación típica de las medias muestrales) se reduce.
- El gráfico parece más inclinado y delgado.
Acaba de demostrar el teorema del límite central (TLC).
El teorema del límite central indica que, a medida que aumenta el número de dados, las medias de las muestras tienden a una distribución normal (la distribución de muestreo).