8.1 La media de una población utilizando la distribución normal
En este módulo hemos aprendido a calcular el intervalo de confianza para una media poblacional única cuando se conoce la desviación típica de la población. Al estimar una media poblacional, el margen de error se denomina límite de error para una media poblacional (EBM). Un intervalo de confianza tiene la forma general:
(límite inferior, límite superior) = (estimación puntual - EBM, estimación puntual + EBM)
El cálculo de EBM depende del tamaño de la muestra y del nivel de confianza deseado. El nivel de confianza es el porcentaje de todas las muestras posibles que se puede esperar que incluyan el verdadero parámetro de la población. A medida que aumenta el nivel de confianza, aumenta también el EBM correspondiente. A medida que aumenta el tamaño de la muestra, el EBM disminuye. Por el teorema del límite central,
Dado un intervalo de confianza, se puede hacer el cálculo a la inversa para hallar el límite de error (EBM) o la media de la muestra. Para calcular el límite de error, halle la diferencia del límite superior del intervalo y la media. Si no conoce la media de la muestra, puede hallar el límite de error calculando la mitad de la diferencia de los límites superior e inferior. Para hallar la media muestral dado un intervalo de confianza, calcule la diferencia del límite superior y el límite de error. Si se desconoce el límite de error, se promedian los límites superior e inferior del intervalo de confianza para hallar la media muestral.
A veces, los investigadores saben de antemano que quieren estimar una media poblacional dentro de un margen de error específico para un nivel de confianza dado. En ese caso, resuelva la fórmula EBM para n para descubrir el tamaño de la muestra que se necesita para lograr este objetivo:
8.2 La media de una población utilizando la distribución t de Student
En muchos casos, el investigador no conoce la desviación típica de la población, σ, de la medida estudiada. En estos casos, es habitual utilizar la desviación típica de la muestra, s, como estimación de σ. La distribución normal crea intervalos de confianza precisos cuando se conoce σ, pero no es tan precisa cuando se utiliza s como estimación. En este caso, la distribución t de Student es mucho mejor. Defina una puntuación t mediante la siguiente fórmula:
La puntuación t sigue la distribución t de Student con n – 1 grados de libertad. El intervalo de confianza bajo esta distribución se calcula con EBM = donde es la puntuación t con un área a la derecha igual a , s es la desviación típica de la muestra y n es el tamaño de la muestra. Utilice una tabla, una calculadora o una computadora para hallar para una α determinada.
8.3 Una proporción de la población
Algunas medidas estadísticas, como muchas preguntas de las encuestas, miden datos cualitativos en vez de cuantitativos. En este caso, el parámetro poblacional que se estima es una proporción. Es posible crear un intervalo de confianza para la verdadera proporción de la población siguiendo procedimientos similares a los utilizados para crear intervalos de confianza para las medias de la población. Las fórmulas son ligeramente diferentes, pero siguen el mismo razonamiento.
Supongamos que p′ representa la proporción de la muestra, x/n, donde x representa el número de aciertos y n el tamaño de la muestra. Supongamos que q′ = 1 – p′. Entonces el intervalo de confianza para una proporción poblacional viene dado por la siguiente fórmula:
(límite inferior, límite superior)
El método "más cuatro" para calcular los intervalos de confianza es un intento de equilibrar el error introducido al utilizar las estimaciones de la proporción de la población cuando se calcula la desviación típica de la distribución de muestreo. Imaginemos simplemente cuatro ensayos adicionales en el estudio; dos son aciertos y dos son fallos. Calcule , y proceder a calcular el intervalo de confianza. Cuando el tamaño de las muestras es pequeño, se ha demostrado que este método proporciona intervalos de confianza más precisos que la fórmula estándar utilizada para muestras más grandes.