Alexander Holmes; Barbara Illowsky; Susan Dean

10.1 Comparación de las medias de dos poblaciones independientes

La comparación de dos medias poblacionales independientes es muy común y proporciona una forma de probar la hipótesis de que los dos grupos difieren entre sí. ¿Es el turno de noche menos productivo que el de día, las tasas de rendimiento de las inversiones en activos fijos son diferentes a las de las inversiones en acciones ordinarias, etc.? Una diferencia observada entre dos medias muestrales depende tanto de las medias como de las desviaciones típicas de la muestra. Pueden producirse medias muy diferentes por azar si hay una gran variación entre cada una de las muestras. El estadístico de prueba tendrá que tener en cuenta este hecho. La prueba que compara dos medias poblacionales independientes con desviaciones típicas poblacionales desconocidas y posiblemente desiguales se denomina prueba t de Aspin-Welch. Aspin-Welch ideó la fórmula de los grados de libertad que veremos más adelante.

Cuando desarrollamos la prueba de hipótesis para la media y las proporciones, comenzamos con el teorema del límite central. Reconocemos que la media muestral procede de una distribución de medias muestrales, y las proporciones muestrales proceden de la distribución muestral de las proporciones muestrales. Esto convirtió nuestros parámetros, las medias y las proporciones muestrales, en variables aleatorias. Era importante para nosotros conocer la distribución de la que procedían estas variables aleatorias. El teorema del límite central nos dio la respuesta: la distribución normal. Nuestras estadísticas Z y t provienen de este teorema. Esto nos proporcionó la solución a nuestra pregunta de cómo medir la probabilidad de que la media muestral provenga de una distribución con un valor hipotético particular de la media o proporción. En ambos casos esa era la pregunta: ¿Cuál es la probabilidad de que la media (o proporción) de nuestros datos muestrales proceda de una distribución poblacional con el valor hipotético que nos interesa?

Ahora nos interesa saber si dos muestras tienen o no la misma media. Nuestra pregunta no ha cambiado: ¿Proceden estas dos muestras de la misma distribución poblacional? Para abordar este problema creamos una nueva variable aleatoria. Reconocemos que tenemos dos medias muestrales: una de cada conjunto de datos. Así, tenemos dos variables aleatorias, procedentes de dos distribuciones desconocidas. Para resolver el problema creamos una nueva variable aleatoria: la diferencia entre las medias muestrales. Dicha variable también tiene una distribución. Nuevamente, el teorema del límite central nos indica que esta nueva distribución se distribuye normalmente, sin importar las distribuciones subyacentes de los datos originales. Un gráfico despejaría este concepto.

Figura 10.2

En la imagen aparecen dos distribuciones de datos, X₁ y X₂, con medias y desviaciones típicas desconocidas. El segundo panel muestra la distribución muestral de la variable aleatoria recién creada ( ${\bar{X}}_{1} - {\bar{X}}_{2}$ ). Esta es la distribución teórica de muchas medias muestrales de la población 1 menos las medias muestrales de la población 2. El teorema del límite central señala que esta distribución muestral teórica de las diferencias de las medias muestrales se distribuye normalmente, sin importar la distribución de los datos reales de la población que se muestran en el panel superior. Dado que la distribución del muestreo se distribuye normalmente, podemos desarrollar una fórmula de estandarización y calcular las probabilidades a partir de la distribución normal estándar del panel inferior, la distribución Z. Ya hemos visto este mismo análisis en la Figura 7.2 del Capítulo 7.

El teorema del límite central, como antes, nos proporciona la desviación típica de la distribución muestral y, además, que el valor previsto de la media de la distribución de las diferencias de las medias muestrales es igual a las diferencias de las medias poblacionales. Matemáticamente, esto se formula de la siguiente manera:

E (µ_{{\bar{x}}_{1}} - µ_{{\bar{x}}_{2}}) = µ_{1} - µ_{2}

Ya que desconocemos las desviaciones típicas de la población, las calculamos con las dos desviaciones típicas de nuestras muestras independientes. En la prueba de hipótesis, calculamos la desviación típica o el error estándar, de la diferencia de las medias muestrales, ${\bar{X}}_{1}$ – ${\bar{X}}_{2}$ .

El error estándar es:

\sqrt{\frac{(s_{1})^{2}}{n_{1}} + \frac{(s_{2})^{2}}{n_{2}}}

Recordemos que la sustitución de la varianza de la muestra por la varianza de la población cuando no teníamos la varianza de la población fue la técnica que utilizamos al construir el intervalo de confianza y el estadístico de prueba para comprobar la hipótesis con respecto a una sola media en Intervalos de confianza y Pruebas de hipótesis con una muestra. El estadístico de prueba (puntuación t) se calcula como sigue:

t_{c} = \frac{({\bar{x}}_{1} - {\bar{x}}_{2}) - δ_{0}}{\sqrt{\frac{{(s_{1})}^{2}}{n_{1}} + \frac{{(s_{2})}^{2}}{n_{2}}}}

donde:

s₁ y s₂, las desviaciones típicas de la muestra, son estimaciones de σ₁ y σ₂, respectivamente, y
σ₁ y σ₂ son las desviaciones típicas desconocidas de la población.
${\bar{x}}_{1}$ y ${\bar{x}}_{2}$ son las medias muestrales. μ₁ y μ₂ son las medias poblacionales desconocidas.

El número de grados de libertad (df) requiere un cálculo algo complicado. Los df no son siempre un número entero. El anterior estadístico de prueba se calcula aproximadamente mediante la distribución t de Student con df de la siguiente manera:

El error estándar es:

d f = \frac{{(\frac{{(s_{1})}^{2}}{n_{1}} + \frac{{(s_{2})}^{2}}{n_{2}})}^{2}}{(\frac{1}{n_{1} - 1}) {(\frac{{(s_{1})}^{2}}{n_{1}})}^{2} + (\frac{1}{n_{2} - 1}) {(\frac{{(s_{2})}^{2}}{n_{2}})}^{2}}

Cuando los tamaños de las muestras n₁ y n₂ son de 30 o más, la aproximación de la t de Student es muy buena. Si cada muestra tiene más de 30 observaciones, los grados de libertad pueden calcularse como n1 + n2 - 2.

El formato de la distribución muestral, las diferencias de medias muestrales, especifica que el formato de las hipótesis nula y alternativa es:

H_{0} : µ_{1} - µ_{2} = δ_{0}

H_{a} : µ_{1} - µ_{2} \neq δ_{0}

donde δ₀ es la diferencia hipotética entre las dos medias. Si la pregunta es simplemente: "¿Hay alguna diferencia entre las medias?", entonces δ₀ = 0 y las hipótesis nula y alternativa pasan a ser:

H_{0} : µ_{1} = µ_{2}

H_{a} : µ_{1} \neq µ_{2}

Un ejemplo de cuándo δ₀ puede no ser cero es cuando la comparación de los dos grupos requiere una diferencia específica para que la decisión sea significativa. Imagine que está haciendo una inversión de capital. Piensa en cambiar su modelo de máquina actual por otro. La productividad de sus máquinas se mide por la velocidad a la que producen el producto. Puede ser que un contendiente para sustituir al modelo antiguo sea más rápido en términos de rendimiento del producto, pero también es más caro. La segunda máquina también puede tener más costes de mantenimiento, de instalación, etc. La hipótesis nula se establecería de forma que la nueva máquina tendría que ser mejor que la antigua en la medida suficiente para cubrir estos costes adicionales en términos de velocidad y coste de producción. Esta forma de las hipótesis nula y alternativa muestra lo valiosa que puede ser esta comprobación de la hipótesis en particular. Para la mayor parte de nuestro trabajo, comprobaremos hipótesis simples al indagar si hay alguna diferencia entre las dos medias de distribución.

Ejemplo 10.1

Grupos independientes

La empresa Kona Iki Corporation produce leche de coco. Toman los cocos, perforan un agujero, extraen la leche y la vierten en una cuba para su procesamiento. Disponen de un turno de día (el turno B) y otro de noche (el turno G) para realizar esta parte del proceso. Les gustaría saber si ambos turnos son igual de eficaces en el procesamiento de los cocos. Se realiza un estudio de muestreo de 9 turnos G y 16 turnos B. Los resultados del número de horas necesarias para procesar 100 libras de cocos se presentan en la Tabla 10.1. Se hace un estudio y se recopilan datos, lo que da como resultado los datos en la Tabla 10.1.

	Tamaño de la muestra	Promedio de horas para procesar 100 libras de cocos	Desviación típica de la muestra
Turno G	9	2	$0,866$
Turno B	16	3,2	1,00

Tabla 10.1

Translation missing: es.problem

¿Existe alguna diferencia en el tiempo medio de cada turno para procesar 100 libras de cocos? Prueba al nivel de significación del 5 %.

Solución

Las desviaciones típicas de la población no se conocen y no se supone que sean iguales. Supongamos que g es el subíndice del turno G y b es el subíndice del turno B. Entonces, μ_g es la media poblacional para el turno G y μ_b es la media poblacional para el turno B. Se trata de una prueba de dos grupos independientes y dos medias poblacionales.

Variable aleatoria: ${\bar{X}}_{g} - {\bar{X}}_{b}$ = diferencia en la media de tiempo de la muestra entre el Turno G y el Turno B para procesar los cocos.
H₀: μ_g = μ_b H₀: μ_g – μ_b = 0
H_a: μ_g ≠ μ_b H_a: μ_g – μ_b ≠ 0
Las palabras “igual que” le dicen que H₀ tiene un “=”. Ya que no hay otras palabras para indicar H_a, es más rápido o más lento. Se trata de una prueba de dos colas.

Distribución para la prueba: Utilice t_df donde df se calcula con la fórmula df para grupos independientes, dos medias poblacionales arriba. Con el empleo de la calculadora, los df son aproximadamente 18,8462.

Gráfico:

Esta es una curva de distribución normal que representa la diferencia en el promedio de tiempo que las niñas y los niños practican deportes durante todo el día. La media es igual a cero, y los valores -1,2, 0 y 1,2 están marcados en el eje horizontal. Dos líneas verticales se extienden desde -1,2 y 1,2 hasta la curva. La región a la izquierda de x = –1,2 y la región a la derecha de x = 1,2 están sombreadas para representar el valor p. El área de cada región es de 0,0028.

Figura 10.3

t_{c} = \frac{({\bar{X}}_{1} - {\bar{X}}_{2}) - δ_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}} + \frac{S_{2}^{2}}{n_{2}}}} = -3,01

A continuación, hallamos el valor crítico en la tabla t con los grados de libertad anteriores. El valor crítico, 2,093, se encuentra en la columna 0,025, es decir, α/2, con 19 grados de libertad. (La convención es redondear los grados de libertad para que la conclusión sea más conservadora). A continuación, calculamos el estadístico de prueba y lo marcamos en el gráfico de la distribución t.

Tome una decisión: Ya que el valor t calculado está en la cola, no podemos aceptar la hipótesis nula de que no hay diferencia entre los dos grupos. Las medias son diferentes.

En el gráfico se incluye la distribución muestral de las diferencias de las medias muestrales para indicar cómo se alinea la distribución t con los datos de la distribución muestral. Vemos en el panel superior que la diferencia calculada en las dos medias es de –1,2 y el panel inferior muestra que es de 3,01 desviaciones típicas a partir de la media. Normalmente no necesitamos mostrar el gráfico de la distribución muestral y nos basamos en el gráfico del estadístico de prueba, la distribución t en este caso, para llegar a nuestra conclusión.

Conclusión: A un nivel de significación del 5 %, los datos de la muestra apuntan a que hay pruebas suficientes para concluir que la media de horas que el turno G tarda en procesar 100 libras de cocos es diferente de la del turno B (la media de horas del turno B es mayor que la del turno G).

NOTA

Cuando la suma de los tamaños de las muestras es mayor que 30 (n₁ + n₂ > 30), se puede utilizar la distribución normal para calcular aproximadamente la t de Student.

Ejemplo 10.2

Se realiza un estudio para determinar si la compañía A conserva a sus trabajadores durante más tiempo que la compañía B. Se cree que la compañía A tiene mayor retención que la compañía B. El estudio determina que el tiempo promedio en una muestra de 11 trabajadores de la compañía A es de cuatro años, con una desviación típica de 1,5 años. Una muestra de 9 trabajadores de la compañía B revela que el promedio del tiempo de permanencia fue de 3,5 años, con una desviación típica de 1 año. Pruebe esta proposición al nivel de significación del 1 %.

Translation missing: es.problem

a. ¿Se trata de una prueba de dos medias o de dos proporciones?

Solución

a. Dos medias porque el tiempo es una variable aleatoria continua.

Translation missing: es.problem

b. ¿Las desviaciones típicas de las poblaciones son conocidas o desconocidas?

Solución

b. desconocidas

Translation missing: es.problem

c. ¿Qué distribución utiliza para realizar la prueba?

Solución

c. t

de Student.

Translation missing: es.problem

d. ¿Cuál es la variable aleatoria?

Solución

d. ${\bar{X}}_{A} - {\bar{X}}_{B}$

Translation missing: es.problem

e. ¿Cuáles son las hipótesis nula y alternativa?

Solución

e

$H_{o} : μ_{A} \leq μ_{B}$
$H_{a} : μ_{A} > μ_{B}$

Translation missing: es.problem

f. ¿Esta prueba es de cola derecha, izquierda o doble?

Solución

f. Prueba de cola derecha.

Se trata de una curva de distribución normal con media igual a 0. Una línea vertical cerca de la cola de la curva a la derecha de cero se extiende desde el eje hasta la curva. La región bajo la curva a la derecha de la línea está sombreada.

Figura 10.4

10.1

Translation missing: es.problem

g. ¿Cuál es el valor del estadístico de prueba?

Solución

$t_{c} = \frac{({\bar{X}}_{1} - {\bar{X}}_{2}) - δ_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}} + \frac{S_{2}^{2}}{n_{2}}}} = 0,89$

Translation missing: es.problem

h. ¿Puede aceptar o rechazar la hipótesis nula?

Solución

h. No se puede rechazar la hipótesis nula de que no hay diferencia entre los dos grupos. El estadístico de prueba no está en la cola. El valor crítico de la distribución t es de 2,764 con 10 grados de libertad. Este ejemplo pone de manifiesto lo difícil que es rechazar una hipótesis nula con una muestra muy pequeña. Los valores críticos requieren estadísticas de la prueba muy grandes para alcanzar la cola.

Translation missing: es.problem

i. Conclusión:

Solución

i. Al nivel de significación del 1 %, a partir de los datos de la muestra, no hay pruebas suficientes para concluir que la retención de los trabajadores en la compañía A sea más grande que la de la compañía B, en promedio.

Ejemplo 10.3

Translation missing: es.problem

Una pregunta interesante de la investigación es el efecto, si es que lo hay, que tienen los diferentes tipos de formatos de enseñanza en las calificaciones de los estudiantes. Para investigar esta cuestión se tomó una muestra de las notas en una clase híbrida y otra muestra de una clase magistral regular. Ambas clases eran para la misma asignatura. La calificación media porcentual para los 35 estudiantes híbridos es de 74, con una desviación típica de 16. La media de las notas de los 40 estudiantes de la clase magistral regular fue del 76 %, con desviación típica de 9. Pruebe al 5 % para ver si hay alguna diferencia significativa en las media de notas entre la clase magistral regular y la clase híbrida.

Solución

Comenzamos por destacar que tenemos dos grupos: estudiantes de una clase híbrida y estudiantes de una clase magistral regular. También observamos que la variable aleatoria, lo que nos interesa, son las notas de los estudiantes, esto es, una variable aleatoria continua. Podríamos haber formulado la pregunta de investigación de otra manera y tener una variable aleatoria binaria. Por ejemplo, podríamos haber estudiado el porcentaje de estudiantes reprobados o con una calificación de A. Ambos serían binarios y, por lo tanto, sería una prueba de proporciones y no una de medias, como es el caso. Por último, no hay ninguna presunción sobre qué formato podría conducir a notas más altas, por lo que la hipótesis se plantea como una prueba de dos colas.

H₀: µ₁ = µ₂
H_a: µ₁ ≠ µ₂

Como ocurre casi siempre, desconocemos las varianzas poblacionales de las dos distribuciones; por ende, nuestro estadístico de prueba es:

t_{c} = \frac{({\bar{x}}_{1} - {\bar{x}}_{2}) - δ_{0}}{\sqrt{\frac{s^{2}}{n_{1}} + \frac{s^{2}}{n_{2}}}} = \frac{(74 - 76) - 0}{\sqrt{\frac{16^{2}}{35} + \frac{9^{2}}{40}}} = –0,65

Para determinar el valor crítico de la t de Student necesitamos los grados de libertad. En este caso utilizamos: df = n1 + n2 – 2 = 35 + 40 –2 = 73. Esto es lo suficientemente grande como para considerarla la distribución normal, por lo que t_a/2 = 1,96. De nuevo, como siempre, determinamos si el valor calculado está en la cola definida por el valor crítico. En este caso, ni siquiera es necesario buscar el valor crítico: el cálculo de la diferencia entre los dos promedios de notas no tiene ni siquiera una desviación típica. Ciertamente no en la cola.

Conclusión: No se puede rechazar la nulidad a α=5 %. Por consiguiente, no existen pruebas que demuestren que las notas de la clase híbrida y las de la clase magistral regular sean diferentes.