En la mayoría de los casos de datos económicos o empresariales tenemos poco o ningún control sobre la recopilación de los datos. En este sentido, los datos no son el resultado de un experimento controlado y planificado. Sin embargo, en algunos casos podemos generar datos que forman parte de un experimento controlado. Esto se da con frecuencia en situaciones de control de calidad. Imagine que las tasas de producción de dos máquinas construidas con el mismo diseño, pero en diferentes plantas de fabricación, se prueban para detectar diferencias en algún sistema de medición de la producción, como la velocidad de salida o el cumplimiento con alguna especificación, como la resistencia del producto. La prueba tiene el mismo formato que la que hemos estado probando, pero aquí podemos tener pares emparejados para los que podemos verificar si existen diferencias. Cada observación tiene su par emparejado con el que se calculan las diferencias. En primer lugar, hay que calcular las diferencias del indicador que se va a probar entre las dos listas de observaciones, lo que se suele etiquetar con la letra "d". A continuación, el promedio de estas diferencias emparejadas, se calcula al igual que su desviación típica, Sd. Esperamos que la desviación típica de las diferencias de los pares emparejados sea menor que la de los pares no emparejados porque presumiblemente deberían existir menos diferencias debido a la correlación entre los dos grupos.
Cuando se utiliza una prueba de hipótesis para muestras emparejadas o pareadas, pueden darse las siguientes características:
- Se utiliza un muestreo aleatorio simple.
- El tamaño de las muestras suele ser pequeño.
- Se toman dos medidas (muestras) del mismo par de personas u objetos.
- Las diferencias se calculan a partir de las muestras coincidentes o emparejadas.
- Las diferencias forman la muestra que se utiliza para la prueba de hipótesis.
- O bien los pares coincidentes tienen diferencias que provienen de una población que es normal o el número de diferencias es lo suficientemente grande como para que la distribución de la media muestral de las diferencias sea aproximadamente normal.
En una prueba de hipótesis para muestras coincidentes o emparejadas los sujetos son coincidentes en pares y se calculan las diferencias. Las diferencias son los datos. A continuación, la media poblacional de las diferencias, μd, se verifica con la prueba t de Student para una única media poblacional con n – 1 grados de libertad, donde n es el número de diferencias, es decir, el número de pares, no el número de observaciones.
Ejemplo 10.9
Translation missing: es.problem
Una compañía ha desarrollado un programa de formación para sus nuevos empleados porque le preocupa los resultados de la revisión semestral de los empleados. Esperan que el programa de formación dé lugar a mejores revisiones semestrales. Cada aprendiz constituye un "par", la puntuación de entrada que el empleado recibió al ingresar en la empresa y la puntuación otorgada en la revisión de los seis meses. Se calculó la diferencia de las dos puntuaciones de cada empleado y se calcularon las medias de antes y después del programa de formación. La media muestral antes del programa de formación era de 20,4 y la media muestral después del programa de formación fue de 23,9. La desviación típica de las diferencias entre las dos puntuaciones de los 20 empleados fue de 3,8 puntos. Compruebe al nivel de significación del 10 % la hipótesis nula de que las dos medias poblacionales son iguales frente a la alternativa de que el programa de formación mejora las puntuaciones de los empleados.
Solución
El primer paso es identificar este caso como de dos muestras: antes y después de la formación. Esto diferencia este problema de los simples problemas de una muestra. En segundo lugar, determinamos que las dos muestras están "emparejadas". Cada observación de la primera muestra tiene una observación emparejada en la segunda muestra. Esta información nos revela que las hipótesis nula y alternativa deberían ser:
Esta forma refleja la afirmación implícita de que el curso de formación mejora las puntuaciones; la prueba es de una cola y la afirmación está en la hipótesis alternativa. Dado que el experimento se llevó a cabo como una muestra emparejada, en lugar de tomar simplemente las puntuaciones de las personas que realizaron el curso de formación de las que no lo hicieron, utilizamos el estadístico de prueba de pares emparejados:
Para resolver esta ecuación, hay que utilizar cada una las puntuaciones, el curso previo a la formación y el curso posterior a la formación para calcular cada una de las diferencias. A continuación, se promedian estas puntuaciones y se calcula la diferencia promedio:
A partir de estas diferencias podemos calcular la desviación típica de cada una de las diferencias:
Ahora podemos comparar el valor calculado del estadístico de prueba, 4,12, con el valor crítico. El valor crítico es una t de Student con grados de libertad iguales al número de pares, no de observaciones, menos 1. En este caso 20 pares y con un nivel de confianza del 90% ta/2 = ±1,729 con df = 20 - 1 = 19. El valor calculado del estadístico de prueba se encuentra con toda seguridad en la cola de la distribución; por ende, no podemos aceptar la hipótesis nula de que no hay diferencias con el programa de formación. Las pruebas parecen indicar que la formación permite a los empleados a obtener mejores puntuaciones.
Ejemplo 10.10
Translation missing: es.problem
Se realizó un estudio para investigar la eficacia del hipnotismo en la reducción del dolor. Los resultados de los sujetos seleccionados al azar se muestran en la Tabla 10.5. Una calificación más baja indica menos dolor. El valor “antes” se compara con un valor “después” y se calculan las diferencias. ¿Las medidas sensoriales son, en promedio, más bajas después del hipnotismo? Pruebe con un nivel de significación del 5 %.
Sujeto: | A | B | C | D | E | F | G | H |
---|---|---|---|---|---|---|---|---|
Antes | 6,6 | 6,5 | 9,0 | 10,3 | 11,3 | 8,1 | 6,3 | 11,6 |
Después | 6,8 | 2,4 | 7,4 | 8,5 | 8,1 | 6,1 | 3,4 | 2,0 |
Solución
Los valores correspondientes de “antes” y “después” forman pares coincidentes (calcule “después” – “antes”).
Datos de “Después” | Datos de “Antes” | Diferencia |
---|---|---|
6,8 | 6,6 | 0,2 |
2,4 | 6,5 | -4,1 |
7,4 | 9 | -1,6 |
8,5 | 10,3 | -1,8 |
8,1 | 11,3 | -3,2 |
6,1 | 8,1 | -2 |
3,4 | 6,3 | -2,9 |
2 | 11,6 | -9,6 |
Los datos para la prueba son las diferencias: {0,2; –4,1; –1,6; –1,8; –3,2; –2; –2,9; –9,6}
La media muestral y la desviación típica de la muestra de las diferencias son: y Verifique estos valores.
Supongamos que es la media poblacional de las diferencias. Utilizamos el subíndice para denotar “diferencias”.
Variable aleatoria: = la diferencia media de las mediciones sensoriales
H0: μd ≥ 0
La hipótesis nula es cero o positiva, lo que significa que se siente el mismo o más dolor después del hipnotismo. Eso significa que el sujeto no muestra ninguna mejora (μd es la media poblacional de las diferencias).
Ha: μd < 0
La hipótesis alternativa es negativa, lo que significa que se siente menos dolor después del hipnotismo. Eso significa que el sujeto muestra una mejora. La calificación debería ser menor después del hipnotismo, por lo que la diferencia debería ser negativa para indicar una mejora.
Distribución para la prueba: La distribución es una t de Student con df = n – 1 = 8 – 1 = 7. Use t7 (observe que la prueba es para una única media poblacional)
Calcule el estadístico de prueba y busque el valor crítico con la distribución t de Student: El valor calculado del estadístico de prueba es 3,06 y el valor crítico de la distribución t con 7 grados de libertad al nivel de confianza del 5 % es 1,895 con una prueba de una cola.
es la variable aleatoria de las diferencias.
La media muestral y la desviación típica de la muestra de las diferencias son:
= -3,13
= 2,91
Compare el valor crítico de alfa con el valor calculado del estadístico de prueba.
La conclusión de utilizar la comparación del valor calculado del estadístico de prueba y el valor crítico nos dará el resultado. En esta pregunta, el valor calculado del estadístico de prueba es 3,06 y el valor crítico es 1,895. Obviamente, el estadístico de prueba está en la cola; así, no podemos aceptar las hipótesis nulas de que no hay diferencia entre las dos situaciones: hipnotizados y no hipnotizados.
Tome una decisión: No se puede aceptar la hipótesis nula, H0. Esto significa que μd < 0 y que hay una mejora estadísticamente significativa.
Conclusión: A un nivel de significación del 5 %, a partir de los datos de la muestra, hay pruebas suficientes para concluir que las mediciones sensoriales, en promedio, son más bajas después del hipnotismo. El hipnotismo parece ser eficaz para reducir el dolor.
Ejemplo 10.11
Un entrenador de fútbol universitario estaba interesado en saber si la clase de desarrollo de fuerza del instituto universitario aumentaba el levantamiento máximo (en libras) de sus jugadores en el ejercicio de empuje en banca. Les pidió a cuatro de sus jugadores que participaran en un estudio. La cantidad de peso que podía levantar cada uno se registró antes de que tomaran la clase de desarrollo de fuerza. Tras completar la clase, se midió de nuevo la cantidad de peso que podía levantar cada uno. Los datos son los siguientes:
Peso (en libras) | Jugador 1 | Jugador 2 | Jugador 3 | Jugador 4 |
---|---|---|---|---|
Cantidad de peso levantado antes de la clase | 205 | 241 | 338 | 368 |
Cantidad de peso levantado después de la clase | 295 | 252 | 330 | 360 |
El entrenador quiere saber si la clase de desarrollo de fuerza hace que sus jugadores sean más fuertes, en promedio.
Registre los datos de las diferencias. Para calcular las diferencias reste la cantidad de peso levantado antes de la clase del peso levantado después de terminar la clase. Los datos de las diferencias son: {90, 11, –8, –8}.
= 21,3, sd = 46,7
Utilizando los datos de diferencia, esto se convierte en una prueba de una sola media.
Defina la variable aleatoria: diferencia media en la elevación máxima por jugador.
La distribución para la prueba de hipótesis es una t de Student con 3 grados de libertad.
H0: μd ≤ 0, Ha: μd > 0
Busque el valor calculado del estadístico de prueba y el valor crítico: El valor crítico del estadístico de prueba es 0,91. El valor crítico de la t de Student a un nivel de significación del 5 % y 3 grados de libertad es de 2,353.
Decisión: Si el nivel de significación es del 5 %, no podemos rechazar la hipótesis nula, porque el valor calculado del estadístico de prueba no está en la cola.
¿Cuál es la conclusión?
A un nivel de significación del 5 %, a partir de los datos de la muestra, no hay pruebas suficientes para concluir que la clase de desarrollo de fuerza ayudó a hacer más fuertes a los jugadores, en promedio.