Alexander Holmes; Barbara Illowsky; Susan Dean

9.3 Distribución necesaria para la comprobación de la hipótesis

Anteriormente, hemos hablado de las distribuciones muestrales. Las distribuciones particulares se asocian a la comprobación de la hipótesis. Realizaremos comprobaciones de hipótesis de una media poblacional con una distribución normal o una distribución t de Student (recuerde, utilice una distribución t de Student cuando la desviación típica de la población se desconozca y el tamaño de la muestra sea pequeño, donde se considera pequeño a menos de 30 observaciones). Realizamos pruebas de una proporción poblacional mediante una distribución normal cuando podemos suponer que lo sea. Consideramos que esto es cierto si la proporción de la muestra, $p'$ , por el tamaño de la muestra es superior a 5 y 1- $p'$ por el tamaño de la muestra también es mayor que 5. Se trata de la misma regla empírica que utilizamos al desarrollar la fórmula del intervalo de confianza para una proporción poblacional.

Comprobación de la hipótesis para la media

Volviendo a la fórmula de estandarización, podemos derivar el estadístico de prueba para comprobar las hipótesis relativas a las medias.

Z_{c} = \frac{\bar{x} - μ_{0}}{σ / \sqrt{n}}

La fórmula de estandarización no se puede resolver tal cual porque no tenemos μ, la media poblacional. Sin embargo, si sustituimos el valor hipotético de la media, μ₀ en la fórmula anterior, podemos calcular un valor Z. Este es el estadístico de prueba con respecto a la comprobación de la hipótesis para una media y se presenta en la Figura 9.3. Interpretamos este valor Z como la probabilidad asociada de que una muestra con una media muestral de $\bar{X}$ provendría de una distribución con una media poblacional de H₀ y a este valor Z lo llamamos Z_c por “calculado”. Figura 9.3 y Figura 9.4 muestran este proceso.

Figura 9.3

En la Figura 9.3 se presentan dos de los tres resultados posibles. ${\bar{X}}_{1}$ y ${\bar{X}}_{3}$ están en las colas de la distribución hipotética de H₀. Observe que el eje horizontal del panel superior está etiquetado como $\bar{X}$ 's. Esta es la misma distribución teórica de $\bar{X}$ 's, la distribución muestral, que el teorema del límite central nos indica que se distribuye normalmente. Por eso podemos dibujarlo con esta forma. El eje horizontal del panel inferior está etiquetado como Z y es la distribución normal estándar. $Z_{\frac{α}{2}}$ y ${-Z}_{\frac{α}{2}}$ , denominados valores críticos, están marcados en el panel inferior como los valores Z asociados a la probabilidad que el analista haya establecido como nivel de significación en la prueba, (α). Las probabilidades en las colas de ambos paneles son, por tanto, las mismas.

Observe que para cada $\bar{X}$ hay una Z_c asociada, llamada Z calculada, que es el resultado de resolver la ecuación anterior. Esta Z calculada no es más que el número de desviaciones típicas que la media hipotética tiene con respecto a la media muestral. Si la media muestral está a “demasiadas” desviaciones típicas de la media hipotética, concluimos que la media muestral no proviene de la distribución con la media hipotética, dado el nivel de significación requerido. Esto podría venir de H₀, pero se considera demasiado improbable. En la Figura 9.3 tanto ${\overline{X}}_{1}$ y ${\overline{X}}_{3}$ están en las colas de la distribución. Se considera que están “demasiado lejos” del valor hipotético de la media, dado el nivel de alfa elegido. Si en realidad esta media muestral provenía de H₀, pero de la cola, hemos cometido un error de tipo I: hemos rechazado un buen nulo. Nuestro único consuelo real es que conocemos la probabilidad de cometer ese error, α, y podemos controlar el tamaño de α.

La Figura 9.4 muestra la tercera posibilidad para la ubicación de la media muestral, $\overline{x}$ . Aquí la media muestral está dentro de los dos valores críticos. Es decir, dentro de la probabilidad de (1-α) y no podemos rechazar la hipótesis nula.

Figura 9.4

Esto nos da la regla de decisión para comprobar una hipótesis en una prueba de dos colas:

Regla de decisión: prueba de dos colas
Si $\| Z_{c} \|$ < $Z_{\frac{α}{2}}$ : entonces no RECHAZA H₀
Si $\| Z_{c} \|$ > $Z_{\frac{α}{2}}$ : entonces RECHAZA H₀

Tabla 9.3

Esta regla será siempre la misma, sin importar la hipótesis que estemos comprobando o las fórmulas que utilicemos para hacer la prueba. Lo único será cambiar el Z_c por el símbolo apropiado para el estadístico de prueba con respecto al parámetro que se está probando. Expresando la regla de decisión de otra manera: si es improbable que la media muestral provenga de la distribución con la media hipotética, no podemos aceptar la hipótesis nula. Aquí definimos “improbable” como una probabilidad de ocurrir menor que alfa.

Enfoque del valor P

Se puede desarrollar una regla de decisión alternativa al calcular la probabilidad de que se encuentre una media muestral que resulte en un estadístico de prueba mayor que el hallado a partir de los datos de la muestra actual, suponiendo que la hipótesis nula sea verdadera. Aquí, la noción de “probable” e “improbable” se define por la probabilidad de extraer de una población una muestra con una media que hipotéticamente sea mayor o menor que la calculada en los datos de la muestra. En pocas palabras, el enfoque del valor p compara el nivel de significación deseado, α, con el valor p, que es la probabilidad de obtener una media muestral más alejada del valor hipotético que la media muestral real. Un valor p grande calculado a partir de los datos indica que no debemos rechazar la hipótesis nula. Cuanto más pequeño sea el valor p, más improbable es el resultado y más fuerte es la evidencia contra la hipótesis nula. Rechazaremos la hipótesis nula si las pruebas son contundentes en su contra. La relación entre la regla de decisión de comparar los valores calculados del estadístico de prueba, Z_c, y el valor crítico, Z_α, y utilizar el valor p se aprecia en la Figura 9.5.

Figura 9.5

El valor calculado del estadístico de prueba es Z_c en este ejemplo y está marcado en el gráfico inferior de la distribución normal estándar porque es un valor Z. En este caso el valor calculado está en la cola y, por tanto, no podemos aceptar la hipótesis nula, la asociada $\bar{X}$ es demasiado grande para creer que provenga de la distribución con una media de µ₀ y un nivel de significación de α.

Si utilizamos la regla de decisión del valor p, necesitamos un paso más. Tenemos que encontrar en la tabla normalizada la probabilidad asociada al valor calculado del estadístico de prueba, Z_c. A continuación, lo comparamos con el α asociado a nuestro nivel de confianza seleccionado. En la Figura 9.5 vemos que el valor p es menor que α, por lo que no podemos aceptar la nulidad. Sabemos que el valor p es menor que α porque el área bajo el valor p es menor que α/2. Cabe destacar que dos investigadores que extraigan al azar de la misma población pueden calcular dos valores P diferentes en sus muestras. Esto ocurre porque el valor P se calcula como la probabilidad en la cola más allá de la media muestral, asumiendo que la hipótesis nula sea correcta. Dado que las medias muestrales serán con toda probabilidad diferentes, esto creará dos valores P distintos. Sin embargo, las conclusiones en cuanto a la hipótesis nula deberían variar únicamente con el nivel de probabilidad de α.

Esta es una forma sistemática de tomar una decisión sobre si se puede aceptar o rechazar una hipótesis nula si se utiliza el valor p y un α preestablecido o preconcebido (el “nivel de significación”). Un α preestablecido es la probabilidad de un error de tipo I (rechazar la hipótesis nula cuando la hipótesis nula es verdadera). Puede que se le entregue o no al principio del problema. En cualquier caso, el valor de α es decisión del analista. Cuando tome la decisión de rechazar o no rechazar H₀, haga lo siguiente:

Si α > valor p, no se puede aceptar H₀. Los resultados de los datos de la muestra son significativos. Hay pruebas suficientes para concluir que H₀ es una creencia incorrecta y que la hipótesis alternativa, H_a, puede ser correcta.
Si α ≤ valor p, no se puede rechazar H₀. Los resultados de los datos de la muestra son despreciables. No hay pruebas suficientes para concluir que la hipótesis alternativa, H_a, sea correcta. En este caso se mantiene el statu quo.
Cuando “no puede rechazar H₀”, no significa que deba creer que H₀ es verdadera. Significa simplemente que los datos de la muestra no han aportado pruebas suficientes para poner en duda la veracidad de H₀. Recuerde que el nulo es el statu quo y se necesita una alta probabilidad para derrocarlo. Este sesgo a favor de la hipótesis nula es lo que da lugar a la afirmación “tiranía del statu quo” cuando se habla de la comprobación de hipótesis y del método científico.

Ambas reglas de decisión darán lugar a la misma decisión y es cuestión de preferencia cuál se utiliza.

Pruebas de una y dos colas

El estudio de la Figura 9.3 a la Figura 9.5 se basó en las hipótesis nula y alternativa, presentadas en la Figura 9.3. Se denominó prueba de dos colas porque la hipótesis alternativa permitía que la media proviniera de una población mayor o menor que la media hipotética en la hipótesis nula. Esto podría verse mediante el enunciado de la hipótesis alternativa como μ ≠ 100, en este ejemplo.

Puede ser que al analista no le preocupe que el valor sea "demasiado" alto o "demasiado" bajo con respecto al valor hipotético. Si este es el caso, se convierte en una prueba de una cola y toda la probabilidad alfa se coloca en una sola cola y no se divide entre α/2, como en el caso anterior de una prueba de dos colas. Cualquier prueba de un reclamo será una prueba de una cola. Por ejemplo, un fabricante de automóviles afirma que su modelo 17B ofrece un consumo de gasolina superior a 25 millas por galón. Las hipótesis nula y alternativa serían:

H₀: µ ≤ 25
H_a: µ > 25

La afirmación estaría en la hipótesis alternativa. La carga de la prueba en la comprobación de hipótesis recae en la alternativa. Esto se debe a que el no rechazar el nulo, el statu quo, deberá lograrse con un 90 % o 95 % de confianza en que no se pueda mantener. Dicho de otro modo, queremos tener solo un 5 % o 10 % de probabilidad de cometer un error de tipo I, rechazar un buen nulo y derrocar el statu quo.

Esta es una prueba de una cola, donde toda la probabilidad alfa se coloca en una sola cola y no se divide entre α/2, como en el caso anterior de la prueba de dos colas.

La Figura 9.6 muestra los dos casos posibles y la forma de las hipótesis nula y alternativa que los origina.

Figura 9.6

donde μ₀ es el valor hipotético de la media poblacional.

Tamaño de la muestra	Estadístico de prueba
< 30 (σ desconocido)	$t_{c} = \frac{\bar{X} - μ_{0}}{s / \sqrt{n}}$
< 30 (σ conocido)	$Z_{c} = \frac{\bar{X} - μ_{0}}{σ / \sqrt{n}}$
> 30 (σ desconocido)	$Z_{c} = \frac{\bar{X} - μ_{0}}{s / \sqrt{n}}$
> 30 (σ conocido)	$Z_{c} = \frac{\bar{X} - μ_{0}}{σ / \sqrt{n}}$

Tabla 9.4 Estadísticas para la prueba de medias, tamaño de muestra variable, desviación típica de la población conocida o desconocida

Efectos del tamaño de la muestra en el estadístico de prueba

Al desarrollar los intervalos de confianza para la media de una muestra, encontramos que la mayoría de las veces no tenemos la desviación típica de la población, σ. Si el tamaño de la muestra fuera inferior a 30, podríamos sustituir simplemente la estimación puntual de σ, la desviación típica de la muestra, s, y utilizar la distribución t de Student para corregir esta falta de información.

A la hora de comprobar las hipótesis nos topamos con este mismo problema y la solución es exactamente igual. A saber: Si se desconoce la desviación típica de la población y el tamaño de la muestra es inferior a 30, sustituya s, la estimación puntual de la desviación típica de la población, σ, en la fórmula del estadístico de prueba y utilice la distribución t de Student. Todas las fórmulas y figuras anteriores no cambian, excepto esta sustitución y el cambio de la distribución Z por la distribución t de Student en el gráfico. Recuerde que la distribución t de Student solo puede calcularse si se conocen los grados de libertad adecuados para el problema. En este caso, los grados de libertad se calculan como antes con intervalos de confianza: df = (n-1). El valor t calculado se compara con el valor t asociado al nivel de confianza preestablecido y que se requiere en la prueba, t_α, _df, que se encuentra en las tablas t de Student. Si no conocemos σ, pero el tamaño de la muestra es de 30 o más, simplemente sustituimos s por σ y utilizamos la distribución normal.

La Tabla 9.4 resume estas normas.

Un enfoque sistemático para comprobar una hipótesis

Un enfoque sistemático de las pruebas de hipótesis sigue los siguientes pasos y en este orden. Esta plantilla servirá para todas las hipótesis que se pongan a prueba.

Establezca las hipótesis nula y alternativa. Esta suele ser la parte más difícil del proceso. Aquí se revisa la cuestión planteada. Qué parámetro se está probando, una media, una proporción, diferencias de medias, etc. ¿Es una prueba de una cola o de dos colas?
Decida el nivel de significación requerido para este caso particular y determine el valor crítico. Estos se pueden encontrar en la tabla estadística correspondiente. Los niveles de confianza típicos de las empresas son 80 %, 90 %, 95 %, 98 % y 99 %. Sin embargo, el nivel de significación es una decisión política y debería basarse en el riesgo de cometer un error de tipo I y rechazar un buen nulo. Considere las consecuencias de cometer un error de tipo I.
A continuación, sobre la base de las hipótesis y el tamaño de la muestra, seleccione la estadística adecuada de la prueba y calcule el valor crítico pertinente: Z_α, t_α, etc. Dibujar la distribución de probabilidad correspondiente y marcar el valor crítico es siempre de gran ayuda. Haga coincidir el gráfico con la hipótesis, especialmente si se trata de una prueba de una cola.
Tome una o varias muestras y calcule los parámetros pertinentes: media muestral, desviación típica o proporción. Con base en la fórmula del paso 2, calcule ahora el estadístico de prueba para este caso en particular; utilice los parámetros que acaba de calcular.
Compare el valor calculado del estadístico de prueba y el valor crítico. Si se marcan en el gráfico, se obtendrá una buena imagen visual de la situación. Ahora solo hay dos situaciones:
1. El estadístico de prueba está en la cola: no se puede aceptar el nulo, la probabilidad de que esta media muestral (proporción) provenga de la distribución hipotética es demasiado pequeña para creer que sea el verdadero origen de estos datos muestrales.
2. El estadístico de prueba no está en la cola: no se puede rechazar el nulo. los datos de la muestra son compatibles con el parámetro poblacional hipotético.
Llegue a una conclusión. Es mejor articular la conclusión de dos maneras diferentes. En primer lugar, una conclusión estadística formal como: "Con un nivel de significación del 5 %, no podemos aceptar las hipótesis nulas de que la media de la población es igual a XX (unidades de medida)". El segundo enunciado de la conclusión es menos formal y enuncia la acción, o la falta de acción, requerida. Si la conclusión formal era la anterior, la informal podría ser: "La máquina está estropeada y hay que apagarla y mandarla a reparar".

Todas las hipótesis probadas pasarán por este mismo proceso. Los únicos cambios son las fórmulas pertinentes y estas están determinadas por la hipótesis necesaria para responder la pregunta original.