El propósito de una prueba de ANOVA de una vía es determinar la existencia de una diferencia estadísticamente significativa entre las medias de varios grupos. De hecho, la prueba usa varianzas para ayudar a determinar si las medias son iguales o no. Para realizar una prueba de ANOVA de una vía hay que cumplir cinco supuestos básicos:
- Se supone que cada población de la que se toma una muestra es normal.
- Todas las muestras se seleccionan al azar y son independientes.
- Se supone que las poblaciones tienen desviaciones típicas iguales (o varianzas).
- El factor es una variable categórica.
- La respuesta es una variable numérica.
Hipótesis nula y alternativa
La hipótesis nula es simplemente que todas las medias poblacionales del grupo son iguales. La hipótesis alternativa es que, al menos, un par de medias es diferente. Por ejemplo, si hay grupos k:
H0: μ1 = μ2 = μ3 = ... = μk
Ha: Al menos dos de las medias del grupo μ1, μ2, μ3, ..., μk no son iguales. Es decir, μi ≠ μj para algún i ≠ j.
Los gráficos, un conjunto de diagramas de caja y bigotes que representan la distribución de los valores con las medias de los grupos indicadas por una línea horizontal que atraviesa la caja, ayudan a comprender la prueba de hipótesis. En el primer gráfico (diagrama de caja y bigotes rojo), H0: μ1 = μ2 = μ3 y las tres poblaciones tienen la misma distribución si la hipótesis nula es verdadera. La varianza de los datos combinados es, aproximadamente, igual a la varianza de cada una de las poblaciones.
Si la hipótesis nula es falsa, la varianza de los datos combinados es mayor, lo que se debe a las diferentes medias, como se muestra en el segundo gráfico (diagrama de caja verde).