Estos son algunos datos sobre la distribución F.
- La curva no es simétrica, sino que está distorsionada hacia la derecha.
- Hay una curva diferente para cada conjunto de df.
- El estadístico F es mayor o igual a cero.
- A medida que aumentan los grados de libertad del numerador y del denominador, la curva se normaliza.
- Otros usos de la distribución F incluyen la comparación de dos varianzas y el análisis de varianza bidireccional. El análisis bidireccional queda fuera del alcance de este capítulo.
Ejemplo 13.2
Translation missing: es.problem
Volvamos al ejercicio de los tomates bola en la sección INTÉNTELO 13.1. Las medias de los rendimientos de los tomates en las cinco condiciones de cubierta están representadas por μ1, μ2, μ3, μ4, μ5. Realizaremos una prueba de hipótesis para determinar si todas las medias son iguales o al menos una es diferente. Use un nivel de significación del 5 % y pruebe la hipótesis nula de que no hay diferencia en los rendimientos medios entre los cinco grupos contra la hipótesis alternativa de que, al menos, una media es diferente del resto.
Solución
Las hipótesis nula y alternativa son:
H0: μ1 = μ2 = μ3 = μ4 = μ5
Ha: μi ≠ μj alguna i ≠ j
Los resultados del ANOVA de una vía se muestran en la Figura 13.5
Fuente de variación | Suma de los cuadrados (SS) | Grados de libertad (df) | Media cuadrática (Mean Square, MS) | F |
---|---|---|---|---|
Factor (entre) | 36.648.561 | 5 – 1 = 4 | ||
Error (dentro) | 20.446.726 | 15 – 5 = 10 | ||
Total | 57.095.287 | 15 – 1 = 14 |
Distribución para la prueba: F4, 10
df(num) = 5 – 1 = 4
df(denom) = 15 – 5 = 10
Estadístico de prueba: F = 4,4810
Declaración de probabilidad: valor p = P(F > 4,481) = 0,0248.
Compare α y el valor p: α = 0,05, valor p = 0,0248
Tome una decisión: Dado que α > valor p, rechazamos H0.
Conclusión: Al nivel de significación del 5 % tenemos pruebas razonablemente sólidas de que las diferencias en los rendimientos medios de las plantas de tomate de corte cultivadas en diferentes condiciones de cubierta de suelo es poco probable que se deban únicamente al azar. Podemos concluir que, al menos, algunas de las cubiertas produjeron diferentes rendimientos medios.
Uso de las calculadoras TI-83, 83+, 84, 84+
Para calcular estos resultados en la calculadora:
Pulse STAT. Pulse 1:EDIT. Introduzca los datos en las listas L1, L2, L3, L4, L5.
Pulse STAT, y la flecha hacia TESTS, y la flecha abajo hacia ANOVA. Pulse ENTER, y a continuación introduzca L1, L2, L3, L4, L5). Pulse ENTER. Verá que la calculadora arroja fácilmente los valores de la tabla ANOVA anterior, incluso el estadístico de prueba y el valor p.
La calculadora muestra:
F = 4,4810
p = 0,0248 (valor p)
Factor
df = 4
SS = 36648560,9
MS = 9162140,23
Error
df = 10
SS = 20446726
MS = 2044672,6
Inténtelo 13.2
El SARM, o Staphylococcus aureus resistente a la meticilina, puede causar una grave infección bacteriana en pacientes del hospital. La Tabla 13.6 muestra varios recuentos de colonias de diferentes pacientes que pueden o no tener SARM. Los datos de la tabla se representan en la Figura 13.5.
Conc. = 0,6 | Conc. = 0,8 | Conc. = 1,0 | Conc. = 1,2 | Conc. = 1,4 |
---|---|---|---|---|
9 | 16 | 22 | 30 | 27 |
66 | 93 | 147 | 199 | 168 |
98 | 82 | 120 | 148 | 132 |
Gráfico de los datos para las diferentes concentraciones:
Compruebe si el número medio de colonias es igual o es diferente. Construya la tabla de ANOVA (a mano o con las calculadoras TI-83, 83+ u 84+), calcule el valor p y exponga su conclusión. Utilice un nivel de significación del 5 %.
Ejemplo 13.3
Cuatro hermandades de mujeres tomaron una muestra aleatoria de hermanas en relación con su media de calificaciones para el último trimestre. Los resultados se indican en la Tabla 13.7.
Hermandad 1 | Hermandad 2 | Hermandad 3 | Hermandad 4 |
---|---|---|---|
2,17 | 2,63 | 2,63 | 3,79 |
1,85 | 1,77 | 3,78 | 3,45 |
2,83 | 3,25 | 4,00 | 3,08 |
1,69 | 1,86 | 2,55 | 2,26 |
3,33 | 2,21 | 2,45 | 3,18 |
Translation missing: es.problem
Utilizando un nivel de significación del 1 %, ¿existe una diferencia en las notas medias entre las hermandades?
Solución
Supongamos que μ1, μ2, μ3, μ4 son las medias poblacionales de las hermandades de mujeres. Recuerde que la hipótesis nula afirma que los grupos de hermandades de mujeres proceden de la misma distribución normal. La hipótesis alternativa dice que, al menos, dos de los grupos de hermandades de mujeres proceden de poblaciones con distribuciones normales diferentes. Observe que los cuatro tamaños de muestra son cinco cada uno.
Nota
Este es un ejemplo de diseño equilibrado, ya que cada factor (es decir, la hermandad) tiene el mismo número de observaciones.
H0: μ1 = μ2 = μ3 = μ4
Ha: No todas las medias μ1, μ2, μ3, μ4 son iguales.
Distribución para la prueba: F3,16
donde k = 4 grupos y n = 20 muestras en total
df(num)= k – 1 = 4 – 1 = 3
df(denom) = n – k = 20 – 4 = 16
Calcule el estadístico de prueba: F = 2,23
Gráfico:
Declaración de probabilidad: valor p = P(F > 2,23) = 0,1241
Compare α y el valor p: α = 0,01
valor p = 0,1241
α < valor p
Tome una decisión: Como α < valor p, no se puede rechazar H0.
Conclusión: No hay pruebas suficientes para concluir que existe una diferencia entre las notas medias de las hermandades de mujeres.
Uso de las calculadoras TI-83, 83+, 84, 84+
Introduzca los datos en las listas L1, L2, L3, and L4. Pulse STAT
y flecha hacia TESTS
. Flecha hacia abajo F:ANOVA
. Pulse ENTER
e introduzca (L1,L2,L3,L4
).
La calculadora muestra la estadística F, el valor p y los valores de la tabla ANOVA de una vía:
F = 2,2303
p = 0,1241 (valor p)
Factor
df = 3
SS = 2,88732
MS = 0,96244
Error
df = 16
SS = 6,9044
MS = 0,431525
Inténtelo 13.3
Cuatro equipos deportivos tomaron una muestra aleatoria de jugadores en relación con su GPA del año pasado. Los resultados se indican en la Tabla 13.8.
Baloncesto | Béisbol | Hockey | Lacrosse |
---|---|---|---|
3,6 | 2,1 | 4,0 | 2,0 |
2,9 | 2,6 | 2,0 | 3,6 |
2,5 | 3,9 | 2,6 | 3,9 |
3,3 | 3,1 | 3,2 | 2,7 |
3,8 | 3,4 | 3,2 | 2,5 |
Use un nivel de significación del 5 % y determine si existe una diferencia en el GPA entre los equipos.
Ejemplo 13.4
Una clase de cuarto grado está estudiando el ambiente. Una de las tareas consiste en cultivar plantas de judías en diferentes suelos. Tommy eligió cultivar sus plantas de judías en la tierra que encontró fuera de su aula mezclada con pelusa de secadora. Tara decidió cultivar sus plantas de judías en tierra para macetas comprada en el vivero local. Nick decidió cultivar sus plantas de judías en la tierra del jardín de su madre. No se utilizó ningún producto químico en las plantas, solo agua. Se cultivaron en el interior del aula junto a un gran ventanal. Cada niño cultivó cinco plantas. Al final del periodo de crecimiento se midió cada planta y se obtuvieron los datos (en pulgadas) que están en la Tabla 13.9.
Plantas de Tommy | Plantas de Tara | Plantas de Nick |
---|---|---|
24 | 25 | 23 |
21 | 31 | 27 |
23 | 23 | 22 |
30 | 20 | 30 |
23 | 28 | 20 |
Translation missing: es.problem
¿Parece que los tres medios en los que se cultivaron las plantas de judías producen la misma altura media? Pruebe con un nivel de significación del 3 %.
Solución
Esta vez, realizaremos los cálculos que conducen al estadístico F'. Observe que cada grupo tiene el mismo número de plantas, por lo que utilizaremos la fórmula F' = .
Primero, calcule la media muestral y la varianza de cada grupo.
Plantas de Tommy | Plantas de Tara | Plantas de Nick | |
---|---|---|---|
Media muestral | 24,2 | 25,4 | 24,4 |
Varianza de la muestra | 11,7 | 18,3 | 16,3 |
Luego, calcule la varianza de las medias de los tres grupos (calcule la varianza de 24,2, 25,4 y 24,4). Varianza de las medias de los grupos = 0,413 =
Entonces MSentre = = (5)(0,413) donde n = 5 es el tamaño de la muestra (número de plantas que cultivó cada niño).
Calcule la media de las tres varianzas de la muestra (calcule la media de 11,7, 18,3 y 16,3). Media de las varianzas de la muestra = 15,433 = s2 combinada
Entonces MSdentro = s2combinado = 15,433.
El estadístico F (o cociente F) es
Los dfs para el numerador = el número de grupos – 1 = 3 – 1 = 2.
El dfs para el denominador = el número total de muestras – el número de grupos = 15 – 3 = 12
La distribución de la prueba es F2, 12 y el estadístico F es F = 0,134
El valor p es P(F > 0,134) = 0,8759.
Decisión: Dado que α = 0,03 y el valor p = 0,8759, no se rechaza H0. (¿Por qué?)
Conclusión: Con un nivel de significación del 3 %, a partir de los datos de la muestra, las pruebas no son suficientes para concluir que las alturas medias de las plantas de judías son diferentes.
Uso de las calculadoras TI-83, 83+, 84, 84+
Para calcular el valor p:
* Pulse 2nd DISTR
*Flecha hacia abajo a Fcdf
(y pulse ENTER
.
*Introduzca 0,134, E99
, 2, 12)
* Pulse ENTER
El valor p es de 0,8759.
Inténtelo 13.4
Otro estudiante de cuarto grado también cultivó plantas de judías, pero esta vez en una masa gelatinosa. Las alturas fueron (en pulgadas) 24, 28, 25, 30 y 32. Haga una prueba de ANOVA de una vía en los cuatro grupos. ¿Son diferentes las alturas de las plantas de judías? Utilice el mismo método que se muestra en el Ejemplo 13.4.
Ejercicio colaborativo
A partir de la clase, cree cuatro grupos del mismo tamaño como sigue: hombres menores de 22 años, hombres de al menos 22 años, mujeres menores de 22 años, mujeres de al menos 22 años. Haga que cada miembro de cada grupo registre el número de estados de Estados Unidos que ha visitado. Realice un ANOVA para determinar si el promedio de estados visitados en los cuatro grupos es el mismo. Pruebe con un nivel de significación del 1 %. Utilice una de las hojas de solución en el E - HOJAS DE SOLUCIONES.