Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

13.2 La distribución F y el cociente F

Introducción a la estadística13.2 La distribución F y el cociente F

Menú
Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Frecuencia, tablas de frecuencia y niveles de medición
    5. 1.4 Diseño experimental y ética
    6. 1.5 Experimento de recopilación de datos
    7. 1.6 Experimento de muestreo
    8. Términos clave
    9. Repaso del capítulo
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
    3. 2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
    4. 2.3 Medidas de la ubicación de los datos
    5. 2.4 Diagramas de caja
    6. 2.5 Medidas del centro de los datos
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. 2.8 Estadística descriptiva
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia
    6. 3.5 Diagramas de árbol y de Venn
    7. 3.6 Temas de probabilidad
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Uniéndolo todo: Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
    3. 4.2 Media o valor esperado y desviación típica
    4. 4.3 Distribución binomial
    5. 4.4 Distribución geométrica
    6. 4.5 Distribución hipergeométrica
    7. 4.6 Distribución de Poisson
    8. 4.7 Distribución discreta (experimento con cartas)
    9. 4.8 Distribución discreta (experimento de los dados de la suerte)
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Referencias
    16. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Funciones de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. 5.4 Distribución continua
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Distribución normal (tiempos de vuelta)
    5. 6.4 Distribución normal (longitud del meñique)
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de medias muestrales (promedios)
    3. 7.2 El teorema del límite central para las sumas
    4. 7.3 Uso del teorema del límite central
    5. 7.4 Teorema del límite central (monedas en el bolsillo)
    6. 7.5 Teorema del límite central (recetas de galletas)
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 La media de una población utilizando la distribución normal
    3. 8.2 La media de una población utilizando la distribución t de Student
    4. 8.3 Una proporción de la población
    5. 8.4 Intervalo de confianza (costos de hogares)
    6. 8.5 Intervalo de confianza (lugar de nacimiento)
    7. 8.6 Intervalo de confianza (altura de las mujeres)
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Eventos poco comunes, la muestra, decisión y conclusión
    6. 9.5 Información adicional y ejemplos de pruebas de hipótesis completas
    7. 9.6 Pruebas de hipótesis de una sola media y una sola proporción
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Medias de dos poblaciones con desviaciones típicas desconocidas
    3. 10.2 Dos medias poblacionales con desviaciones típicas conocidas
    4. 10.3 Comparación de dos proporciones de población independientes
    5. 10.4 Muestras coincidentes o emparejadas
    6. 10.5 Prueba de hipótesis para dos medias y dos proporciones
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de bondad de ajuste
    4. 11.3 Prueba de independencia
    5. 11.4 Prueba de homogeneidad
    6. 11.5 Comparación de las pruebas chi-cuadrado
    7. 11.6 Prueba de una sola varianza
    8. 11.7 Laboratorio 1: Bondad de ajuste de chi-cuadrado
    9. 11.8 Laboratorio 2: prueba de independencia de chi-cuadrado
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  13. 12 Regresión lineal y correlación
    1. Introducción
    2. 12.1 Ecuaciones lineales
    3. 12.2 Diagramas de dispersión
    4. 12.3 La ecuación de regresión
    5. 12.4 Comprobación de la importancia del coeficiente de correlación
    6. 12.5 Predicción
    7. 12.6 Valores atípicos
    8. 12.7 Regresión (distancia desde la escuela)
    9. 12.8 Regresión (costo de los libros de texto)
    10. 12.9 Regresión (eficiencia del combustible)
    11. Términos clave
    12. Repaso del capítulo
    13. Repaso de fórmulas
    14. Práctica
    15. Tarea para la casa
    16. Resúmalo todo: tarea para la casa
    17. Referencias
    18. Soluciones
  14. 13 Distribución F y análisis de varianza anova de una vía
    1. Introducción
    2. 13.1 ANOVA de una vía
    3. 13.2 La distribución F y el cociente F
    4. 13.3 Datos sobre la distribución F
    5. 13.4 Prueba de dos varianzas
    6. 13.5 Laboratorio: ANOVA de una vía
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  15. A Ejercicios de repaso (caps. 3-13)
  16. B Pruebas prácticas (de la 1 a la 4) y exámenes finales
  17. C Conjuntos de datos
  18. D Proyectos de grupos y asociaciones
  19. E Hojas de soluciones
  20. F Oraciones, símbolos y fórmulas matemáticas
  21. G Notas para las calculadoras TI-83, 83+, 84 y 84+
  22. H Tablas
  23. Índice

La distribución utilizada para la prueba de hipótesis es nueva. Se llama distribuciónF, en honor al estadístico inglés Sir Ronald Fisher. El estadístico F es un cociente (una fracción). Hay dos conjuntos de grados de libertad; uno para el numerador y otro para el denominador.

Por ejemplo, si F sigue una distribución F y el número de grados de libertad para el numerador es cuatro y el número de grados de libertad para el denominador es diez, entonces F ~ F4, 10.

Nota

La distribución F se deriva de la distribución t de Student. Los valores de la distribución F son los cuadrados de los valores correspondientes de la distribución t. El ANOVA de una vía amplía la prueba t para comparar más de dos grupos. El alcance de esa derivación está más allá del nivel de este curso. Es preferible utilizar el ANOVA cuando hay más de dos grupos en lugar de realizar pruebas t por pares porque la realización de pruebas múltiples introduce la probabilidad de cometer un error de tipo 1.

Para calcular el cociente F se hacen dos estimaciones de la varianza.

  1. Varianza entre muestras: Una estimación de σ2 que es la varianza de las medias muestrales multiplicada por n (cuando los tamaños de las muestras son iguales). Si las muestras son de diferentes tamaños, la varianza entre las muestras se pondera para tener en cuenta los diferentes tamaños de las muestras. La varianza también se denomina variación debido al tratamiento o variación explicada.
  2. Varianza dentro de las muestras: Una estimación de σ2 que es el promedio de las varianzas de la muestra (también conocida como varianza combinada). Cuando los tamaños de las muestras son diferentes, se pondera la varianza dentro de las muestras. La varianza también se denomina variación debido al error o variación no explicada.
  • SSentre = la suma de los cuadrados que representa la variación entre las diferentes muestras
  • SSdentro = la suma de los cuadrados que representa la variación dentro de las muestras debido al azar.

Hallar una “suma de cuadrados” significa sumar cantidades al cuadrado que, en algunos casos, pueden estar ponderadas. Utilizamos la suma de cuadrados para calcular la varianza de la muestra y la desviación típica de la muestra en Estadística Descriptiva.

MS significa “media cuadrática“ (mean square, MS). MSentre es la varianza entre grupos y MSdentro es la varianza dentro de los grupos.

Cálculo de la suma de cuadrados y de la media cuadrática

  • k = el número de grupos diferentes
  • nj = el tamaño del grupo j
  • sj = la suma de los valores del grupo j
  • n = número total de todos los valores combinados (tamaño total de la muestra: ∑nj)
  • x = un valor: ∑x = ∑sj
  • Suma de los cuadrados de todos los valores de cada grupo combinados: ∑x2
  • Variabilidad entre grupos: SStotal = ∑x2 ( x 2 ) n ( x 2 ) n
  • Suma total de cuadrados: ∑x2 ( x ) 2 n ( x ) 2 n
  • Variación explicada: suma de los cuadrados que representan la variación entre las diferentes muestras: SSentre = [ ( s j ) 2 n j ] ( s j ) 2 n [ ( s j ) 2 n j ] ( s j ) 2 n
  • Variación no explicada: suma de cuadrados que representa la variación dentro de las muestras debida al azar: S S dentro =S S total S S entre S S dentro =S S total S S entre
  • dfde diferentes grupos (df para el numerador): df = k – 1
  • Ecuación para los errores dentro de las muestras (dfpara el denominador): dfdentro = nk
  • Media cuadrática (estimación de la varianza) explicado por los diferentes grupos: MSentre = S S entre de entre S S entre de entre
  • Media cuadrática (estimación de la varianza) que se debe al azar (no explicado): MSdentro = S S dentro d e dentro S S dentro d e dentro

MSentre y MSdentro se pueden escribir como sigue:

  • M S entre = S S entre d e entre = S S entre k1 M S entre = S S entre d e entre = S S entre k1
  • M S within = S S within d e within = S S within nk M S within = S S within d e within = S S within nk

La prueba de ANOVA de una vía depende del hecho de que el MSentre puede estar influenciado por las diferencias poblacionales entre las medias de los distintos grupos. Dado que el MSdentro compara los valores de cada grupo con su propia media de grupo, el hecho de que las medias de los grupos puedan ser diferentes no afecta al MSdentro.

La hipótesis nula dice que todos los grupos son muestras de poblaciones que tienen la misma distribución normal. La hipótesis alternativa dice que, al menos, dos de los grupos de la muestra proceden de poblaciones con distribuciones normales diferentes. Si la hipótesis nula es verdadera, tanto MSentre como MSdentro deberían estimar el mismo valor.

Nota

La hipótesis nula dice que todas las medias poblacionales del grupo son iguales. La hipótesis de igualdad de medias implica que las poblaciones tienen la misma distribución normal, ya que se supone que las poblaciones son normales y que tienen varianzas iguales.

El cociente F o estadístico F F= M S entre M S dentro F= M S entre M S dentro

Si MSentre y MSdentro estiman el mismo valor (siguiendo la creencia de que H0 es verdadera), entonces el cociente F debería ser aproximadamente igual a uno. En su mayoría, solo los errores de muestreo contribuirían a variaciones alejadas de uno. Resulta que MSentre consiste en la varianza de la población más una varianza producida por las diferencias entre las muestras. MSdentro es una estimación de la varianza de la población. Dado que las varianzas son siempre positivas, si la hipótesis nula es falsa, MSentre será generalmente mayor que MSdentro. Entonces el cociente F será mayor que uno. Sin embargo, si el efecto de la población es pequeño, no es improbable que MSdentro sea mayor en una muestra determinada.

Los cálculos anteriores se hicieron con grupos de diferentes tamaños. Si los grupos son del mismo tamaño, los cálculos se simplifican un poco y el cociente F se puede escribir como:

Fórmula del cociente F cuando los grupos son del mismo tamaño F= n s x ¯ 2 s 2 combinada F= n s x ¯ 2 s 2 combinada

donde...
  • n = el tamaño de la muestra
  • dfnumerador = k – 1
  • dfdenominador = nk
  • s2 combinada = la media de las varianzas de la muestra (varianza combinada)
  • s x ¯ 2 s x ¯ 2 = la varianza de las medias muestrales

Los datos se suelen poner en una tabla para facilitar su visualización. Los resultados del ANOVA de una vía suelen mostrarse de esta manera en softwares.

Fuente de variación Suma de los cuadrados (SS) Grados de libertad (df) Media cuadrática (Mean Square, MS) F
Factor
(entre)
SS(factor) k – 1 MS(factor) = SS(factor)/(k – 1) F = MS(Factor)/MS(Error)
Error
SS(error) nk MS(error) = SS(error)/(nk)
Total SS(total) n – 1
Tabla 13.1

Ejemplo 13.1

Se van a probar tres planes de dieta diferentes para la pérdida media de peso. Las entradas de la tabla son las pérdidas de peso de los diferentes planes. Los resultados del ANOVA de una vía se muestran en la Tabla 13.2.

Plan 1: n1 = 4 Plan 2: n2 = 3 Plan 3: n3 = 3
5 3,5 8
4,5 7 4
4 3,5
3 4,5
Tabla 13.2

s1 = 16,5, s2 =15, s3 = 15,5

A continuación se presentan los cálculos necesarios para completar la tabla de ANOVA de una vía. La tabla se utiliza para realizar una prueba de hipótesis.

SS(between)=[ ( s j ) 2 n j ] ( s j ) 2 n  SS(between)=[ ( s j ) 2 n j ] ( s j ) 2 n 
=  s 1 2 4 + s 2 2 3 + s 3 2 3 ( s 1 + s 2 + s 3 ) 2 10 =  s 1 2 4 + s 2 2 3 + s 3 2 3 ( s 1 + s 2 + s 3 ) 2 10

donde n1 = 4, n2 = 3, n3 = 3 y n = n1 + n2 + n3 = 10

  = ( 16,5 ) 2 4 + ( 15 ) 2 3 + ( 15,5 ) 2 3 ( 16,5+15+15,5 ) 2 10   = ( 16,5 ) 2 4 + ( 15 ) 2 3 + ( 15,5 ) 2 3 ( 16,5+15+15,5 ) 2 10
SS(between)=2,2458 SS(between)=2,2458
S(total)= x 2 ( x ) 2 n S(total)= x 2 ( x ) 2 n
 =( 5 2 + 4,5 2 + 4 2 + 3 2 + 3,5 2 + 7 2 + 4,5 2 + 8 2 + 4 2 + 3,5 2 )  =( 5 2 + 4,5 2 + 4 2 + 3 2 + 3,5 2 + 7 2 + 4,5 2 + 8 2 + 4 2 + 3,5 2 )
(5+4,5+4+3+3,5+7+4,5+8+4+3,5) 2 10 (5+4,5+4+3+3,5+7+4,5+8+4+3,5) 2 10
=244 47 2 10 =244220,9 =244 47 2 10 =244220,9
SS(total)=23,1 SS(total)=23,1
SS(within)=SS(total)SS(between) SS(within)=SS(total)SS(between)
= 23,12,2458 = 23,12,2458
SS(within)=20,8542 SS(within)=20,8542

Uso de las calculadoras TI-83, 83+, 84, 84+

Tabla de ANOVA de una vía: Las fórmulas para SS(total), SS(factor) = SS(entre) y SS(error) = SS(dentro) como se ha mostrado anteriormente. La misma información es proporcionada por la función de prueba de hipótesis de la calculadora TI ANOVA en STAT TESTS (la sintaxis es ANOVA(L1, L2, L3) donde L1, L2, L3 tienen los datos del Plan 1, Plan 2, Plan 3 respectivamente).

Fuente de variación Suma de los cuadrados (SS) Grados de libertad (df) Media cuadrática (Mean Square, MS) F
Factor
(entre)
SS(factor)
= SS(entre)
= 2,2458
k – 1
= 3 grupos – 1
= 2
MS(factor)
= SS(factor)/(k – 1)
= 2,2458/2
= 1,1229
F =
MS(Factor)/MS(Error)
= 1,1229/2,9792
= 0,3769
Error
SS(error)
= SS
= 20,8542
nk
= 10 datos totales – 3 grupos
= 7
MS(error)
= SS(error)/(nk)
= 20,8542/7
= 2,9792
Total SS(total)
= 2,2458 + 20,8542
= 23,1
n – 1
= 10 datos totales – 1
= 9
Tabla 13.3

Inténtelo 13.1

Como parte de un experimento para ver cómo los diferentes tipos de lechos de suelo afectarían la producción de tomates de corte, los estudiantes del Marist College cultivaron plantas de tomate en diferentes condiciones de lecho de suelo. Los grupos de tres plantas tenían, cada uno, uno de los siguientes tratamientos

  • suelo desnudo
  • cubierta de suelo comercial
  • plástico negro
  • paja
  • compost

Todas las plantas crecieron en las mismas condiciones y eran de la misma variedad. Los estudiantes registraron el peso (en gramos) de los tomates producidos por cada una de las n = 15 plantas:

Desnudo: n1 = 3 Cubierta del suelo: n2 = 3 Plástico: n3 = 3 Paja: n4 = 3 Compost: n5 = 3
2.625 5.348 6.583 7.285 6.277
2.997 5.682 8.560 6.897 7.818
4.915 5.482 3.830 9.230 8.677
Tabla 13.4


Cree la tabla ANOVA de una vía.

La prueba de hipótesis del ANOVA de una vía es siempre de cola derecha porque los valores F más grandes están en la cola derecha de la curva de distribución F y tienden a hacernos rechazar H0.

Notación

La notación para la distribución F es F ~ Fdf(num),df(denom)

donde df(num) = dfentre y df(denom) = dfdentro

La media de la distribución F es μ= de(denom) de(denom)2 μ= de(denom) de(denom)2

Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.