Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

10.1 Medias de dos poblaciones con desviaciones típicas desconocidas

Introducción a la estadística10.1 Medias de dos poblaciones con desviaciones típicas desconocidas

Menú
Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Frecuencia, tablas de frecuencia y niveles de medición
    5. 1.4 Diseño experimental y ética
    6. 1.5 Experimento de recopilación de datos
    7. 1.6 Experimento de muestreo
    8. Términos clave
    9. Repaso del capítulo
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
    3. 2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
    4. 2.3 Medidas de la ubicación de los datos
    5. 2.4 Diagramas de caja
    6. 2.5 Medidas del centro de los datos
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. 2.8 Estadística descriptiva
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia
    6. 3.5 Diagramas de árbol y de Venn
    7. 3.6 Temas de probabilidad
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Uniéndolo todo: Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
    3. 4.2 Media o valor esperado y desviación típica
    4. 4.3 Distribución binomial
    5. 4.4 Distribución geométrica
    6. 4.5 Distribución hipergeométrica
    7. 4.6 Distribución de Poisson
    8. 4.7 Distribución discreta (experimento con cartas)
    9. 4.8 Distribución discreta (experimento de los dados de la suerte)
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Referencias
    16. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Funciones de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. 5.4 Distribución continua
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Distribución normal (tiempos de vuelta)
    5. 6.4 Distribución normal (longitud del meñique)
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de medias muestrales (promedios)
    3. 7.2 El teorema del límite central para las sumas
    4. 7.3 Uso del teorema del límite central
    5. 7.4 Teorema del límite central (monedas en el bolsillo)
    6. 7.5 Teorema del límite central (recetas de galletas)
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 La media de una población utilizando la distribución normal
    3. 8.2 La media de una población utilizando la distribución t de Student
    4. 8.3 Una proporción de la población
    5. 8.4 Intervalo de confianza (costos de hogares)
    6. 8.5 Intervalo de confianza (lugar de nacimiento)
    7. 8.6 Intervalo de confianza (altura de las mujeres)
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Eventos poco comunes, la muestra, decisión y conclusión
    6. 9.5 Información adicional y ejemplos de pruebas de hipótesis completas
    7. 9.6 Pruebas de hipótesis de una sola media y una sola proporción
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Medias de dos poblaciones con desviaciones típicas desconocidas
    3. 10.2 Dos medias poblacionales con desviaciones típicas conocidas
    4. 10.3 Comparación de dos proporciones de población independientes
    5. 10.4 Muestras coincidentes o emparejadas
    6. 10.5 Prueba de hipótesis para dos medias y dos proporciones
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de bondad de ajuste
    4. 11.3 Prueba de independencia
    5. 11.4 Prueba de homogeneidad
    6. 11.5 Comparación de las pruebas chi-cuadrado
    7. 11.6 Prueba de una sola varianza
    8. 11.7 Laboratorio 1: Bondad de ajuste de chi-cuadrado
    9. 11.8 Laboratorio 2: prueba de independencia de chi-cuadrado
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  13. 12 Regresión lineal y correlación
    1. Introducción
    2. 12.1 Ecuaciones lineales
    3. 12.2 Diagramas de dispersión
    4. 12.3 La ecuación de regresión
    5. 12.4 Comprobación de la importancia del coeficiente de correlación
    6. 12.5 Predicción
    7. 12.6 Valores atípicos
    8. 12.7 Regresión (distancia desde la escuela)
    9. 12.8 Regresión (costo de los libros de texto)
    10. 12.9 Regresión (eficiencia del combustible)
    11. Términos clave
    12. Repaso del capítulo
    13. Repaso de fórmulas
    14. Práctica
    15. Tarea para la casa
    16. Resúmalo todo: tarea para la casa
    17. Referencias
    18. Soluciones
  14. 13 Distribución F y análisis de varianza anova de una vía
    1. Introducción
    2. 13.1 ANOVA de una vía
    3. 13.2 La distribución F y el cociente F
    4. 13.3 Datos sobre la distribución F
    5. 13.4 Prueba de dos varianzas
    6. 13.5 Laboratorio: ANOVA de una vía
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  15. A Ejercicios de repaso (caps. 3-13)
  16. B Pruebas prácticas (de la 1 a la 4) y exámenes finales
  17. C Conjuntos de datos
  18. D Proyectos de grupos y asociaciones
  19. E Hojas de soluciones
  20. F Oraciones, símbolos y fórmulas matemáticas
  21. G Notas para las calculadoras TI-83, 83+, 84 y 84+
  22. H Tablas
  23. Índice
  1. Las dos muestras independientes son simples muestras aleatorias de dos poblaciones distintas.
  2. Para las dos poblaciones distintas
    • si los tamaños de las muestras son pequeños, las distribuciones son importantes (deben ser normales)
    • si los tamaños de las muestras son grandes, las distribuciones no son importantes (no tienen por qué ser normales)

NOTA

La prueba que compara dos medias poblacionales independientes con desviaciones típicas poblacionales desconocidas y posiblemente desiguales se denomina prueba t de Aspin-Welch. Aspin Welch desarrolló la fórmula de los grados de libertad.

La comparación de dos medias poblacionales es muy común. La diferencia entre las dos muestras depende tanto de las medias como de las desviaciones típicas. Pueden producirse medias muy diferentes por azar si hay una gran variación entre cada una de las muestras. Para tener en cuenta la variación, tomamos la diferencia de las medias de la muestra, X ¯ 1 X ¯ 1 X ¯ 2 X ¯ 2 , y dividimos entre el error estándar para normalizar la diferencia. El resultado es un estadístico de prueba de puntuación t.

Ya que desconocemos las desviaciones típicas de la población, las calculamos con las dos desviaciones típicas de nuestras muestras independientes. En la prueba de hipótesis, calculamos la desviación típica o el error estándar, de la diferencia de las medias muestrales, X ¯ 1 X ¯ 1 X ¯ 2 X ¯ 2 .

El error estándar es: ( s 1 ) 2 n 1 + ( s 2 ) 2 n 2 ( s 1 ) 2 n 1 + ( s 2 ) 2 n 2

El estadístico de prueba(puntuación t) se calcula como sigue:

( x ¯ 1 x ¯ 2 )( μ 1 μ 2 ) ( s 1 ) 2 n 1 + ( s 2 ) 2 n 2 ( x ¯ 1 x ¯ 2 )( μ 1 μ 2 ) ( s 1 ) 2 n 1 + ( s 2 ) 2 n 2
donde:
  • s1 y s2, las desviaciones típicas de la muestra, son estimaciones de σ1 y σ2, respectivamente.
  • σ1 y σ2 son las desviaciones típicas desconocidas de la población.
  • x ¯ 1 x ¯ 1 y x ¯ 2 x ¯ 2 son las medias muestrales. μ1 y μ2 son las medias poblacionales.

El número de grados de libertad (df) requiere un cálculo algo complicado. Sin embargo, la computadora o la calculadora lo calculan fácilmente. Los df no son siempre un número entero. El estadístico de prueba calculado anteriormente se determina aproximadamente mediante la distribución t de Student con df de la siguiente manera:

Grados de libertad de= ( ( s 1 ) 2 n 1 + ( s 2 ) 2 n 2 ) 2 ( 1 n 1 1 ) ( ( s 1 ) 2 n 1 ) 2 +( 1 n 2 -1 ) ( ( s 2 ) 2 n 2 ) 2 de= ( ( s 1 ) 2 n 1 + ( s 2 ) 2 n 2 ) 2 ( 1 n 1 1 ) ( ( s 1 ) 2 n 1 ) 2 +( 1 n 2 -1 ) ( ( s 2 ) 2 n 2 ) 2

Cuando los tamaños de las muestras n1 y n2 son cinco o más, la aproximación t de Student es bastante apropiada. Observe que las varianzas muestrales (s1)2 y (s2)2 no están agrupadas. (Si se plantea la cuestión, no agrupe las varianzas).

NOTA

No es necesario calcularlo a mano. La calculadora o la computadoras lo harán fácilmente.

Ejemplo 10.1

Grupos independientes

Se cree que el promedio de tiempo que los niños y niñas de entre siete y once años practican deportes cada día es la misma. Se hace un estudio y se recopilan datos, lo que da como resultado los datos en la Tabla 10.1. Cada población tiene una distribución normal.

Tamaño de la muestra Promedio de horas de práctica deportiva al día Desviación típica de la muestra
Niñas 9 2 0,8660,866
Niños 16 3,2 1,00
Tabla 10.1

translation missing: es.problem

¿Hay diferencia en la media de tiempo que los niños y las niñas de 7 a 11 años practican deportes cada día? Prueba al nivel de significación del 5%.

Inténtelo 10.1

En la Tabla 10.2 se indican dos muestras. Ambas tienen distribuciones normales. Se cree que las medias de las dos poblaciones son las mismas. ¿Hay alguna diferencia en las medias? Prueba al nivel de significación del 5 %.

Tamaño de la muestra Media muestral Desviación típica de la muestra
Población A 25 5 1
Población B 16 4,7 1,2
Tabla 10.2

NOTA

Cuando la suma de los tamaños de las muestras es mayor que 30 (n1 + n2 > 30), se puede utilizar la distribución normal para calcular aproximadamente la t de Student.

Ejemplo 10.2

Un grupo comunitario realiza un estudio en dos institutos universitarios vecinos para determinar cuál de ellos gradúa a los estudiantes con más clases de Matemáticas. La universidad A toma una muestra de 11 graduados. Su promedio es de cuatro clases de Matemáticas con desviación típica de 1,5. La universidad B toma una muestra de nueve graduados. Su promedio es de 3,5 clases de Matemáticas con desviación típica de una clase de Matemáticas. El grupo comunitario cree que un estudiante que se gradúa en el instituto universitario A ha tomado más clases de Matemáticas, en promedio. Ambas poblaciones tienen una distribución normal. Pruebe con un nivel de significación del 1 %. Responda las siguientes preguntas:

translation missing: es.problem

a. ¿Se trata de una prueba de dos medias o de dos proporciones?

translation missing: es.problem

b. ¿Las desviaciones típicas de las poblaciones son conocidas o desconocidas?

translation missing: es.problem

c. ¿Qué distribución utiliza para realizar la prueba?

translation missing: es.problem

d. ¿Cuál es la variable aleatoria?

translation missing: es.problem

e. ¿Cuáles son las hipótesis nula y alternativa? Escriba las hipótesis nula y alternativa con palabras y con símbolos.

translation missing: es.problem

f. ¿Esta prueba es de cola derecha, izquierda o doble?

translation missing: es.problem

g. ¿Cuál es el valor p?

translation missing: es.problem

h. ¿Rechaza o no rechaza la hipótesis nula?

translation missing: es.problem

i. Conclusión:

Inténtelo 10.2

Se realiza un estudio para determinar si la compañía A retiene a sus trabajadores más tiempo que la compañía B. La compañía A toma una muestra de 15 trabajadores, y su tiempo promedio en la compañía es de cinco años con desviación típica de 1,2. La compañía B cuenta con una muestra de 20 trabajadores, cuyo promedio de antigüedad en la compañía es de 4,5 años con desviación típica de 0,8. Las poblaciones se distribuyen normalmente.

  1. ¿Se conocen las desviaciones típicas de la población?
  2. Realice una prueba de hipótesis apropiada. A un nivel de significación del 5 %, ¿cuál es su conclusión?

Ejemplo 10.3

Un profesor de una gran universidad comunitaria quería determinar si existe una diferencia en las medias de las puntuaciones de los exámenes finales entre los estudiantes que tomaron su curso de estadística en línea y los que tomaron la clase presencial. Creía que la media de las puntuaciones del examen final de la clase en línea sería inferior a la de la clase presencial. ¿Estaba en lo correcto el profesor? Las 30 puntuaciones de los exámenes finales de cada grupo, seleccionadas al azar, figuran en la Tabla 10.3 y la Tabla 10.4.

67,6 41,2 85,3 55,9 82,4 91,2 73,5 94,1 64,7 64,7
70,6 38,2 61,8 88,2 70,6 58,8 91,2 73,5 82,4 35,5
94,1 88,2 64,7 55,9 88,2 97,1 85,3 61,8 79,4 79,4
Tabla 10.3 Clase en línea
77,9 95,3 81,2 74,1 98,8 88,2 85,9 92,9 87,1 88,2
69,4 57,6 69,4 67,1 97,6 85,9 88,2 91,8 78,8 71,8
98,8 61,2 92,9 90,6 97,6 100 95,3 83,5 92,9 89,4
Tabla 10.4 Clase presencial

translation missing: es.problem

¿Es la media de las puntuaciones del examen final de la clase en línea inferior a la media de clase presencial? Pruebe con un nivel de significación del 5 %. Responda a las siguientes preguntas:

  1. ¿Se trata de una prueba de dos medias o de dos proporciones?
  2. ¿Las desviaciones típicas de la población son conocidas o desconocidas?
  3. ¿Qué distribución utiliza para realizar la prueba?
  4. ¿Cuál es la variable aleatoria?
  5. ¿Cuáles son las hipótesis nula y alternativa? Escriba las hipótesis nula y alternativa con palabras y con símbolos.
  6. ¿Esta prueba es a la derecha, a la izquierda o de dos colas?
  7. ¿Cuál es el valor p?
  8. ¿Rechaza o no rechaza la hipótesis nula?
  9. En el nivel de significación ___, a partir de los datos de la muestra, ______ (es/no es) evidencia suficiente para concluir que ______.

(Vea la conclusión en el Ejemplo 10.2, y escriba la suya de forma similar).

Uso de las calculadoras TI-83, 83+, 84, 84+

Primero ponga los datos de cada grupo en dos listas (como L1 y L2). Pulse STAT. Flecha hacia TESTS y pulse 4:2SampTTest. Asegúrese de que Data (Datos) esté resaltado y pulse ENTER. Flecha hacia abajo; introduzca L1 para la primera lista y L2 para la segunda. Desplace la flecha hacia abajo hasta μ1: y la flecha hacia < μ2 (menos que). Pulse ENTER. Flecha hacia abajo a Pooled: No. Pulse ENTER. Flecha hacia abajo hasta Calculate (Calcular); pulse ENTER.

Nota:

¡No mezcle la información del Grupo 1 y del Grupo 2!

Criterios de Cohen para efectos de tamaño pequeño, mediano y grandeLa d de Cohen es la medida del tamaño del efecto con base en las diferencias entre dos medias. La d de Cohen, llamada así por el estadístico estadounidense Jacob Cohen, mide la fuerza relativa de las diferencias entre las medias de dos poblaciones a partir de los datos de la muestra. El valor calculado del tamaño del efecto se compara entonces con los criterios de Cohen de efecto de tamaño pequeño, mediano y grande.

Tamaño del efecto d
Pequeño 0,2
Mediano 0,5
Grande 0,8
Tabla 10.5 Tamaños de los efectos de los criterios de Cohen

La d de Cohen es la medida de la diferencia entre dos medias dividida entre la desviación típica combinada: d= x ¯ 1 x ¯ 2 s pooled d= x ¯ 1 x ¯ 2 s pooled donde s pooled = ( n 1 1) s 1 2 +( n 2 -1) s 2 2 n 1 + n 2 2 s pooled = ( n 1 1) s 1 2 +( n 2 -1) s 2 2 n 1 + n 2 2

Ejemplo 10.4

translation missing: es.problem

Calcule la d de Cohen para el Ejemplo 10.2. ¿El tamaño del efecto es pequeño, mediano o grande? Explique qué significa el tamaño del efecto para este problema.

Ejemplo 10.5

translation missing: es.problem

Calcule la d de Cohen para el Ejemplo 10.3. ¿El tamaño del efecto es pequeño, mediano o grande? Explique qué significa el tamaño del efecto para este problema.

Inténtelo 10.5

El alfa ponderado es una medida del rendimiento ajustado al riesgo de las acciones durante un periodo de un año. Un alfa ponderado positivo alto significa una acción cuyo precio ha subido, mientras que un alfa ponderado positivo pequeño indica un precio de la acción sin cambios durante el periodo. El alfa ponderado se utiliza para identificar compañías con fuertes tendencias al alza o a la baja. El alfa ponderado de los 30 principales títulos valores de los bancos del noreste y del oeste identificados por el Nasdaq el 24 de mayo de 2013 figura en la Tabla 10.6 y la Tabla 10.7, respectivamente.

94,2 75,2 69,6 52,0 48,0 41,9 36,4 33,4 31,5 27,6
77,3 71,9 67,5 50,6 46,2 38,4 35,2 33,0 28,7 26,5
76,3 71,7 56,3 48,7 43,2 37,6 33,7 31,8 28,5 26,0
Tabla 10.6 Noreste
126,0 70,6 65,2 51,4 45,5 37,0 33,0 29,6 23,7 22,6
116,1 70,6 58,2 51,2 43,2 36,0 31,4 28,7 23,5 21,6
78,2 68,2 55,6 50,3 39,0 34,1 31,0 25,3 23,4 21,5
Tabla 10.7 Oeste

¿Existe alguna diferencia en el alfa ponderado de los 30 principales títulos valores de los bancos del noreste y del oeste? Pruebe a un nivel de significación del 5 %. Responda las siguientes preguntas:

  1. ¿Se trata de una prueba de dos medias o de dos proporciones?
  2. ¿Las desviaciones típicas de la población son conocidas o desconocidas?
  3. ¿Qué distribución utiliza para realizar la prueba?
  4. ¿Cuál es la variable aleatoria?
  5. ¿Cuáles son las hipótesis nula y alternativa? Escriba las hipótesis nula y alternativa con palabras y con símbolos.
  6. ¿Esta prueba es a la derecha, a la izquierda o de dos colas?
  7. ¿Cuál es el valor p?
  8. ¿Rechaza o no rechaza la hipótesis nula?
  9. En el nivel de significación ___, a partir de los datos de la muestra, ______ (es/no es) evidencia suficiente para concluir que ______.
  10. Calcule la d de Cohen e interprétela.
Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.