Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

2.7 Medidas de la dispersión de los datos

Introducción a la estadística2.7 Medidas de la dispersión de los datos

Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Frecuencia, tablas de frecuencia y niveles de medición
    5. 1.4 Diseño experimental y ética
    6. 1.5 Experimento de recopilación de datos
    7. 1.6 Experimento de muestreo
    8. Términos clave
    9. Repaso del capítulo
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
    3. 2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
    4. 2.3 Medidas de la ubicación de los datos
    5. 2.4 Diagramas de caja
    6. 2.5 Medidas del centro de los datos
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. 2.8 Estadística descriptiva
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia
    6. 3.5 Diagramas de árbol y de Venn
    7. 3.6 Temas de probabilidad
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Uniéndolo todo: Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
    3. 4.2 Media o valor esperado y desviación típica
    4. 4.3 Distribución binomial
    5. 4.4 Distribución geométrica
    6. 4.5 Distribución hipergeométrica
    7. 4.6 Distribución de Poisson
    8. 4.7 Distribución discreta (experimento con cartas)
    9. 4.8 Distribución discreta (experimento de los dados de la suerte)
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Referencias
    16. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Funciones de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. 5.4 Distribución continua
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Distribución normal (tiempos de vuelta)
    5. 6.4 Distribución normal (longitud del meñique)
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de medias muestrales (promedios)
    3. 7.2 El teorema del límite central para las sumas
    4. 7.3 Uso del teorema del límite central
    5. 7.4 Teorema del límite central (monedas en el bolsillo)
    6. 7.5 Teorema del límite central (recetas de galletas)
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 La media de una población utilizando la distribución normal
    3. 8.2 La media de una población utilizando la distribución t de Student
    4. 8.3 Una proporción de la población
    5. 8.4 Intervalo de confianza (costos de hogares)
    6. 8.5 Intervalo de confianza (lugar de nacimiento)
    7. 8.6 Intervalo de confianza (altura de las mujeres)
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Eventos poco comunes, la muestra, decisión y conclusión
    6. 9.5 Información adicional y ejemplos de pruebas de hipótesis completas
    7. 9.6 Pruebas de hipótesis de una sola media y una sola proporción
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Medias de dos poblaciones con desviaciones típicas desconocidas
    3. 10.2 Dos medias poblacionales con desviaciones típicas conocidas
    4. 10.3 Comparación de dos proporciones de población independientes
    5. 10.4 Muestras coincidentes o emparejadas
    6. 10.5 Prueba de hipótesis para dos medias y dos proporciones
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de bondad de ajuste
    4. 11.3 Prueba de independencia
    5. 11.4 Prueba de homogeneidad
    6. 11.5 Comparación de las pruebas chi-cuadrado
    7. 11.6 Prueba de una sola varianza
    8. 11.7 Laboratorio 1: Bondad de ajuste de chi-cuadrado
    9. 11.8 Laboratorio 2: prueba de independencia de chi-cuadrado
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  13. 12 Regresión lineal y correlación
    1. Introducción
    2. 12.1 Ecuaciones lineales
    3. 12.2 Diagramas de dispersión
    4. 12.3 La ecuación de regresión
    5. 12.4 Comprobación de la importancia del coeficiente de correlación
    6. 12.5 Predicción
    7. 12.6 Valores atípicos
    8. 12.7 Regresión (distancia desde la escuela)
    9. 12.8 Regresión (costo de los libros de texto)
    10. 12.9 Regresión (eficiencia del combustible)
    11. Términos clave
    12. Repaso del capítulo
    13. Repaso de fórmulas
    14. Práctica
    15. Tarea para la casa
    16. Resúmalo todo: tarea para la casa
    17. Referencias
    18. Soluciones
  14. 13 Distribución F y análisis de varianza anova de una vía
    1. Introducción
    2. 13.1 ANOVA de una vía
    3. 13.2 La distribución F y el cociente F
    4. 13.3 Datos sobre la distribución F
    5. 13.4 Prueba de dos varianzas
    6. 13.5 Laboratorio: ANOVA de una vía
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  15. A Ejercicios de repaso (caps. 3-13)
  16. B Pruebas prácticas (de la 1 a la 4) y exámenes finales
  17. C Conjuntos de datos
  18. D Proyectos de grupos y asociaciones
  19. E Hojas de soluciones
  20. F Oraciones, símbolos y fórmulas matemáticas
  21. G Notas para las calculadoras TI-83, 83+, 84 y 84+
  22. H Tablas
  23. Índice

Una característica importante de cualquier conjunto de datos es su variación. En algunos conjuntos de datos, los valores de los datos se concentran muy cerca de la media; en otros, están más dispersos de la media. La medida más común de variación, o dispersión, es la desviación típica. La desviación típica es un número que mide la distancia entre los valores de los datos y su media.

La desviación típica

  • proporciona una medida numérica de la cantidad global de variación en un conjunto de datos y
  • se puede usar para determinar si un valor de datos determinado está cerca o lejos de la media.

La desviación típica proporciona una medida de la variación global de un conjunto de datos

La desviación típica es siempre positiva o cero. La desviación típica es pequeña cuando todos los datos se concentran cerca de la media y muestran poca variación o dispersión. La desviación típica es mayor cuando los valores de los datos están más alejados de la media y muestran más variación.

Supongamos que estudiamos el tiempo que los clientes esperan en la fila de la caja del supermercado A y del supermercado B. El tiempo promedio de espera en ambos supermercados es de cinco minutos. En el supermercado A, la desviación típica del tiempo de espera es de dos minutos; en el supermercado B, la desviación típica del tiempo de espera es de cuatro minutos.

Como el supermercado B tiene una desviación típica más alta, sabemos que hay más variación en los tiempos de espera en el supermercado B. En general, los tiempos de espera en el supermercado B están más dispersos del promedio; los tiempos de espera en el supermercado A están más concentrados cerca del promedio.

La desviación típica se puede usar para determinar si un valor de los datos está cerca o lejos de la media.

Supongamos que Rosa y Binh compran en el supermercado A. Rosa espera en la caja siete minutos y Binh espera un minuto. En el supermercado A, el tiempo medio de espera es de cinco minutos y la desviación típica es de dos minutos. La desviación típica se puede usar para determinar si un valor de los datos está cerca o lejos de la media.

Rosa espera siete minutos:

  • Siete son dos minutos más que el promedio de cinco; dos minutos equivalen a una desviación típica.
  • El tiempo de espera de Rosa, de siete minutos, es dos minutos más largo que el promedio de cinco minutos.
  • El tiempo de espera de Rosa, de siete minutos, está una desviación típica por encima del promedio de cinco minutos.

Binh espera un minuto.

  • Uno es cuatro minutos menos que el promedio de cinco; cuatro minutos equivalen a dos desviaciones típicas.
  • El tiempo de espera de Binh, de un minuto, es cuatro minutos menos que el promedio de cinco minutos.
  • El tiempo de espera de Binh, de un minuto, está dos desviaciones típicas por debajo del promedio de cinco minutos.
  • Un valor de los datos que está a dos desviaciones típicas del promedio está justo en el límite de lo que muchos estadísticos considerarían alejado del promedio. Plantearse que los datos están lejos de la media si están a más de dos desviaciones típicas es más una "regla general" aproximada que una regla rígida. En general, la forma de la distribución de los datos afecta a la cantidad de datos que se encuentran más allá de dos desviaciones típicas. (En los capítulos siguientes aprenderá más sobre este punto).

La recta numérica puede ayudarlo a entender la desviación típica. Si ponemos el cinco y el siete en una recta numérica, el siete está a la derecha del cinco. Decimos, entonces, que siete está una desviación típica a la derecha de cinco porque 5 + (1)(2) = 7.

Si el número uno también formara parte del conjunto de datos, entonces estaría dos desviaciones típicas a la izquierda de cinco porque 5 + (-2)(2) = 1.

Se muestra una recta numérica en intervalos de 1 de 0 a 7.
Figura 2.24
  • En general, un valor = media + (n.º de STDEV) (número de STandard DEViation, o desviación típica)
  • donde n.º de STDEV = el número de desviaciones típicas
  • El n.º de STDEV no tiene que ser un número entero
  • Uno es dos desviaciones típicas menos que la media de cinco porque: 1 = 5 + (-2)(2).

La ecuación valor = media + (n.º de STDEV)(desviación típica) puede expresarse para una muestra y para una población.

  • muestra: x =  x ¯  + (n.ºoeSTDEV)(s) x =  x ¯  + (n.ºoeSTDEV)(s)
  • Población: x=μ+(n.ºoeSTDEV)(σ) x=μ+(n.ºoeSTDEV)(σ)

La letra minúscula s representa la desviación típica de la muestra y la letra griega σ (sigma, minúscula) representa la desviación típica de la población.

El símbolo x¯ x es la media muestral y el símbolo griego μμ es la media de la población.

Cálculo de la desviación típica

Si x es un número, la diferencia "x – media" se llama su desviación. En un conjunto de datos hay tantas desviaciones como elementos en el conjunto de datos. Las desviaciones se utilizan para calcular la desviación típica. Si los números pertenecen a una población, en símbolos una desviación es xμ. Para los datos de la muestra, en símbolos una desviación es x x ¯ x ¯ .

El procedimiento para calcular la desviación típica depende de si los números son toda la población o son datos de una muestra. Los cálculos son similares, pero no idénticos. Por tanto, el símbolo utilizado para representar la desviación típica depende de si se calcula a partir de una población o de una muestra. La letra minúscula s representa la desviación típica de la muestra y la letra griega σ (sigma, minúscula) representa la desviación típica de la población. Si la muestra tiene las mismas características que la población, entonces s debería ser una buena estimación de σ.

Para calcular la desviación típica, tenemos que calcular primero la varianza. La varianza es el promedio de los cuadrados de las desviaciones (la x x ¯ x ¯ para una muestra, o los valores xμ para una población). El símbolo σ2 representa la varianza de la población; la desviación típica de la población σ es la raíz cuadrada de la varianza de la población. El símbolo s2 representa la varianza de la muestra; la desviación típica de la muestra s es la raíz cuadrada de la varianza de la muestra. Puede pensar en la desviación típica como un promedio especial de las desviaciones.

Si las cifras proceden de un censo de toda la población y no de una muestra, cuando calculamos el promedio de las desviaciones al cuadrado para hallar la varianza, dividimos entre N, el número de elementos de la población. Si los datos proceden de una muestra y no de una población, al calcular el promedio de las desviaciones al cuadrado, dividimos entre n – 1, uno menos que el número de elementos de la muestra.

Fórmulas para la desviación típica de la muestra

  • s= Σ (x x ¯ ) 2 n1 s= Σ (x x ¯ ) 2 n1 o s= Σe (x x ¯ ) 2 n1 s= Σe (x x ¯ ) 2 n1
  • Para la desviación típica de la muestra, el denominador es n – 1, es decir, el tamaño de la muestra MENOS 1.

Fórmulas para la desviación típica de la población

  • σ  =  Σ (xμ) 2 N σ  =  Σ (xμ) 2 N o σ  =  Σe (xμ) 2 N σ  =  Σe (xμ) 2 N
  • Para la desviación típica de la población el denominador es N, el número de elementos de la población.

En estas fórmulas, f representa la frecuencia con la que aparece un valor. Por ejemplo, si un valor aparece una vez, f es uno. Si un valor aparece tres veces en el conjunto de datos o población, f es tres.

Variabilidad muestral de una estadística

La estadística de una distribución muestral se trató en Estadística descriptiva: medidas del centro de los datos. El grado de variación de la estadística de una muestra a otra se conoce como variabilidad muestral de una estadística. Normalmente se mide la variabilidad muestral de una estadística por su error estándar. El error estándar de la media es un ejemplo de error estándar. Es una desviación típica especial y se conoce como la desviación típica de la distribución muestral de la media. El error estándar de la media se tratará en el capítulo El teorema del límite central en otro momento. La notación para el error estándar de la media es σ n σ n donde σ es la desviación típica de la población y n es el tamaño de la muestra.

NOTA

En la práctica, UTILICE UNA CALCULADORA O UN SOFTWARE DE COMPUTADORA PARA CALCULAR LA DESVIACIÓN TÍPICA. Si está utilizando una calculadora TI-83, 83+ u 84+, debe seleccionar la desviación típica σx o sx correspondiente de las estadísticas de resumen. Nos centraremos en la utilización e interpretación de la información que nos proporciona la desviación típica. Sin embargo, debería estudiar el siguiente ejemplo paso a paso para entender cómo la desviación típica mide la variación de la media. (Las instrucciones de la calculadora aparecen al final de este ejemplo).

Ejemplo 2.32

En una clase de quinto grado la maestra estaba interesada en la edad promedio y la desviación típica de la muestra de las edades de sus estudiantes. Los siguientes datos son las edades de una MUESTRA de n = 20 estudiantes de quinto grado. Las edades están redondeadas al medio año más cercano:

9; 9,5; 9,5; 10; 10; 10; 10; 10,5; 10,5; 10,5; 10,5; 11; 11; 11; 11; 11; 11; 11,5; 11,5; 11,5;

x ¯ = 9 + 9,5(2) + 10(4) + 10,5(4) + 11(6) + 11,5(3) 20 =10,525 x ¯ = 9 + 9,5(2) + 10(4) + 10,5(4) + 11(6) + 11,5(3) 20 =10,525

La edad promedio es de 10,53 años, redondeada a dos cifras.

La varianza se puede calcular mediante una tabla. A continuación se calcula la desviación típica tomando la raíz cuadrada de la varianza. Explicaremos las partes de la tabla después de calcular s.

Datos Frec. Desviaciones Desviaciones2 (Frecuencia)(Desviaciones2)
x f (x x ¯ x ¯ ) (x x ¯ x ¯ )2 (f)(x x ¯ x ¯ )2
9 1 9 – 10,525 = –1,525 (–1,525)2 = 2,325625 1 × 2,325625 = 2,325625
9,5 2 9,5 – 10,525 = –1,025 (–1,025)2 = 1,050625 2 × 1,050625 = 2,101250
10 4 10 – 10,525 = –0,525 (–0,525)2 = 0,275625 4 × 0,275625 = 1,1025
10,5 4 10,5 – 10,525 = –0,025 (–0,025)2 = 0,000625 4 × 0,000625 = 0,0025
11 6 11 – 10,525 = 0,475 (0,475)2 = 0,225625 6 × 0,225625 = 1,35375
11,5 3 11,5 – 10,525 = 0,975 (0,975)2 = 0,950625 3 × 0,950625 = 2,851875
El total es 9,7375
Tabla 2.29

La varianza de la muestra, s2, es igual a la suma de la última columna (9,7375) dividida entre el número total de valores de datos menos uno (20 – 1):

s 2 = 9,7375 201 =0,5125 s 2 = 9,7375 201 =0,5125

La desviación típica de la muestra s es igual a la raíz cuadrada de la varianza de la muestra:

s= 0,5125 =0,715891, s= 0,5125 =0,715891, que se redondea a dos decimales, s = 0,72.

Normalmente, el cálculo de la desviación típica se realiza en la calculadora o en la computadora. Los resultados intermedios no están redondeados para mayor exactitud.

Translation missing: es.problem

  • En los siguientes problemas, recuerde que valor = media + (n.º de STDEV)(desviación típica). Compruebe la media y la desviación típica con una calculadora o una computadora.
  • Para una muestra: X = x ¯ x ¯ + (n.º de STDEV)(s)
  • Para una población: x = μ + (n.º de STDEV)(σ)
  • Para este ejemplo, utilice x = x ¯ x ¯ + (n.º de STDEV)(s) porque los datos son de una muestra.
  1. Compruebe la media y la desviación típica en su calculadora o computadora.
  2. Halle el valor que está una desviación típica por encima de la media. Calcule ( x ¯ x ¯ + 1s).
  3. Halle el valor que está dos desviaciones típicas por debajo de la media. Calcule ( x ¯ x ¯ – 2s).
  4. Halle los valores que están a 1,5 desviaciones típicas de (por debajo y por encima) la media.

Inténtelo 2.32

En un equipo de béisbol, las edades de cada uno de los jugadores son las siguientes:

21; 21; 22; 23; 24; 24; 25; 25; 28; 29; 29; 31; 32; 33; 33; 34; 35; 36; 36; 36; 36; 38; 38; 38; 40


Utilice su calculadora o computadora para hallar la media y la desviación típica. A continuación, halle el valor que está dos desviaciones típicas por encima de la media.

Explicación del cálculo de la desviación típica que aparece en la tabla

Las desviaciones muestran la dispersión de los datos respecto a la media. El valor de los datos 11,5 está más alejado de la media que el valor de los datos 11, lo que se indica con las desviaciones 0,97 y 0,47. Una desviación positiva se produce cuando el valor de los datos es mayor que la media, mientras que una desviación negativa se produce cuando el valor de los datos es menor que la media. La desviación es de –1,525 para el noveno valor de los datos. Si se suman las desviaciones, la suma es siempre cero (según el Ejemplo 2.32, hay n = 20 desviaciones). Por lo tanto, no se puede simplemente sumar las desviaciones para obtener la dispersión de los datos. Al elevar al cuadrado las desviaciones se convierten en números positivos, y la suma también será positiva. La varianza, por tanto, es la desviación promedio al cuadrado.

La varianza es una medida al cuadrado y no tiene las mismas unidades que los datos. Calcular la raíz cuadrada resuelve el problema. La desviación típica mide la dispersión en las mismas unidades que los datos.

Observe que en vez de dividir entre n = 20, el cálculo divide entre n – 1 = 20 – 1 = 19 porque los datos son una muestra. Para la varianza de la muestra, se divide entre el tamaño de la muestra menos uno (n – 1). ¿Por qué no dividir entre n? La respuesta tiene que ver con la varianza de la población. La varianza de la muestra es una estimación de la varianza de la población. Basándose en la matemática teórica que hay detrás de estos cálculos, al dividir entre (n – 1) da una mejor estimación de la varianza de la población.

NOTA

Debe concentrarse en lo que la desviación típica nos dice sobre los datos. La desviación típica es un número que mide la dispersión de los datos con respecto a la media. Efectúe la aritmética con una calculadora o una computadora.

La desviación típica, s o σ, es cero o mayor que cero. La descripción de los datos con referencia a la dispersión se denomina “variabilidad”. La variabilidad de los datos depende del método con el que se obtienen los resultados; por ejemplo, por medición o por muestreo aleatorio. Cuando la desviación típica es cero, no hay dispersión; es decir, todos los valores de los datos son iguales entre sí. La desviación típica es pequeña cuando todos los datos se concentran cerca de la media, y es mayor cuando los valores de los datos muestran más variación con respecto a la media. Cuando la desviación típica es mucho mayor que cero, los valores de los datos están muy dispersos alrededor de la media; los valores atípicos pueden hacer que s o σ sean muy grandes.

La desviación típica, cuando se presenta por primera vez, puede parecer poco clara. Al graficar los datos, puede tener una mejor "percepción" de las desviaciones y la desviación típica. Encontrará que en las distribuciones simétricas la desviación típica puede ser muy útil, pero en las distribuciones sesgadas, es posible que la desviación típica no sea de mucha ayuda. La razón es que los dos lados de una distribución sesgada tienen diferentes márgenes. En una distribución sesgada, es mejor fijarse en el primer cuartil, la mediana, el tercer cuartil, el valor más pequeño y el valor más grande. Como los números pueden ser confusos, siempre hay que hacer un gráfico de los datos. Visualice sus datos en un histograma o un diagrama de caja y bigotes.

Ejemplo 2.33

Translation missing: es.problem

Utilice los siguientes datos (calificaciones del primer examen) de la clase de Precálculo de primavera de Susan Dean:

33; 42; 49; 49; 53; 55; 55; 61; 63; 67; 68; 68; 69; 69; 72; 73; 74; 78; 80; 83; 88; 88; 88; 90; 92; 94; 94; 94; 94; 96; 100

  1. Cree un gráfico que contenga los datos, las frecuencias, las frecuencias relativas y las frecuencias relativas acumuladas con tres decimales.
  2. Calcule lo siguiente con un decimal utilizando una calculadora TI-83+ o TI-84:
    1. La media muestral
    2. La desviación típica de la muestra
    3. La mediana
    4. El primer cuartil
    5. El tercer cuartil
    6. IQR
  3. Construya un diagrama de caja y bigotes y un histograma en el mismo conjunto de ejes. Comente sobre el diagrama de caja y bigotes, el histograma y el gráfico.

El largo bigote izquierdo del diagrama de caja y bigotes se refleja en la parte izquierda del histograma. La dispersión de las calificaciones del examen en el 50 % inferior es mayor (73 - 33 = 40) que la dispersión en el 50 % superior (100 - 73 = 27). El histograma, el diagrama de caja y bigotes y el gráfico lo reflejan. Hay un número considerable de notas A y B (80, 90 y 100). El histograma lo muestra claramente. El diagrama de caja y bigotes nos muestra que el 50 % de las calificaciones del examen (IQR = 29) son D, C y B. El diagrama de caja también nos muestra que el 25 % inferior de las puntuaciones del examen son D y F.

Inténtelo 2.33

Los siguientes datos muestran los diferentes tipos de alimentos para mascotas que tienen las tiendas de la zona.
6; 6; 6; 6; 7; 7; 7; 7; 7; 8; 9; 9; 9; 9; 10; 10; 10; 10; 10; 11; 11; 11; 11; 12; 12; 12; 12; 12; 12;
Calcule la media muestral y la desviación típica de la muestra con un decimal utilizando una calculadora TI-83+ o TI-84.

Desviación típica de las tablas de frecuencia agrupadas

Recordemos que para los datos agrupados no conocemos los valores individuales de los datos, por lo que no podemos describir el valor típico de los datos con precisión. En otras palabras, no podemos hallar la media, la mediana ni la moda exactas. Sin embargo, podemos determinar la mejor estimación de las medidas de centro al hallar la media de los datos agrupados con la fórmula Tabla de media de la frecuencia= em e Tabla de media de la frecuencia= em e
donde e=e= frecuencias de intervalo y m = puntos medios del intervalo.

Al igual que no podemos hallar la media exacta, tampoco podemos hallar la desviación típica exacta. Recuerde que la desviación típica describe numéricamente la desviación esperada que tiene un valor de datos con respecto a la media. En términos sencillos, la desviación típica nos permite comparar lo “inusual” que son los datos individuales en comparación con la media.

Ejemplo 2.34

Calcule la desviación típica de los datos en la Tabla 2.31.

Clase Frecuencia, f Punto medio, m m2 x¯ x¯ 2fm2Desviación típica
0–21117,58 13,5
3–564167,58 963,5
6–8107497,58 4903,5
9–117101007,58 7003,5
12–140131697,58 03,5
15–172162567,58 5123,5
Tabla 2.31

Para este conjunto de datos, tenemos la media, x ¯ x ¯ = 7,58 y la desviación típica, sx = 3,5. Esto significa que se espera que un valor de datos seleccionado al azar se aleje 3,5 unidades de la media. Si observamos la primera clase, vemos que el punto medio de la clase es igual a uno. Esto supone casi dos desviaciones típicas completas de la media, ya que 7,58 - 3,5 - 3,5 = 0,58. La fórmula para calcular la desviación típica no es complicada, s x = e (m x ¯ ) 2 n1 s x = e (m x ¯ ) 2 n1 donde sx = desviación típica de la muestra, x ¯ x ¯ = media muestral, los cálculos son tediosos. Por lo general, lo mejor es utilizar la tecnología para realizar los cálculos.

Inténtelo 2.34

Calcule la desviación típica de los datos del ejemplo anterior

ClaseFrecuencia, f
0–21
3–56
6–810
9–117
12–140
15–172
Tabla 2.32

Primero, pulse la tecla STAT y seleccione 1:Edit

Imagen de la pantalla de una calculadora TI. Después de pulsar la tecla STAT, la pantalla muestra las opciones del menú superior EDIT, CALC, TESTS. Se selecciona EDIT. Debajo del menú superior, opción 1: Edit... está seleccionado.
Figura 2.26

Introduzca los valores del punto medio en L1 y las frecuencias en L2

Imagen de la pantalla de una calculadora TI. La lista L1 muestra las entradas 1, 4, 7, 10, 13, 16. La lista L2 muestra 1, 6, 10, 7, 0, 2.
Figura 2.27

Seleccione STAT, CALC, y 1: 1-Var Stats

Imagen de la pantalla de una calculadora TI. Después de pulsar la tecla STAT, la pantalla muestra las opciones del menú superior EDIT, CALC, TESTS. Se selecciona CALC. Debajo del menú superior, opción 1: Se selecciona 1-Var Stats.
Figura 2.28

Seleccione 2nd luego 1 luego, 2nd y por último, 2 Enter

Imagen de la pantalla de una calculadora TI. En la parte superior de la pantalla, la marca muestra 1-Var Stats. Debajo de esta marca, la pantalla muestra barra X = 7,576923077, sigma mayúscula x = 197, sigma mayúscula x al cuadrado = 1799, Sx = 3,500549407, y sigma en minúsculas = 3,432571103, n = 26.
Figura 2.29

Verá que se muestra tanto la desviación típica de la población, σx, como la desviación típica de la muestra, sx.

Comparación de valores de diferentes conjuntos de datos

La desviación típica es útil cuando se comparan valores de datos que provienen de diferentes conjuntos de datos. Si los conjuntos de datos tienen medias y desviaciones típicas diferentes, la comparación directa de los valores de los datos puede ser engañosa.

  • Calcule cuántas desviaciones típicas se alejan de su media para cada valor de los datos.
  • Utilice la fórmula: valor = media + (n.º de STDEV)(desviación típica); resuelva para n.º de STDEVs.
  • n.ºoeSTDEVs= valor - media desviación típica n.ºoeSTDEVs= valor - media desviación típica
  • Compare los resultados de este cálculo.

N.º de STDEV suele llamarse “puntuación z”; podemos utilizar el símbolo z. En símbolos, las fórmulas se convierten en:

Muestra xx = x¯ x + zs z= x   x ¯ s z= x   x ¯ s
Población xx = μ μ + z= x  μ σ z= x  μ σ
Tabla 2.33

Ejemplo 2.35

Translation missing: es.problem

Dos estudiantes, John y Ali, de diferentes escuelas secundarias, querían averiguar quién tenía el mejor GPA en comparación con su escuela. ¿Cuál estudiante tiene el mejor GPA en comparación con su escuela?

Estudiante GPA Media de las calificaciones escolares (Grade Point Average, GPA) Desviación típica de la escuela
John 2,85 3,0 0,7
Ali 77 80 10
Tabla 2.34

Inténtelo 2.35

Dos nadadoras, Angie y Beth, de equipos diferentes, querían averiguar quién tenía el tiempo más rápido en los 50 metros libres en comparación con su equipo. ¿Qué nadadora tuvo el mejor tiempo en comparación con su equipo?

NadadoraTiempo (segundos)Tiempo medio del equipo Desviación típica del equipo
Angie26,227,20,8
Beth27,330,11,4
Tabla 2.35

Las siguientes listas ofrecen algunos hechos que proporcionan un poco más de información sobre lo que la desviación típica nos dice sobre la distribución de los datos.

Para CUALQUIER conjunto de datos, no importa cuál sea la distribución de los datos:
  • Al menos el 75 % de los datos están dentro de las dos desviaciones típicas de la media.
  • Al menos el 89 % de los datos están dentro de las tres desviaciones típicas de la media.
  • Al menos el 95 % de los datos están dentro de 4,5 desviaciones típicas de la media.
  • Esto se conoce como la regla de Chebyshev.
Para los datos que tienen una distribución en FORMA DE CAMPANA y SIMÉTRICA:
  • Aproximadamente el 68 % de los datos están dentro de una desviación típica de la media.
  • Aproximadamente el 95 % de los datos están dentro de las dos desviaciones típicas de la media.
  • Más del 99 % de los datos están dentro de las tres desviaciones típicas de la media.
  • Esto se conoce como la regla empírica.
  • Es importante señalar que esta regla solo se aplica cuando la forma de la distribución de los datos tiene forma de campana y es simétrica. Aprenderemos más sobre esto cuando estudiemos la distribución de probabilidad “normal” o “gaussiana” en capítulos posteriores.
Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.