Barbara Illowsky; Susan Dean

2.7 Medidas de la dispersión de los datos

Una característica importante de cualquier conjunto de datos es su variación. En algunos conjuntos de datos, los valores de los datos se concentran muy cerca de la media; en otros, están más dispersos de la media. La medida más común de variación, o dispersión, es la desviación típica. La desviación típica es un número que mide la distancia entre los valores de los datos y su media.

La desviación típica

proporciona una medida numérica de la cantidad global de variación en un conjunto de datos y
se puede usar para determinar si un valor de datos determinado está cerca o lejos de la media.

La desviación típica proporciona una medida de la variación global de un conjunto de datos

La desviación típica es siempre positiva o cero. La desviación típica es pequeña cuando todos los datos se concentran cerca de la media y muestran poca variación o dispersión. La desviación típica es mayor cuando los valores de los datos están más alejados de la media y muestran más variación.

Supongamos que estudiamos el tiempo que los clientes esperan en la fila de la caja del supermercado A y del supermercado B. El tiempo promedio de espera en ambos supermercados es de cinco minutos. En el supermercado A, la desviación típica del tiempo de espera es de dos minutos; en el supermercado B, la desviación típica del tiempo de espera es de cuatro minutos.

Como el supermercado B tiene una desviación típica más alta, sabemos que hay más variación en los tiempos de espera en el supermercado B. En general, los tiempos de espera en el supermercado B están más dispersos del promedio; los tiempos de espera en el supermercado A están más concentrados cerca del promedio.

La desviación típica se puede usar para determinar si un valor de los datos está cerca o lejos de la media.

Supongamos que Rosa y Binh compran en el supermercado A. Rosa espera en la caja siete minutos y Binh espera un minuto. En el supermercado A, el tiempo medio de espera es de cinco minutos y la desviación típica es de dos minutos. La desviación típica se puede usar para determinar si un valor de los datos está cerca o lejos de la media.

Rosa espera siete minutos:

Siete son dos minutos más que el promedio de cinco; dos minutos equivalen a una desviación típica.
El tiempo de espera de Rosa, de siete minutos, es dos minutos más largo que el promedio de cinco minutos.
El tiempo de espera de Rosa, de siete minutos, está una desviación típica por encima del promedio de cinco minutos.

Binh espera un minuto.

Uno es cuatro minutos menos que el promedio de cinco; cuatro minutos equivalen a dos desviaciones típicas.
El tiempo de espera de Binh, de un minuto, es cuatro minutos menos que el promedio de cinco minutos.
El tiempo de espera de Binh, de un minuto, está dos desviaciones típicas por debajo del promedio de cinco minutos.
Un valor de los datos que está a dos desviaciones típicas del promedio está justo en el límite de lo que muchos estadísticos considerarían alejado del promedio. Plantearse que los datos están lejos de la media si están a más de dos desviaciones típicas es más una "regla general" aproximada que una regla rígida. En general, la forma de la distribución de los datos afecta a la cantidad de datos que se encuentran más allá de dos desviaciones típicas. (En los capítulos siguientes aprenderá más sobre este punto).

La recta numérica puede ayudarlo a entender la desviación típica. Si ponemos el cinco y el siete en una recta numérica, el siete está a la derecha del cinco. Decimos, entonces, que siete está una desviación típica a la derecha de cinco porque 5 + (1)(2) = 7.

Si el número uno también formara parte del conjunto de datos, entonces estaría dos desviaciones típicas a la izquierda de cinco porque 5 + (-2)(2) = 1.

Figura 2.24

En general, un valor = media + (n.º de STDEV) (número de STandard DEViation, o desviación típica)
donde n.º de STDEV = el número de desviaciones típicas
El n.º de STDEV no tiene que ser un número entero
Uno es dos desviaciones típicas menos que la media de cinco porque: 1 = 5 + (-2)(2).

La ecuación valor = media + (n.º de STDEV)(desviación típica) puede expresarse para una muestra y para una población.

muestra: $x = \bar{x} + (n.º o e S T D E V) (s)$
Población: $x = μ + (n.º o e S T D E V) (σ)$

La letra minúscula s representa la desviación típica de la muestra y la letra griega σ (sigma, minúscula) representa la desviación típica de la población.

El símbolo $\bar{x}$ es la media muestral y el símbolo griego $μ$ es la media de la población.

Cálculo de la desviación típica

Si x es un número, la diferencia "x – media" se llama su desviación. En un conjunto de datos hay tantas desviaciones como elementos en el conjunto de datos. Las desviaciones se utilizan para calcular la desviación típica. Si los números pertenecen a una población, en símbolos una desviación es x – μ. Para los datos de la muestra, en símbolos una desviación es x – $\bar{x}$ .

El procedimiento para calcular la desviación típica depende de si los números son toda la población o son datos de una muestra. Los cálculos son similares, pero no idénticos. Por tanto, el símbolo utilizado para representar la desviación típica depende de si se calcula a partir de una población o de una muestra. La letra minúscula s representa la desviación típica de la muestra y la letra griega σ (sigma, minúscula) representa la desviación típica de la población. Si la muestra tiene las mismas características que la población, entonces s debería ser una buena estimación de σ.

Para calcular la desviación típica, tenemos que calcular primero la varianza. La varianza es el promedio de los cuadrados de las desviaciones (la x – $\bar{x}$ para una muestra, o los valores x – μ para una población). El símbolo σ² representa la varianza de la población; la desviación típica de la población σ es la raíz cuadrada de la varianza de la población. El símbolo s² representa la varianza de la muestra; la desviación típica de la muestra s es la raíz cuadrada de la varianza de la muestra. Puede pensar en la desviación típica como un promedio especial de las desviaciones.

Si las cifras proceden de un censo de toda la población y no de una muestra, cuando calculamos el promedio de las desviaciones al cuadrado para hallar la varianza, dividimos entre N, el número de elementos de la población. Si los datos proceden de una muestra y no de una población, al calcular el promedio de las desviaciones al cuadrado, dividimos entre n – 1, uno menos que el número de elementos de la muestra.

Fórmulas para la desviación típica de la muestra

$s = \sqrt{\frac{Σ {(x - \bar{x})}^{2}}{n - 1}}$ o $s = \sqrt{\frac{Σ e {(x - \bar{x})}^{2}}{n - 1}}$
Para la desviación típica de la muestra, el denominador es n – 1, es decir, el tamaño de la muestra MENOS 1.

Fórmulas para la desviación típica de la población

$σ = \sqrt{\frac{Σ {(x - μ)}^{2}}{N}}$ o $σ = \sqrt{\frac{Σ e {(x - μ)}^{2}}{N}}$
Para la desviación típica de la población el denominador es N, el número de elementos de la población.

En estas fórmulas, f representa la frecuencia con la que aparece un valor. Por ejemplo, si un valor aparece una vez, f es uno. Si un valor aparece tres veces en el conjunto de datos o población, f es tres.

Variabilidad muestral de una estadística

La estadística de una distribución muestral se trató en Estadística descriptiva: medidas del centro de los datos. El grado de variación de la estadística de una muestra a otra se conoce como variabilidad muestral de una estadística. Normalmente se mide la variabilidad muestral de una estadística por su error estándar. El error estándar de la media es un ejemplo de error estándar. Es una desviación típica especial y se conoce como la desviación típica de la distribución muestral de la media. El error estándar de la media se tratará en el capítulo El teorema del límite central en otro momento. La notación para el error estándar de la media es $\frac{σ}{\sqrt{n}}$ donde σ es la desviación típica de la población y n es el tamaño de la muestra.

NOTA

En la práctica, UTILICE UNA CALCULADORA O UN SOFTWARE DE COMPUTADORA PARA CALCULAR LA DESVIACIÓN TÍPICA. Si está utilizando una calculadora TI-83, 83+ u 84+, debe seleccionar la desviación típica σ_x o s_x correspondiente de las estadísticas de resumen. Nos centraremos en la utilización e interpretación de la información que nos proporciona la desviación típica. Sin embargo, debería estudiar el siguiente ejemplo paso a paso para entender cómo la desviación típica mide la variación de la media. (Las instrucciones de la calculadora aparecen al final de este ejemplo).

Ejemplo 2.32

En una clase de quinto grado la maestra estaba interesada en la edad promedio y la desviación típica de la muestra de las edades de sus estudiantes. Los siguientes datos son las edades de una MUESTRA de n = 20 estudiantes de quinto grado. Las edades están redondeadas al medio año más cercano:

9; 9,5; 9,5; 10; 10; 10; 10; 10,5; 10,5; 10,5; 10,5; 11; 11; 11; 11; 11; 11; 11,5; 11,5; 11,5;

\bar{x} = \frac{9 + 9,5(2) + 10(4) + 10,5(4) + 11(6) + 11,5(3)}{20} = 10,525

La edad promedio es de 10,53 años, redondeada a dos cifras.

La varianza se puede calcular mediante una tabla. A continuación se calcula la desviación típica tomando la raíz cuadrada de la varianza. Explicaremos las partes de la tabla después de calcular s.

Datos	Frec.	Desviaciones	Desviaciones²	(Frecuencia)(Desviaciones²)
x	f	(x – $\bar{x}$ )	(x – $\bar{x}$ )²	(f)(x – $\bar{x}$ )²
9	1	9 – 10,525 = –1,525	(–1,525)² = 2,325625	1 × 2,325625 = 2,325625
9,5	2	9,5 – 10,525 = –1,025	(–1,025)² = 1,050625	2 × 1,050625 = 2,101250
10	4	10 – 10,525 = –0,525	(–0,525)² = 0,275625	4 × 0,275625 = 1,1025
10,5	4	10,5 – 10,525 = –0,025	(–0,025)² = 0,000625	4 × 0,000625 = 0,0025
11	6	11 – 10,525 = 0,475	(0,475)² = 0,225625	6 × 0,225625 = 1,35375
11,5	3	11,5 – 10,525 = 0,975	(0,975)² = 0,950625	3 × 0,950625 = 2,851875
				El total es 9,7375

Tabla 2.29

La varianza de la muestra, s², es igual a la suma de la última columna (9,7375) dividida entre el número total de valores de datos menos uno (20 – 1):

$s^{2} = \frac{9,7375}{20 - 1} = 0,5125$

La desviación típica de la muestra s es igual a la raíz cuadrada de la varianza de la muestra:

$s = \sqrt{0,5125} = 0,715891,$ que se redondea a dos decimales, s = 0,72.

Normalmente, el cálculo de la desviación típica se realiza en la calculadora o en la computadora. Los resultados intermedios no están redondeados para mayor exactitud.

Translation missing: es.problem

En los siguientes problemas, recuerde que valor = media + (n.º de STDEV)(desviación típica). Compruebe la media y la desviación típica con una calculadora o una computadora.
Para una muestra: X = $\bar{x}$ + (n.º de STDEV)(s)
Para una población: x = μ + (n.º de STDEV)(σ)
Para este ejemplo, utilice x = $\bar{x}$ + (n.º de STDEV)(s) porque los datos son de una muestra.

Compruebe la media y la desviación típica en su calculadora o computadora.
Halle el valor que está una desviación típica por encima de la media. Calcule ( $\bar{x}$ + 1s).
Halle el valor que está dos desviaciones típicas por debajo de la media. Calcule ( $\bar{x}$ – 2s).
Halle los valores que están a 1,5 desviaciones típicas de (por debajo y por encima) la media.

Solución

Uso de las calculadoras TI-83, 83+, 84, 84+
- Borre las listas L1 y L2. Pulse STAT 4:ClrList. Introduzca el 2nd 1 para L1, la coma (,), y el 2nd 2 para L2.
- Introduzca los datos en el editor de listas. Pulse STAT 1:EDIT. Si es necesario, borre las listas subiendo con la flecha hasta el nombre. Pulse CLEAR y mueva la flecha hacia abajo.
- Ponga los valores de los datos (9, 9,5, 10, 10,5, 11, 11,5) en la lista L1 y las frecuencias (1, 2, 4, 4, 6, 3) en la lista L2. Utilice las teclas de flecha para moverse.
- Pulse STAT y la flecha hacia CALC. Pulse 1:1-VarStats e introduzca L1 (2nd 1), L2 (2nd 2). No olvide la coma. Pulse ENTER.
- $\bar{x}$ = 10,525
- Utilice Sx porque se trata de datos de muestra (no de una población): Sx=0,715891
( $\bar{x}$ + 1s) = 10,53 + (1)(0,72) = 11,25
( $\bar{x}$ – 2s) = 10,53 - (2)(0,72) = 9,09
- ( $\bar{x}$ – 1,5s) = 10,53 - (1,5)(0,72) = 9,45
- ( $\bar{x}$ + 1,5s) = 10,53 + (1,5)(0,72) = 11,61

Inténtelo 2.32

En un equipo de béisbol, las edades de cada uno de los jugadores son las siguientes:

21; 21; 22; 23; 24; 24; 25; 25; 28; 29; 29; 31; 32; 33; 33; 34; 35; 36; 36; 36; 36; 38; 38; 38; 40

Utilice su calculadora o computadora para hallar la media y la desviación típica. A continuación, halle el valor que está dos desviaciones típicas por encima de la media.

Explicación del cálculo de la desviación típica que aparece en la tabla

Las desviaciones muestran la dispersión de los datos respecto a la media. El valor de los datos 11,5 está más alejado de la media que el valor de los datos 11, lo que se indica con las desviaciones 0,97 y 0,47. Una desviación positiva se produce cuando el valor de los datos es mayor que la media, mientras que una desviación negativa se produce cuando el valor de los datos es menor que la media. La desviación es de –1,525 para el noveno valor de los datos. Si se suman las desviaciones, la suma es siempre cero (según el Ejemplo 2.32, hay n = 20 desviaciones). Por lo tanto, no se puede simplemente sumar las desviaciones para obtener la dispersión de los datos. Al elevar al cuadrado las desviaciones se convierten en números positivos, y la suma también será positiva. La varianza, por tanto, es la desviación promedio al cuadrado.

La varianza es una medida al cuadrado y no tiene las mismas unidades que los datos. Calcular la raíz cuadrada resuelve el problema. La desviación típica mide la dispersión en las mismas unidades que los datos.

Observe que en vez de dividir entre n = 20, el cálculo divide entre n – 1 = 20 – 1 = 19 porque los datos son una muestra. Para la varianza de la muestra, se divide entre el tamaño de la muestra menos uno (n – 1). ¿Por qué no dividir entre n? La respuesta tiene que ver con la varianza de la población. La varianza de la muestra es una estimación de la varianza de la población. Basándose en la matemática teórica que hay detrás de estos cálculos, al dividir entre (n – 1) da una mejor estimación de la varianza de la población.

NOTA

Debe concentrarse en lo que la desviación típica nos dice sobre los datos. La desviación típica es un número que mide la dispersión de los datos con respecto a la media. Efectúe la aritmética con una calculadora o una computadora.

La desviación típica, s o σ, es cero o mayor que cero. La descripción de los datos con referencia a la dispersión se denomina “variabilidad”. La variabilidad de los datos depende del método con el que se obtienen los resultados; por ejemplo, por medición o por muestreo aleatorio. Cuando la desviación típica es cero, no hay dispersión; es decir, todos los valores de los datos son iguales entre sí. La desviación típica es pequeña cuando todos los datos se concentran cerca de la media, y es mayor cuando los valores de los datos muestran más variación con respecto a la media. Cuando la desviación típica es mucho mayor que cero, los valores de los datos están muy dispersos alrededor de la media; los valores atípicos pueden hacer que s o σ sean muy grandes.

La desviación típica, cuando se presenta por primera vez, puede parecer poco clara. Al graficar los datos, puede tener una mejor "percepción" de las desviaciones y la desviación típica. Encontrará que en las distribuciones simétricas la desviación típica puede ser muy útil, pero en las distribuciones sesgadas, es posible que la desviación típica no sea de mucha ayuda. La razón es que los dos lados de una distribución sesgada tienen diferentes márgenes. En una distribución sesgada, es mejor fijarse en el primer cuartil, la mediana, el tercer cuartil, el valor más pequeño y el valor más grande. Como los números pueden ser confusos, siempre hay que hacer un gráfico de los datos. Visualice sus datos en un histograma o un diagrama de caja y bigotes.

Ejemplo 2.33

Translation missing: es.problem

Utilice los siguientes datos (calificaciones del primer examen) de la clase de Precálculo de primavera de Susan Dean:

33; 42; 49; 49; 53; 55; 55; 61; 63; 67; 68; 68; 69; 69; 72; 73; 74; 78; 80; 83; 88; 88; 88; 90; 92; 94; 94; 94; 94; 96; 100

Cree un gráfico que contenga los datos, las frecuencias, las frecuencias relativas y las frecuencias relativas acumuladas con tres decimales.
Calcule lo siguiente con un decimal utilizando una calculadora TI-83+ o TI-84:
1. La media muestral
2. La desviación típica de la muestra
3. La mediana
4. El primer cuartil
5. El tercer cuartil
6. IQR
Construya un diagrama de caja y bigotes y un histograma en el mismo conjunto de ejes. Comente sobre el diagrama de caja y bigotes, el histograma y el gráfico.

Solución

Vea la Tabla 2.30
1. La media muestral = 73,5
2. La desviación típica de la muestra = 17,9
3. La mediana = 73
4. El primer cuartil = 61
5. El tercer cuartil = 90
6. IQR = 90 – 61 = 29
El eje x va de 32,5 a 100,5; el eje y va de –2,4 a 15 en el histograma. El número de intervalos es cinco, por lo que la anchura de un intervalo es (100,5 – 32,5) dividida entre cinco, es igual a 13,6. Los puntos finales de los intervalos son los siguientes: el punto de partida es 32,5, 32,5 + 13,6 = 46,1, 46,1 + 13,6 = 59,7, 59,7 + 13,6 = 73,3, 73,3 + 13,6 = 86,9, 86,9 + 13,6 = 100,5 = el valor final; ningún valor de los datos cae en un límite de intervalo.

Datos	Frecuencia	Frecuencia relativa	Frecuencia relativa acumulada
33	1	0,032	0,032
42	1	0,032	0,064
49	2	0,065	0,129
53	1	0,032	0,161
55	2	0,065	0,226
61	1	0,032	0,258
63	1	0,032	0,29
67	1	0,032	0,322
68	2	0,065	0,387
69	2	0,065	0,452
72	1	0,032	0,484
73	1	0,032	0,516
74	1	0,032	0,548
78	1	0,032	0,580
80	1	0,032	0,612
83	1	0,032	0,644
88	3	0,097	0,741
90	1	0,032	0,773
92	1	0,032	0,805
94	4	0,129	0,934
96	1	0,032	0,966
100	1	0,032	0,998 (¿Por qué este valor no es 1?)

Tabla 2.30

El largo bigote izquierdo del diagrama de caja y bigotes se refleja en la parte izquierda del histograma. La dispersión de las calificaciones del examen en el 50 % inferior es mayor (73 - 33 = 40) que la dispersión en el 50 % superior (100 - 73 = 27). El histograma, el diagrama de caja y bigotes y el gráfico lo reflejan. Hay un número considerable de notas A y B (80, 90 y 100). El histograma lo muestra claramente. El diagrama de caja y bigotes nos muestra que el 50 % de las calificaciones del examen (IQR = 29) son D, C y B. El diagrama de caja también nos muestra que el 25 % inferior de las puntuaciones del examen son D y F.

Inténtelo 2.33

Los siguientes datos muestran los diferentes tipos de alimentos para mascotas que tienen las tiendas de la zona.
6; 6; 6; 6; 7; 7; 7; 7; 7; 8; 9; 9; 9; 9; 10; 10; 10; 10; 10; 11; 11; 11; 11; 12; 12; 12; 12; 12; 12;
Calcule la media muestral y la desviación típica de la muestra con un decimal utilizando una calculadora TI-83+ o TI-84.

Desviación típica de las tablas de frecuencia agrupadas

Recordemos que para los datos agrupados no conocemos los valores individuales de los datos, por lo que no podemos describir el valor típico de los datos con precisión. En otras palabras, no podemos hallar la media, la mediana ni la moda exactas. Sin embargo, podemos determinar la mejor estimación de las medidas de centro al hallar la media de los datos agrupados con la fórmula $Tabla de media de la frecuencia = \frac{\sum e m}{\sum e}$
donde $e =$ frecuencias de intervalo y m = puntos medios del intervalo.

Al igual que no podemos hallar la media exacta, tampoco podemos hallar la desviación típica exacta. Recuerde que la desviación típica describe numéricamente la desviación esperada que tiene un valor de datos con respecto a la media. En términos sencillos, la desviación típica nos permite comparar lo “inusual” que son los datos individuales en comparación con la media.

Ejemplo 2.34

Calcule la desviación típica de los datos en la Tabla 2.31.

Clase	Frecuencia, f	Punto medio, m	m²	$\bar{x}$ ²	fm²	Desviación típica
0–2	1	1	1	7,58	1	3,5
3–5	6	4	16	7,58	96	3,5
6–8	10	7	49	7,58	490	3,5
9–11	7	10	100	7,58	700	3,5
12–14	0	13	169	7,58	0	3,5
15–17	2	16	256	7,58	512	3,5

Tabla 2.31

Para este conjunto de datos, tenemos la media, $\bar{x}$ = 7,58 y la desviación típica, s_x = 3,5. Esto significa que se espera que un valor de datos seleccionado al azar se aleje 3,5 unidades de la media. Si observamos la primera clase, vemos que el punto medio de la clase es igual a uno. Esto supone casi dos desviaciones típicas completas de la media, ya que 7,58 - 3,5 - 3,5 = 0,58. La fórmula para calcular la desviación típica no es complicada, $s_{x} = \sqrt{\frac{e {(m - \bar{x})}^{2}}{n - 1}}$ donde s_x = desviación típica de la muestra, $\bar{x}$ = media muestral, los cálculos son tediosos. Por lo general, lo mejor es utilizar la tecnología para realizar los cálculos.

Inténtelo 2.34

Calcule la desviación típica de los datos del ejemplo anterior

Clase	Frecuencia, f
0–2	1
3–5	6
6–8	10
9–11	7
12–14	0
15–17	2

Tabla 2.32

Primero, pulse la tecla STAT y seleccione 1:Edit

Imagen de la pantalla de una calculadora TI. Después de pulsar la tecla STAT, la pantalla muestra las opciones del menú superior EDIT, CALC, TESTS. Se selecciona EDIT. Debajo del menú superior, opción 1: Edit... está seleccionado. — Figura 2.26

Introduzca los valores del punto medio en L1 y las frecuencias en L2

Imagen de la pantalla de una calculadora TI. La lista L1 muestra las entradas 1, 4, 7, 10, 13, 16. La lista L2 muestra 1, 6, 10, 7, 0, 2. — Figura 2.27

Seleccione STAT, CALC, y 1: 1-Var Stats

Seleccione 2^nd luego 1 luego, 2^nd y por último, 2 Enter

Imagen de la pantalla de una calculadora TI. En la parte superior de la pantalla, la marca muestra 1-Var Stats. Debajo de esta marca, la pantalla muestra barra X = 7,576923077, sigma mayúscula x = 197, sigma mayúscula x al cuadrado = 1799, Sx = 3,500549407, y sigma en minúsculas = 3,432571103, n = 26. — Figura 2.29

Verá que se muestra tanto la desviación típica de la población, σ_x, como la desviación típica de la muestra, s_x.

Comparación de valores de diferentes conjuntos de datos

La desviación típica es útil cuando se comparan valores de datos que provienen de diferentes conjuntos de datos. Si los conjuntos de datos tienen medias y desviaciones típicas diferentes, la comparación directa de los valores de los datos puede ser engañosa.

Calcule cuántas desviaciones típicas se alejan de su media para cada valor de los datos.
Utilice la fórmula: valor = media + (n.º de STDEV)(desviación típica); resuelva para n.º de STDEVs.
$n.º o e S T D E V s = \frac{valor - media}{desviación típica}$
Compare los resultados de este cálculo.

N.º de STDEV suele llamarse “puntuación z”; podemos utilizar el símbolo z. En símbolos, las fórmulas se convierten en:

Muestra	$x$ = $\bar{x}$ + zs	$z = \frac{x - \bar{x}}{s}$
Población	$x$ = $μ$ + zσ	$z = \frac{x - μ}{σ}$

Tabla 2.33

Ejemplo 2.35

Translation missing: es.problem

Dos estudiantes, John y Ali, de diferentes escuelas secundarias, querían averiguar quién tenía el mejor GPA en comparación con su escuela. ¿Cuál estudiante tiene el mejor GPA en comparación con su escuela?

Estudiante	GPA	Media de las calificaciones escolares (Grade Point Average, GPA)	Desviación típica de la escuela
John	2,85	3,0	0,7
Ali	77	80	10

Tabla 2.34

Solución

Para cada estudiante, determine cuántas desviaciones típicas (n.º de STDEV) se aleja su GPA del promedio, para su escuela. Preste mucha atención a los signos al comparar e interpretar la respuesta.

$z = N.º de STDEV = \frac{valor - media}{desviación típica} = \frac{x - μ}{σ}$

Para John, $z = n.º o e S T D E V s = \frac{2,85 - 3,0}{0,7} = - 0,21$

Para Ali, $z = n.º o e S T D E V s = \frac{77 - 80}{10} = - 0,3$

John tiene el mejor GPA en comparación con su escuela porque su GPA está 0,21 desviaciones típicas por debajo de la media de su escuela mientras que el GPA de Ali está 0,3 desviaciones típicas por debajo de la media de su escuela.

La puntuación z de John, de –0,21, es mayor que la puntuación z de Ali, de –0,3. Para el GPA, los valores más altos son mejores, por lo que concluimos que John tiene el mejor GPA en comparación con su escuela.

Inténtelo 2.35

Dos nadadoras, Angie y Beth, de equipos diferentes, querían averiguar quién tenía el tiempo más rápido en los 50 metros libres en comparación con su equipo. ¿Qué nadadora tuvo el mejor tiempo en comparación con su equipo?

Nadadora	Tiempo (segundos)	Tiempo medio del equipo	Desviación típica del equipo
Angie	26,2	27,2	0,8
Beth	27,3	30,1	1,4

Tabla 2.35

Las siguientes listas ofrecen algunos hechos que proporcionan un poco más de información sobre lo que la desviación típica nos dice sobre la distribución de los datos.

Para CUALQUIER conjunto de datos, no importa cuál sea la distribución de los datos:

Al menos el 75 % de los datos están dentro de las dos desviaciones típicas de la media.
Al menos el 89 % de los datos están dentro de las tres desviaciones típicas de la media.
Al menos el 95 % de los datos están dentro de 4,5 desviaciones típicas de la media.
Esto se conoce como la regla de Chebyshev.

Para los datos que tienen una distribución en FORMA DE CAMPANA y SIMÉTRICA:

Aproximadamente el 68 % de los datos están dentro de una desviación típica de la media.
Aproximadamente el 95 % de los datos están dentro de las dos desviaciones típicas de la media.
Más del 99 % de los datos están dentro de las tres desviaciones típicas de la media.
Esto se conoce como la regla empírica.
Es importante señalar que esta regla solo se aplica cuando la forma de la distribución de los datos tiene forma de campana y es simétrica. Aprenderemos más sobre esto cuando estudiemos la distribución de probabilidad “normal” o “gaussiana” en capítulos posteriores.