Alexander Holmes; Barbara Illowsky; Susan Dean

2.7 Medidas de la dispersión de los datos

Una característica importante de cualquier conjunto de datos es su variación. En algunos conjuntos de datos, los valores de los datos se concentran muy cerca de la media; en otros, están más dispersos de la media. La medida más común de variación, o dispersión, es la desviación típica. La desviación típica es un número que mide la distancia entre los valores de los datos y su media.

La desviación típica

proporciona una medida numérica de la cantidad global de variación en un conjunto de datos y
se puede usar para determinar si un valor de datos determinado está cerca o lejos de la media.

La desviación típica proporciona una medida de la variación global de un conjunto de datos

La desviación típica es siempre positiva o cero. La desviación típica es pequeña cuando todos los datos se concentran cerca de la media y muestran poca variación o dispersión. La desviación típica es mayor cuando los valores de los datos están más alejados de la media y muestran más variación.

Supongamos que estamos estudiando el tiempo que los clientes esperan en la fila de la caja del supermercado A y del supermercado B. El tiempo promedio de espera en ambos supermercados es de cinco minutos. En el supermercado A, la desviación típica del tiempo de espera es de dos minutos; en el supermercado B, la desviación típica del tiempo de espera es de cuatro minutos.

Como el supermercado B tiene una desviación típica más alta, sabemos que hay más variación en los tiempos de espera en el supermercado B. En general, los tiempos de espera en el supermercado B están más dispersos del promedio; los tiempos de espera en el supermercado A están más concentrados cerca del promedio.

Cálculo de la desviación típica

Si x es un número, la diferencia "x menos la media" se denomina su deviación. En un conjunto de datos hay tantas desviaciones como elementos en el conjunto de datos. Las desviaciones se utilizan para calcular la desviación típica. Si los números pertenecen a una población, en símbolos una desviación es x – μ. Para los datos de la muestra, en símbolos una desviación es x – $\bar{x}$ .

El procedimiento para calcular la desviación típica depende de si los números son toda la población o son datos de una muestra. Los cálculos son similares, pero no idénticos. Por tanto, el símbolo utilizado para representar la desviación típica depende de si se calcula a partir de una población o de una muestra. La letra minúscula s representa la desviación típica de la muestra y la letra griega σ (sigma, minúscula) representa la desviación típica de la población. Si la muestra tiene las mismas características que la población, entonces s debería ser una buena estimación de σ.

Para calcular la desviación típica, tenemos que calcular primero la varianza. La varianza es el promedio de los cuadrados de las desviaciones (la x – $\bar{x}$ para una muestra, o los valores x – μ para una población). El símbolo σ² representa la varianza de la población; la desviación típica de la población σ es la raíz cuadrada de la varianza de la población. El símbolo s² representa la varianza de la muestra; la desviación típica de la muestra s es la raíz cuadrada de la varianza de la muestra. Puede pensar en la desviación típica como un promedio especial de las desviaciones. Formalmente, la varianza es el segundo momento de la distribución o el primer momento alrededor de la media. Recuerde que la media es el primer momento de la distribución.

Si las cifras proceden de un censo de toda la población y no de una muestra, cuando calculamos el promedio de las desviaciones al cuadrado para hallar la varianza, dividimos entre N, el número de elementos de la población. Si los datos proceden de una muestra y no de una población, al calcular el promedio de las desviaciones al cuadrado, dividimos entre n – 1, uno menos que el número de elementos de la muestra.

Fórmulas para la desviación típica de la muestra

$s = \sqrt{\frac{Σ {(x - \bar{x})}^{2}}{n - 1}}$ o $s = \sqrt{\frac{Σ f {(x - \bar{x})}^{2}}{n - 1}}$ o $s = \sqrt{\frac{(\sum_{i = 1}^{n} x^{2}) - n {\bar{x}}^{2}}{n - 1}}$
Para la desviación típica de la muestra, el denominador es n – 1, es decir, el tamaño de la muestra menos 1.

Fórmulas para la desviación típica de la población

$σ = \sqrt{\frac{Σ {(x - μ)}^{2}}{N}}$ o $σ = \sqrt{\frac{Σ f {(x - μ)}^{2}}{N}}$ o $σ = \sqrt{\frac{\sum_{i = 1}^{N} x_{i}^{2}}{N} - μ^{2}}$
Para la desviación típica de la población el denominador es N, el número de elementos de la población.

En estas fórmulas, f representa la frecuencia con la que aparece un valor. Por ejemplo, si un valor aparece una vez, f es uno. Si un valor aparece tres veces en el conjunto de datos o población, f es tres. Dos observaciones importantes sobre la varianza y la desviación típica: las desviaciones se miden a partir de la media y las desviaciones se elevan al cuadrado. En principio, las desviaciones podrían medirse desde cualquier punto, sin embargo, nuestro interés es la medición desde el peso central de los datos, lo que es el valor "normal" o más habitual de la observación. Más adelante trataremos de medir lo “inusual" de una observación o de una media muestral y, por tanto, necesitamos una medida a partir de la media. La segunda observación es que las desviaciones son al cuadrado. Esto tiene dos efectos: primero, hace que las desviaciones sean todas positivas y segundo, cambia las unidades de medida de la media y de las observaciones originales. Si los datos son pesos, la media se mide en libras, pero la varianza se mide en libras al cuadrado. Una de las razones para utilizar la desviación típica es volver a las unidades de medida originales tomando la raíz cuadrada de la varianza. Además, cuando las desviaciones se elevan al cuadrado su valor aumenta en gran medida. Por ejemplo, una desviación de 10 de la media al cuadrado es 100, pero una desviación de 100 de la media es 10.000. Lo que hace esto es dar un gran peso a los valores atípicos al calcular la varianza.

Tipos de variabilidad en las muestras

Cuando se trata de estudiar una población, a menudo se utiliza una muestra, ya sea por conveniencia o porque no es posible acceder a toda la población. La variabilidad es el término utilizado para describir las diferencias que pueden darse en estos resultados. Los tipos de variabilidad más comunes son los siguientes:

Variabilidad de observación o de medición
Variabilidad natural
Variabilidad inducida
Variabilidad de la muestra

He aquí algunos ejemplos para describir cada tipo de variabilidad.

Ejemplo 1: Variabilidad de la mediciónLa variabilidad de la medición se produce cuando hay diferencias en los instrumentos utilizados para medir o en las personas que utilizan esos instrumentos. Si recopilamos datos sobre el tiempo que tarda una pelota en caer desde una altura haciendo que los estudiantes midan el tiempo de la caída con un cronómetro, podemos experimentar una variabilidad en la medición si los dos cronómetros utilizados son de diferentes fabricantes: Por ejemplo, un cronómetro mide al segundo más cercano, mientras que el otro mide a la décima de segundo más cercana. También podemos experimentar la variabilidad de las mediciones porque dos personas diferentes recopilan los datos. Sus tiempos de reacción al pulsar el botón del cronómetro pueden ser diferentes, por lo que los resultados variarán en consecuencia. Las diferencias en los resultados pueden verse afectadas por la variabilidad de las mediciones.

Ejemplo 2: Variabilidad naturalLa variabilidad natural surge de las diferencias que se producen de forma natural porque los miembros de una población difieren entre sí. Por ejemplo, si tenemos dos plantas de maíz idénticas y las exponemos a la misma cantidad de agua y luz solar, pueden crecer a ritmos diferentes simplemente porque son dos plantas de maíz diferentes. La diferencia de resultados puede explicarse por la variabilidad natural.

Ejemplo 3: Variabilidad inducidaLa variabilidad inducida es la contrapartida de la variabilidad natural; se produce porque hemos inducido artificialmente un elemento de variación (que, por definición, no estaba presente de forma natural): Por ejemplo, asignamos personas a dos grupos diferentes para estudiar la memoria, e inducimos una variable en un grupo limitando la cantidad de sueño que tienen. La diferencia de resultados puede verse afectada por la variabilidad inducida.

Ejemplo 4: Variabilidad de la muestraLa variabilidad de la muestra se produce cuando se toman varias muestras aleatorias de la misma población. Por ejemplo, si se realizan cuatro encuestas a 50 personas seleccionadas al azar de una población determinada, las diferencias en los resultados pueden verse afectadas por la variabilidad de la muestra.

Ejemplo 2.29

En una clase de quinto grado la maestra estaba interesada en la edad promedio y la desviación típica de la muestra de las edades de sus estudiantes. Los siguientes datos son las edades de una MUESTRA de n = 20 estudiantes de quinto grado. Las edades están redondeadas al medio año más cercano:

9; 9,5; 9,5; 10; 10; 10; 10; 10,5; 10,5; 10,5; 10,5; 11; 11; 11; 11; 11; 11; 11,5; 11,5; 11,5;

\bar{x} = \frac{9 + 9,5(2) + 10(4) + 10,5(4) + 11(6) + 11,5(3)}{20} = 10,525

La edad promedio es de 10,53 años, redondeada a dos cifras.

La varianza se puede calcular mediante una tabla. A continuación se calcula la desviación típica tomando la raíz cuadrada de la varianza. Explicaremos las partes de la tabla después de calcular s.

Datos	Frec.	Desviaciones	Desviaciones²	(Frec.)(Desviaciones²)
x	f	(x – $\bar{x}$ )	(x – $\bar{x}$ )²	(f)(x – $\bar{x}$ )²
9	1	9 – 10,525 = –1,525	(–1,525)² = 2,325625	1 × 2,325625 = 2,325625
9,5	2	9,5 – 10,525 = –1,025	(–1,025)² = 1,050625	2 × 1,050625 = 2,101250
10	4	10 – 10,525 = –0,525	(–0,525)² = 0,275625	4 × 0,275625 = 1,1025
10,5	4	10,5 – 10,525 = –0,025	(–0,025)² = 0,000625	4 × 0,000625 = 0,0025
11	6	11 – 10,525 = 0,475	(0,475)² = 0,225625	6 × 0,225625 = 1,35375
11,5	3	11,5 – 10,525 = 0,975	(0,975)² = 0,950625	3 × 0,950625 = 2,851875
				El total es 9,7375

Tabla 2.28

La varianza de la muestra, s², es igual a la suma de la última columna (9,7375) dividida entre el número total de valores de datos menos uno (20 – 1):

$s^{2} = \frac{9,7375}{20 - 1} = 0,5125$

La desviación típica de la muestra s es igual a la raíz cuadrada de la varianza de la muestra:

$s = \sqrt{0,5125} = 0,715891,$ que se redondea a dos decimales, s = 0,72.

Explicación del cálculo de la desviación típica que aparece en la tabla

Las desviaciones muestran la dispersión de los datos respecto a la media. El valor de los datos 11,5 está más alejado de la media que el valor de los datos 11, lo que se indica con las desviaciones 0,97 y 0,47. Una desviación positiva se produce cuando el valor de los datos es mayor que la media, mientras que una desviación negativa se produce cuando el valor de los datos es menor que la media. La desviación es de –1,525 para el noveno valor de los datos. Si se suman las desviaciones, la suma es siempre cero (según el Ejemplo 2.29, hay n = 20 desviaciones). Por lo tanto, no se puede simplemente sumar las desviaciones para obtener la dispersión de los datos. Al elevar al cuadrado las desviaciones se convierten en números positivos, y la suma también será positiva. La varianza, por tanto, es la desviación promedio al cuadrado. Al elevar al cuadrado las desviaciones, estamos penalizando en extremo las observaciones que se alejan de la media; estas observaciones tienen mayor peso en los cálculos de la varianza. Más adelante veremos que la varianza (desviación típica) desempeña un papel fundamental para determinar nuestras conclusiones en la estadística inferencial. Podemos empezar ahora utilizando la desviación típica como medida de lo "inusual": "¿Cómo te fue en el examen?" "¡Fantástico! Dos desviaciones típicas por encima de la media". Esto, como veremos, es una nota de examen excepcionalmente buena.

La varianza es una medida al cuadrado y no tiene las mismas unidades que los datos. Calcular la raíz cuadrada resuelve el problema. La desviación típica mide la dispersión en las mismas unidades que los datos.

Observe que en vez de dividir entre n = 20, el cálculo divide entre n – 1 = 20 – 1 = 19 porque los datos son una muestra. Para la varianza de la muestra, se divide entre el tamaño de la muestra menos uno (n – 1). ¿Por qué no dividir entre n? La respuesta tiene que ver con la varianza de la población. La varianza de la muestra es una estimación de la varianza de la población. Esta estimación nos obliga a utilizar una cifra estimada de la media de la población en lugar de la media real de la población. Basándose en la matemática teórica que hay detrás de estos cálculos, al dividir entre (n – 1) da una mejor estimación de la varianza de la población.

La desviación típica, s o σ, es cero o mayor que cero. La descripción de los datos con referencia a la dispersión se denomina “variabilidad”. La variabilidad de los datos depende del método con el que se obtienen los resultados; por ejemplo, por medición o por muestreo aleatorio. Cuando la desviación típica es cero, no hay dispersión; es decir, todos los valores de los datos son iguales entre sí. La desviación típica es pequeña cuando todos los datos se concentran cerca de la media, y es mayor cuando los valores de los datos muestran más variación con respecto a la media. Cuando la desviación típica es mucho mayor que cero, los valores de los datos están muy dispersos alrededor de la media; los valores atípicos pueden hacer que s o σ sean muy grandes.

Ejemplo 2.30

Translation missing: es.problem

Utilice los siguientes datos (calificaciones del primer examen) de la clase de Precálculo de primavera de Susan Dean:

33; 42; 49; 49; 53; 55; 55; 61; 63; 67; 68; 68; 69; 69; 72; 73; 74; 78; 80; 83; 88; 88; 88; 90; 92; 94; 94; 94; 94; 96; 100

Cree un gráfico que contenga los datos, las frecuencias, las frecuencias relativas y las frecuencias relativas acumuladas con tres decimales.
Calcule lo siguiente con un decimal:
1. La media muestral
2. La desviación típica de la muestra
3. La mediana
4. El primer cuartil
5. El tercer cuartil
6. IQR

Solución

Vea la Tabla 2.29
1. La media muestral = 73,5
2. La desviación típica de la muestra = 17,9
3. La mediana = 73
4. El primer cuartil = 61
5. El tercer cuartil = 90
6. IQR = 90 – 61 = 29

Datos	Frecuencia	Frecuencia relativa	Frecuencia relativa acumulada
33	1	0,032	0,032
42	1	0,032	0,064
49	2	0,065	0,129
53	1	0,032	0,161
55	2	0,065	0,226
61	1	0,032	0,258
63	1	0,032	0,29
67	1	0,032	0,322
68	2	0,065	0,387
69	2	0,065	0,452
72	1	0,032	0,484
73	1	0,032	0,516
74	1	0,032	0,548
78	1	0,032	0,580
80	1	0,032	0,612
83	1	0,032	0,644
88	3	0,097	0,741
90	1	0,032	0,773
92	1	0,032	0,805
94	4	0,129	0,934
96	1	0,032	0,966
100	1	0,032	0,998 (¿Por qué este valor no es 1? RESPUESTA: Redondeo)

Tabla 2.29

Desviación típica de las tablas de frecuencia agrupadas

Recordemos que para los datos agrupados no conocemos los valores individuales de los datos, por lo que no podemos describir el valor típico de los datos con precisión. En otras palabras, no podemos hallar la media, la mediana ni la moda exactas. Sin embargo, podemos determinar la mejor estimación de las medidas de centro al hallar la media de los datos agrupados con la fórmula $Tabla de media de la frecuencia = \frac{\sum f m}{\sum f}$
donde $f =$ frecuencias de intervalo y m = puntos medios del intervalo.

Al igual que no podemos hallar la media exacta, tampoco podemos hallar la desviación típica exacta. Recuerde que la desviación típica describe numéricamente la desviación esperada que tiene un valor de datos con respecto a la media. En términos sencillos, la desviación típica nos permite comparar lo “inusual” que son los datos individuales en comparación con la media.

Ejemplo 2.31

Calcule la desviación típica de los datos en la Tabla 2.30.

Clase	Frecuencia, f	Punto medio, m	$f \cdot m$	$f (m - \bar{x})^{2}$
0–2	1	1	$1 \cdot 1 = 1$	$1 (1 - 6,88)^{2} = 34,57$
3–5	6	4	$6 \cdot 4 = 24$	$6 (4 - 6,88)^{2} = 49,77$
6-8	10	7	$10 \cdot 7 = 70$	$10 (7 - 6,88)^{2} = 0,14$
9-11	7	10	$7 \cdot 10 = 70$	$7 (10 - 6,88)^{2} = 68,14$
12-14	0	13	$0 \cdot 13 = 0$	$0 (13 - 6,88)^{2} = 0$
	n = 24		$\bar{x} = \frac{165}{24} = 6,88$	$s^{2} = \frac{152,62}{24 - 1} = 6,64$

Tabla 2.30

Para este conjunto de datos, tenemos la media, $\bar{x}$ = 6,88 y la desviación típica, s_x = 2,58. Esto significa que se espera que un valor de datos seleccionado al azar se aleje 2,58 unidades de la media. Si observamos la primera clase, vemos que el punto medio de la clase es igual a uno. Esto supone casi tres desviaciones típicas de la media. La fórmula para calcular la desviación típica no es complicada, $s_{x} = \sqrt{\frac{Σ {(m - \bar{x})}^{2} f}{n - 1}}$ donde
s_x = desviación típica de la muestra, $\bar{x}$ = media muestral, los cálculos son tediosos. Por lo general, lo mejor es utilizar la tecnología para realizar los cálculos.

Comparación de valores de diferentes conjuntos de datos

La desviación típica es útil cuando se comparan valores de datos que provienen de diferentes conjuntos de datos. Si los conjuntos de datos tienen medias y desviaciones típicas diferentes, la comparación directa de los valores de los datos puede ser engañosa.

Para cada valor de los datos x, calcule a cuántas desviaciones típicas de su media se encuentra el valor.
Utilice la fórmula: x = media + (n.º de STDEV)(de STandard DEViation o desviación típica); resuelva para n.º de STDEV.
$n.º d e S T D E V = \frac{x – media}{desviación típica}$
Compare los resultados de este cálculo.

N.º de STDEV suele llamarse “puntuación z”; podemos utilizar el símbolo z. En símbolos, las fórmulas se convierten en:

Muestra	$x$ = $\bar{x}$ + zs	$z = \frac{x - \bar{x}}{s}$
Población	$x$ = $μ$ + zσ	$z = \frac{x - μ}{σ}$

Tabla 2.31

Ejemplo 2.32

Translation missing: es.problem

Dos estudiantes, John y Ali, de diferentes escuelas secundarias, querían averiguar quién tenía el mejor GPA en comparación con su escuela. ¿Cuál estudiante tiene el mejor GPA en comparación con su escuela?

Estudiante	GPA	GPA media escolar	Desviación típica escolar
John	2,85	3,0	0,7
Ali	77	80	10

Tabla 2.32

Solución

Para cada estudiante, determine cuántas desviaciones típicas (n.º de STDEV) se aleja su GPA del promedio, para su escuela. Preste mucha atención a los signos al comparar e interpretar la respuesta.

$z = N.º de STDEV = \frac{valor - media}{desviación típica} = \frac{x - μ}{σ}$

Para John, $z = n.º d e S T D E V = \frac{2,85 - 3,0}{0,7} = - 0,21$

Para Ali, $z = n.º d e S T D E V = \frac{77 - 80}{10} = - 0,3$

John tiene el mejor GPA en comparación con su escuela porque su GPA está 0,21 desviaciones típicas por debajo de la media de su escuela mientras que el GPA de Ali está 0,3 desviaciones típicas por debajo de la media de su escuela.

La puntuación z de John, de –0,21, es mayor que la puntuación z de Ali, de –0,3. Para el GPA, los valores más altos son mejores, por lo que concluimos que John tiene el mejor GPA en comparación con su escuela.

Inténtelo 2.32

Dos nadadoras, Angie y Beth, de equipos diferentes, querían averiguar quién tenía el tiempo más rápido en los 50 metros libres en comparación con su equipo. ¿Qué nadadora tuvo el mejor tiempo en comparación con su equipo?

Nadadora	Tiempo (segundos)	Tiempo medio del equipo	Desviación típica del equipo
Angie	26,2	27,2	0,8
Beth	27,3	30,1	1,4

Tabla 2.33

Las siguientes listas ofrecen algunos hechos que proporcionan un poco más de información sobre lo que la desviación típica nos dice sobre la distribución de los datos.

Para CUALQUIER conjunto de datos, no importa cuál sea la distribución de los datos:

Al menos el 75 % de los datos están dentro de las dos desviaciones típicas de la media.
Al menos el 89 % de los datos están dentro de las tres desviaciones típicas de la media.
Al menos el 95 % de los datos están dentro de 4,5 desviaciones típicas de la media.
Esto se conoce como la regla de Chebyshev.

Para los datos que tienen una distribución normal, que examinaremos en detalle más adelante:

Aproximadamente el 68 % de los datos están dentro de una desviación típica de la media.
Aproximadamente el 95 % de los datos están dentro de las dos desviaciones típicas de la media.
Más del 99 % de los datos están dentro de las tres desviaciones típicas de la media.
Esto se conoce como la regla empírica.
Es importante señalar que esta regla solo se aplica cuando la forma de la distribución de los datos tiene forma de campana y es simétrica. Aprenderemos más sobre esto cuando estudiemos la distribución de probabilidad “normal” o “gaussiana” en capítulos posteriores.

Coeficiente de variación

Otra forma útil de comparar distribuciones, además de las simples comparaciones de medias o desviaciones típicas, es ajustar las diferencias en la escala de los datos que se miden. Sencillamente, una gran variación en los datos con una media grande es diferente a la misma variación en los datos con una media pequeña. Para ajustar la escala de los datos subyacentes se ha desarrollado el coeficiente de variación (CV). Matemáticamente, el:

C V = \frac{s}{\bar{x}} * 100 condicionado a \bar{x} \neq 0, donde s es la desviación típica de los datos y \bar{x} es la media.

Podemos ver que esto mide la variabilidad de los datos subyacentes como un porcentaje del valor medio; el peso central del conjunto de datos. Esta medida es útil para comparar el riesgo cuando se justifica un ajuste debido a las diferencias de escala de dos conjuntos de datos. En efecto, la escala se cambia a escala común, diferencias porcentuales, y permite la comparación directa de las dos o más magnitudes de variación de diferentes conjuntos de datos.