Considere el siguiente conjunto de datos.
4; 5; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10
Este conjunto de datos se puede representar mediante el siguiente histograma. Cada intervalo tiene un ancho de uno y cada valor se sitúa en el centro de un intervalo.
El histograma muestra una distribución simétrica de los datos. Una distribución es simétrica si se puede trazar una línea vertical en algún punto del histograma de manera que la forma a la izquierda y a la derecha de la línea vertical sean imágenes una espejo de la otra. La media, la mediana y la moda son siete para estos datos. En una distribución perfectamente simétrica, la media y la mediana son iguales. Este ejemplo tiene una moda (unimodal), y la moda es la misma que la media y la mediana. En una distribución simétrica que tiene dos modas (bimodal), las dos modas serían diferentes de la media y la mediana.
El histograma de los datos: 4; 5; 6; 6; 6; 7; 7; 7; 7; 8 (que se muestra en la Figura 2.17) no es simétrico. El lado derecho parece “cortado” en comparación con el lado izquierdo. Una distribución de este tipo se denomina distorsionada a la izquierda porque se desplaza hacia la izquierda.
La media es 6,3, la mediana es 6,5 y la moda es siete. Observe que la media es menor que la mediana y ambas son menores que la moda. Tanto la media como la mediana reflejan la distorsión, pero la media lo refleja más.
El histograma de los datos: 6; 7; 7; 7; 7; 8; 8; 8; 9; 10 Figura 2.18, tampoco es simétrico. Es distorsionada a la derecha.
La media es 7,7, la mediana es 7,5 y la moda es siete. De las tres estadísticas, la media es la mayor, mientras que la moda es la menor. De nuevo, la media es la que más refleja la distorsión.
Para resumir, generalmente si la distribución de los datos está distorsionada a la izquierda, la media es menor que la mediana, que suele ser menor que la moda. Si la distribución de los datos está distorsionada a la derecha, la moda suele ser menor que la mediana, que es menor que la media.
La distorsión y la simetría son importantes cuando hablemos de distribuciones de probabilidad en capítulos posteriores.
Ejemplo 2.31
Translation missing: es.problem
Las estadísticas se utilizan para comparar y a veces identificar a los autores. Las siguientes listas muestran una simple muestra aleatoria que compara los recuentos de letras de tres autores.
Terry: 7; 9; 3; 3; 3; 4; 1; 3; 2; 2
Davis: 3; 3; 3; 4; 1; 4; 3; 2; 3; 1
Maris: 2; 3; 4; 4; 4; 6; 6; 6; 8; 3
- Haga un gráfico de puntos para los tres autores y compare las formas.
- Calcule la media de cada uno.
- Calcule la mediana de cada uno.
- Describa cualquier patrón que observe entre la forma y las medidas del centro.
Solución
-
- La media de Terry es de 3,7, la de Davis de 2,7 y la de Maris de 4,6.
- La mediana de Terry es tres, la de Davis es tres. La mediana de Maris es de cuatro.
- Parece que la mediana está siempre más cerca del punto alto (la moda), mientras que la media tiende a estar más lejos en la cola. En una distribución simétrica, la media y la mediana están situadas en el centro, cerca del punto más alto de la distribución.
Inténtelo 2.31
Analice la media, la mediana y la moda para cada uno de los siguientes problemas. ¿Existe un patrón entre la forma y la medida del centro?
a.
b.
Las edades en que murieron los expresidentes de EE. UU. | |
---|---|
4 | 6 9 |
5 | 3 6 7 7 7 8 |
6 | 0 0 3 3 4 4 5 6 7 7 7 8 |
7 | 0 1 1 2 3 4 7 8 8 9 |
8 | 0 1 3 5 8 |
9 | 0 0 3 3 |
Clave: 8|0 significa 80. |
c.