El “centro” de un conjunto de datos también es una forma de describir la ubicación. Las dos medidas más utilizadas del “centro” de los datos son la media (promedio) y la mediana. Para calcular el peso medio de 50 personas, sume los 50 pesos y los divide entre 50. Para calcular la mediana del peso de las 50 personas, ordene los datos y halle el número que divide los datos en dos partes iguales. La mediana suele ser una mejor medida del centro cuando hay valores extremos o atípicos porque no se ve afectada por los valores numéricos precisos de los atípicos. La media es la medida más común del centro.
NOTA
Las palabras “media” y “promedio” se suelen usar indistintamente. La sustitución de una palabra por otra es una práctica habitual. El término técnico es “media aritmética” y “promedio” es técnicamente un lugar central. Sin embargo, en la práctica, entre los no estadísticos, se suele aceptar “promedio” por “media aritmética”.
Cuando cada valor del conjunto de datos no es único, la media se puede calcular multiplicando cada valor distinto por su frecuencia y dividiendo después la suma por el número total de valores de los datos. La letra utilizada para representar la media muestral es una x con una barra encima (se pronuncia “barra de x”): .
La letra griega μ (se pronuncia “mu”) representa la media de la población. Uno de los requisitos para que la media muestral sea una buena estimación de la media de la población es que la muestra tomada sea realmente aleatoria.
Para ver que ambas formas de calcular la media son iguales, considere la muestra:
1; 1; 1; 2; 2; 3; 4; 4; 4; 4; 4
En el segundo cálculo, las frecuencias son 3, 2, 1 y 5.
Puede hallar rápidamente la ubicación de la mediana utilizando la expresión .
La letra n es el número total de valores de datos en la muestra. Si n es un número impar, la mediana es el valor del centro de los datos ordenados (ordenados de menor a mayor). Si n es un número par, la mediana es igual a los dos valores del centro sumados y divididos entre dos después de ordenar los datos. Por ejemplo, si el número total de valores de datos es de 97, entonces = = 49. La mediana es el 49.º valor de los datos ordenados. Si el número total de valores de datos es 100, entonces = = 50,5. La mediana está a medio camino entre los valores 50.º y 51.º. La ubicación de la mediana y el valor de la mediana no son lo mismo. La letra M mayúscula se utiliza a menudo para representar la mediana. El siguiente ejemplo ilustra la ubicación de la mediana y su valor.
Ejemplo 2.26
Translation missing: es.problem
Los datos sobre el sida que indican el número de meses que vive un paciente con sida después de tomar un nuevo medicamento con anticuerpos son los siguientes (de menor a mayor):
3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47;
Calcule la media y la mediana.
Solución
El cálculo de la media es:
Para hallar la mediana, M, primero hay que utilizar la fórmula de la ubicación. La ubicación es:
A partir del valor más pequeño, la mediana se sitúa entre los valores 20.º y 21.º (los dos 24):
3; 4; 8; 8; 10; 11; 12; 13; 14; 15; 15; 16; 16; 17; 17; 18; 21; 22; 22; 24; 24; 25; 26; 26; 27; 27; 29; 29; 31; 32; 33; 33; 34; 34; 35; 37; 40; 44; 44; 47;
Uso de las calculadoras TI-83, 83+, 84, 84+
Calcular la media y la mediana:
Borre lista L1. Pulse STAT 4:ClrList. Introduzca el 2.º 1 para la lista L1. Pulse ENTER.
Introduzca los datos en el editor de listas. Pulse STAT 1:EDIT.
Ponga los valores de los datos en la lista L1.
Pulse STAT y la flecha hacia CALC. Pulse 1:1-VarStats. Pulse el 2.º 1 para L1 y luego ENTER.
Pulse las teclas de flecha hacia abajo y hacia arriba para desplazarse.
= 23,6, M = 24
Inténtelo 2.26
Los siguientes datos muestran el número de meses que los pacientes suelen esperar en una lista de trasplantes antes de ser operados. Los datos están ordenados de menor a mayor. Calcule la media y la mediana.
3; 4; 5; 7; 7; 7; 7; 8; 8; 9; 9; 10; 10; 10; 10; 10; 11; 12; 12; 13; 14; 14; 15; 15; 17; 17; 18; 19; 19; 19; 21; 21; 22; 22; 23; 24; 24; 24; 24
Ejemplo 2.27
Translation missing: es.problem
Supongamos que en una pequeña ciudad de 50 personas una de ellas gana 5.000.000 de dólares al año y las otras 49 ganan 30.000 dólares cada una. ¿Cuál es la mejor medida del “centro”: la media o la mediana?
Solución
M = 30.000
(Hay 49 personas que ganan 30.000 dólares y una persona que gana 5.000.000 de dólares).
La mediana es una mejor medida del “centro” que la media porque 49 de los valores son 30.000 y uno es 5.000.000. El 5.000.000 es un valor atípico. Los 30.000 nos dan una mejor idea del centro de los datos.
Inténtelo 2.27
En una muestra de 60 hogares, una casa vale 2.500.000 dólares. Veintinueve casas valen 280.000 dólares y todas las demás valen 315.000 dólares. ¿Cuál es la mejor medida del "centro": la media o la mediana?
Otra medida del centro es la moda. La moda es el valor más frecuente. Puede haber más de una moda en un conjunto de datos siempre que esos valores tengan la misma frecuencia y esta sea la más alta. Un conjunto de datos con dos modas se denomina bimodal.
Ejemplo 2.28
Las calificaciones de los exámenes de Estadística de 20 estudiantes son las siguientes:
50; 53; 59; 59; 63; 63; 72; 72; 72; 72; 72; 76; 78; 81; 83; 84; 84; 84; 90; 93
Translation missing: es.problem
Calcule la moda.
Solución
La calificación más frecuente es 72, que aparece cinco veces. Moda = 72.
Inténtelo 2.28
El número de libros retirados de la biblioteca por 25 estudiantes es el siguiente:
0; 0; 0; 1; 2; 3; 3; 4; 4; 5; 5; 7; 7; 7; 7; 8; 8; 8; 9; 10; 10; 11; 11; 12; 12
Calcule la moda.
Ejemplo 2.29
Las cinco calificaciones del examen sobre bienes raíces son 430, 430, 480, 480, 495. El conjunto de datos es bimodal porque las calificaciones 430 y 480 aparecen dos veces cada una.
¿Cuándo la moda es la mejor medida del “centro”? Piense en un programa de adelgazamiento que anuncia una pérdida media de peso de seis libras la primera semana del programa. La moda podría indicar que la mayoría de las personas pierden dos libras la primera semana, lo que hace que el programa sea menos atractivo.
NOTA
La moda puede calcularse tanto para datos cualitativos como para cuantitativos. Por ejemplo, si el conjunto de datos es: rojo, rojo, rojo, verde, verde, amarillo, púrpura, negro, azul, la moda es rojo.
El software estadístico calculará fácilmente la media, la mediana y la moda. Algunas calculadoras gráficas también pueden realizar estos cálculos. En el mundo real, la gente hace estos cálculos utilizando softwares.
Inténtelo 2.29
Las cinco puntuaciones de crédito son 680, 680, 700, 720, 720. El conjunto de datos es bimodal porque las puntuaciones 680 y 720 aparecen dos veces. Consideremos los ingresos anuales de los trabajadores de una fábrica. La modalidad es de 25.000 dólares y se produce 150 veces de cada 301. La mediana es de 50.000 dólares y la media de 47.500 dólares. ¿Cuál sería la mejor medida del "centro"?
La ley de los grandes números y la media
La ley de los grandes números dice que, si se toman muestras de tamaño cada vez mayor de cualquier población, entonces la media de la muestra es muy probable que se acerque cada vez más a µ. Esto se analiza con más detalle más adelante en el texto.
Distribuciones muestrales y estadística de una distribución muestral
Se puede pensar en una distribución de muestreo como una distribución de frecuencia relativa con un gran número de muestras (vea la sección Muestreo y datos para hacer un repaso de la frecuencia relativa). Supongamos que se pregunta a treinta estudiantes seleccionados al azar el número de películas que vieron la semana anterior. Los resultados se encuentran en la tabla de frecuencias relativas que se muestra a continuación.
N.º de películas | Frecuencia relativa |
---|---|
0 | |
1 | |
2 | |
3 | |
4 |
Si se deja que el número de muestras sea muy grande (por ejemplo, 300 millones o más), la tabla de frecuencias relativas se convierte en una distribución de frecuencias relativas.
Una estadística es un número calculado a partir de una muestra. Algunos ejemplos de estadísticas son la media, la mediana y la moda, entre otros. La media muestral es un ejemplo de estadística que estima la media poblacional μ.
Cálculo de la media de las tablas de frecuencias agrupadas
Cuando solo se dispone de datos agrupados no se conocen los valores individuales de los datos (solo conocemos los intervalos y las frecuencias de los intervalos); por lo tanto, no se puede calcular una media exacta para el conjunto de datos. Lo que debemos hacer es estimar la media real calculando la media de una tabla de frecuencias. Una tabla de frecuencias es una representación de datos en la que se muestran datos agrupados junto con las frecuencias correspondientes. Para calcular la media de una tabla de frecuencias agrupadas podemos aplicar la definición básica de media: media = Simplemente tenemos que modificar la definición para que se ajuste a las restricciones de una tabla de frecuencias.
Como no conocemos los valores individuales de los datos podemos hallar el punto medio de cada intervalo. El punto medio es . Ahora podemos modificar la definición de la media para que sea donde f = la frecuencia del intervalo y m = el punto medio del intervalo.
Ejemplo 2.30
Translation missing: es.problem
Se presenta una tabla de frecuencias que muestra la prueba estadística anterior del profesor Blount. Calcule la mejor estimación de la media de la clase.
Intervalo de grado | Número de estudiantes |
---|---|
50–56,5 | 1 |
56,5–62,5 | 0 |
62,5–68,5 | 4 |
68,5–74,5 | 4 |
74,5–80,5 | 2 |
80,5–86,5 | 3 |
86,5–92,5 | 4 |
92,5–98,5 | 1 |
Solución
- Calcule los puntos medios de todos los intervalos
Intervalo de grado | Punto medio |
---|---|
50–56,5 | 53,25 |
56,5–62,5 | 59,5 |
62,5–68,5 | 65,5 |
68,5–74,5 | 71,5 |
74,5–80,5 | 77,5 |
80,5–86,5 | 83,5 |
86,5–92,5 | 89,5 |
92,5–98,5 | 95,5 |
- Calcule la suma del producto de la frecuencia de cada intervalo y el punto medio.
Inténtelo 2.30
Maris realizó un estudio sobre el efecto que tiene jugar videojuegos en el recuerdo. Como parte de su estudio recopiló los siguientes datos:
Horas que los adolescentes dedican a los videojuegos | Número de adolescentes |
---|---|
0–3,5 | 3 |
3,5–7,5 | 7 |
7,5–11,5 | 12 |
11,5–15,5 | 7 |
15,5–19,5 | 9 |
¿Cuál es la mejor estimación del número medio de horas dedicadas a los videojuegos?