Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

2.3 Medidas de la ubicación de los datos

Introducción a la estadística2.3 Medidas de la ubicación de los datos

Las medidas habituales de localización son cuartiles y percentiles

Los cuartiles son percentiles especiales. El primer cuartil, Q1, es igual que el percentil 25, y el tercer cuartil, Q3, es igual que el percentil 75. La mediana, M, se denomina tanto el segundo cuartil como el percentil 50.

Para calcular cuartiles y percentiles, los datos se deben ordenar de menor a mayor. Los cuartiles dividen los datos ordenados en cuartos. Los percentiles dividen los datos ordenados en centésimas. Obtener una calificación en el percentil 90 de un examen no significa, necesariamente, que haya obtenido el 90 % en una prueba. Significa que el 90 % de las calificaciones de las pruebas son iguales o inferiores a su calificación y el 10 % de las calificaciones de las pruebas son iguales o superiores a su calificación.

Los percentiles son útiles para comparar valores. Por esta razón, universidades e institutos universitarios usan ampliamente los percentiles. Uno de los casos en los que institutos universitarios y universidades utilizan los percentiles es cuando los resultados del SAT se emplean para determinar una calificación mínima del examen que se utilizará como factor de aceptación. Por ejemplo, supongamos que Duke acepta calificaciones del SAT iguales o superiores al percentil 75. Eso se traduce en una calificación de, al menos, 1.220.

Los percentiles se utilizan sobre todo con poblaciones muy grandes. Por lo tanto, si se dijera que el 90 % de las calificaciones de las pruebas son menores (y no iguales o menores) que su calificación, sería aceptable porque eliminar un valor de datos particular no es significativo.

La mediana es un número que mide el “centro” de los datos. Se puede pensar en la mediana como el “valor medio”, pero no tiene por qué ser uno de los valores observados. Es un número que separa los datos ordenados en mitades. La mitad de los valores son iguales o menores que la mediana, y la mitad de los valores son iguales o mayores. Por ejemplo, considere los siguientes datos.
1; 11,5; 6; 7,2; 4; 8; 9; 10; 6,8; 8,3; 2; 2; 10; 1
Ordenado de menor a mayor:
1; 1; 2; 2; 4; 6; 6,8; 7,2; 8; 8,3; 9; 10; 10; 11,5

Como hay 14 observaciones, la mediana está entre el séptimo valor, 6,8, y el octavo, 7,2. Para hallar la mediana, sume los dos valores y divídalos entre dos.

6,8+7,22=7 6,8 7,2 2 7

La mediana es siete. La mitad de los valores son menores que siete y la mitad de los valores son mayores que siete.

Los cuartiles son números que separan los datos en cuartos. Los cuartiles pueden o no formar parte de los datos. Para hallar los cuartiles, primero hay que hallar la mediana o el segundo cuartil. El primer cuartil, Q1, es el valor central de la mitad inferior de los datos, y el tercer cuartil, Q3, es el valor central, o la mediana, de la mitad superior de los datos. Para hacerse una idea, considere el mismo conjunto de datos:
1; 1; 2; 2; 4; 6; 6,8; 7,2; 8; 8,3; 9; 10; 10; 11,5

La mediana o segundo cuartil es siete. La mitad inferior de los datos son 1; 1; 2; 2; 4; 6; 6,8. El valor central de la mitad inferior es dos.
1; 1; 2; 2; 4; 6; 6,8

El número dos, que forma parte de los datos, es el primer cuartil. Una cuarta parte de los conjuntos de valores son iguales o inferiores a dos y tres cuartas partes de los valores son superiores a dos.

La mitad superior de los datos es 7,2; 8; 8,3; 9; 10; 10; 11,5. El valor central de la mitad superior es nueve.

El tercer cuartil, Q3, es nueve. Tres cuartas partes (75 %) del conjunto de datos ordenados son menores de nueve. Una cuarta parte (25 %) del conjunto de datos ordenados son mayores de nueve. El tercer cuartil forma parte del conjunto de datos de este ejemplo.

El rango intercuartil es un número que indica la dispersión de la mitad central o del 50 % central de los datos. Es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1).

IQR = Q3Q1

El IQR puede ayudar a determinar posibles valores atípicos. Se sospecha que un valor es un posible valor atípico si está menos de (1,5)(IQR) por debajo del primer cuartil o más de (1,5)(IQR) por encima del tercer cuartil. Los posibles valores atípicos siempre requieren una investigación más profunda.

NOTA

Un valor atípico potencial es un punto de datos que es significativamente diferente de los otros puntos de datos. Estos puntos de datos especiales pueden ser errores o algún tipo de anormalidad o pueden ser una clave para entender los datos.

Ejemplo 2.13

Translation missing: es.problem

Para los siguientes 13 precios de bienes raíces, calcule el IQR y determine si algún precio es un posible valor atípico. Los precios están en dólares.
389.950; 230.500; 158.000; 479.000; 639.000; 114.950; 5.500.000; 387.000; 659.000; 529.000; 575.000; 488.800; 1.095.000

Inténtelo 2.13

Para los siguientes 11 salarios, calcule el IQR y determine si algún salario es un valor atípico. Los sueldos son en dólares.

$33.000; $64.500; $28.000; $54.000; $72.000; $68.500; $69.000; $42.000; $54.000; $120.000; $40.500

Ejemplo 2.14

Translation missing: es.problem

Para los dos conjuntos de datos del ejemplo de las calificaciones de los exámenes, halle lo siguiente:

  1. El rango intercuartil. Compare los dos rangos intercuartiles.
  2. Cualquier valor atípico en cualquier conjunto.

Inténtelo 2.14

Calcule el rango intercuartil para los dos conjuntos de datos siguientes y compárelos.

Resultados de las pruebas de la clase A
69; 96; 81; 79; 65; 76; 83; 99; 89; 67; 90; 77; 85; 98; 66; 91; 77; 69; 80; 94
Resultados de las pruebas de la clase B
90; 72; 80; 92; 90; 97; 92; 75; 79; 68; 70; 80; 99; 95; 78; 73; 71; 68; 95; 100

Ejemplo 2.15

Se les preguntó a cincuenta estudiantes de Estadística cuánto dormían por noche de escuela (redondeado a la hora más cercana). Los resultados fueron:

CANTIDAD DE SUEÑO POR NOCHE DE ESCUELA (HORAS) FRECUENCIA FRECUENCIA RELATIVA FRECUENCIA RELATIVA ACUMULADA
4 2 0,04 0,04
5 5 0,10 0,14
6 7 0,14 0,28
7 12 0,24 0,52
8 14 0,28 0,80
9 7 0,14 0,94
10 3 0,06 1,00
Tabla 2.22

Calcule el percentil 28. Fíjese en el 0,28 de la columna “frecuencia relativa acumulada”. El veintiocho por ciento de 50 valores de datos son 14 valores. Hay 14 valores inferiores al percentil 28. Incluyen los dos 4, los cinco 5 y los siete 6. El percentil 28 está entre los seis últimos y los siete primeros. El percentil 28 es 6,5.

Calcule la mediana. Observe de nuevo la columna de “frecuencia relativa acumulada” y halle 0,52. La mediana es el percentil 50 o el segundo cuartil. El 50 % de 50 es 25. Hay 25 valores inferiores a la mediana. Incluyen los dos 4, los cinco 5, los siete 6 y once de los 7. La mediana o el percentil 50 está entre los valores 25, o siete, y 26, o siete. La mediana es siete.

Calcule el tercer cuartil. El tercer cuartil es lo mismo que el percentil 75. Puede dar esta respuesta “al ojo”. Si observa la columna de “frecuencia relativa acumulada”, verá 0,52 y 0,80. Cuando tiene todos los cuatros, cincos, seises y sietes tiene el 52 % de los datos. Cuando incluye todos los 8, tiene el 80 % de los datos. El percentil 75, entonces, debe ser un ocho. Otra forma de ver el problema es hallar el 75 % de 50, que es 37,5, y redondear a 38. El tercer cuartil, Q3, es el valor 38, que es un ocho. Puede comprobar esta respuesta contando los valores (hay 37 valores por debajo del tercer cuartil y 12 valores por encima).

Inténtelo 2.15

Se les ha preguntado a cuarenta conductores de autobús cuántas horas dedican cada día a recorrer sus rutas (redondeadas a la hora más cercana). Calcule el percentil 65.

Cantidad de tiempo invertido en la ruta (horas) Frecuencia Frecuencia relativa Frecuencia relativa acumulada
2120,300,30
3140,350,65
4100,250,90
540,101,00
Tabla 2.23

Ejemplo 2.16

Translation missing: es.problem

Mediante la Tabla 2.22:

  1. Calcule el percentil 80.
  2. Calcule el percentil 90.
  3. Calcule el primer cuartil. ¿Cuál es otro nombre para el primer cuartil?

Inténtelo 2.16

Consulte la Tabla 2.23. Calcule el tercer cuartil. ¿Cuál es otro nombre para el tercer cuartil?

Ejercicio colaborativo

El instructor o un miembro de la clase preguntará a todos los asistentes cuántos suéteres poseen. Responda las siguientes preguntas

  1. ¿A cuántos estudiantes se encuestó?
  2. ¿Qué tipo de muestreo realizó?
  3. Construya dos histogramas diferentes. Para cada uno, valor inicial = _____ valor final = ____.
  4. Calcule la mediana, el primer cuartil y el tercer cuartil.
  5. Construya una tabla con los datos para hallar lo siguiente
    1. el percentil 10
    2. el percentil 70
    3. el porcentaje de estudiantes que poseen menos de cuatro suéteres

Una fórmula para hallar el percentil k

Si investiga un poco, hallará varias fórmulas para calcular el percentil k Aquí está una de ellas.

k = el percentil k. Puede o no formar parte de los datos.

i = el índice (clasificación o posición de un valor de datos)

n = el número total de datos

  • Ordene los datos de menor a mayor.
  • Calcule i= k 100 (n+1) i= k 100 (n+1)
  • Si i es un número entero, el percentil k es el valor de los datos en la posición i en el conjunto ordenado de datos.
  • Si i no es un entero, entonces redondee i hacia arriba o redondee i hacia abajo a los enteros más cercanos. Promedia los dos valores de los datos en estas dos posiciones en el conjunto de datos ordenados. Esto es más fácil de entender con un ejemplo.

Ejemplo 2.17

Translation missing: es.problem

Se enumeran 29 edades de los mejores actores ganadores del Oscar en orden de menor a mayor.
18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

  1. Calcule el percentil 70.
  2. Calcule el percentil 83.

Inténtelo 2.17

Se enumeran 29 edades de los mejores actores ganadores del Oscar en orden de menor a mayor.

18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77
Calcule el percentil 20 y el percentil 55.

NOTA

Puede calcular los percentiles con calculadoras y computadoras. Hay una gran variedad de calculadoras en línea.

Una fórmula para hallar el percentil de un valor en un conjunto de datos

  • Ordene los datos de menor a mayor.
  • x = el número de valores de datos contando desde la parte inferior de la lista de datos hasta, pero sin incluir, el valor de datos para el que se desea hallar el percentil.
  • y = el número de valores de datos iguales al valor de los datos para los que se quiere hallar el percentil.
  • n = el número total de datos.
  • Calcule x+0,5y n x+0,5y n(100). Luego, redondee al número entero más cercano.

Ejemplo 2.18

Translation missing: es.problem

Se enumeran 29 edades de los mejores actores ganadores del Oscar en orden de menor a mayor.
18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

  1. Calcule el percentil de 58.
  2. Calcule el percentil de 25.

Inténtelo 2.18

Se enumeran las 30 edades de los mejores actores ganadores del Oscar en orden de menor a mayor.

18; 21; 22; 25; 26; 27; 29; 30; 31, 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77
Halle los percentiles de 47 y 31.

Interpretación de percentiles, cuartiles y mediana

Un percentil indica la posición relativa de un valor de datos cuando estos se ordenan numéricamente de menor a mayor. Los porcentajes de los valores de los datos son menores o iguales al percentil p. Por ejemplo, el 15 % de los valores de los datos son inferiores o iguales al percentil 15.

  • Los percentiles bajos corresponden siempre a valores de datos más bajos.
  • Los percentiles altos corresponden siempre a valores de datos más altos.

Un percentil puede corresponder o no a un juicio de valor sobre si es “bueno” o “deficiente”. La interpretación de si un determinado percentil es “bueno” o “deficiente” depende del contexto de la situación a la que se aplican los datos. En algunas situaciones, un percentil bajo se consideraría “bueno”; en otros contextos, un percentil alto podría considerarse “bueno”. En muchas situaciones no se aplica ningún juicio de valor.

Entender cómo interpretar correctamente los percentiles es importante no solo a la hora de describir los datos, sino también a la hora de calcular las probabilidades en capítulos posteriores de este texto.

NOTA

Al escribir la interpretación de un percentil en el contexto de los datos dados, la oración debe contener la siguiente información.

  • información sobre el contexto de la situación considerada.
  • el valor del dato (valor de la variable) que representa el percentil.
  • el porcentaje de personas o elementos con valores de datos por debajo del percentil.
  • el porcentaje de personas o elementos con valores de datos por encima del percentil.

Ejemplo 2.19

Translation missing: es.problem

En un examen de Matemáticas cronometrado, el primer cuartil del tiempo que se tardó en terminar el examen fue de 35 minutos. Interprete el primer cuartil en el contexto de esta situación.

Inténtelo 2.19

En los 100 metros planos, el tercer cuartil de los tiempos para terminar la carrera fue de 11,5 segundos. Interprete el tercer cuartil en el contexto de la situación.

Ejemplo 2.20

Translation missing: es.problem

En un examen de Matemáticas de 20 preguntas, el percentil 70 del número de respuestas correctas fue de 16. Interprete el percentil 70 en el contexto de esta situación.

Inténtelo 2.20

En una asignación escrita de 60 puntos, el percentil 80 del número de puntos obtenidos fue de 49. Interprete el percentil 80 en el contexto de esta situación.

Ejemplo 2.21

Translation missing: es.problem

En un colegio comunitario se comprobó que el percentil 30 de unidades de crédito en las que se inscriben los estudiantes es de siete unidades. Interprete el percentil 30 en el contexto de esta situación.

Inténtelo 2.21

Durante una temporada, el percentil 40 de puntos anotados por jugador en un partido es de ocho. Interprete el percentil 40 en el contexto de esta situación.

Ejemplo 2.22

La escuela intermedia Sharpe está solicitando una subvención que se utilizará para añadir equipos de acondicionamiento físico para el gimnasio. El director encuestó 15 estudiantes anónimos para determinar cuántos minutos al día dedican los estudiantes a hacer ejercicio. Se muestran los resultados de los 15 estudiantes anónimos.

0 minutos; 40 minutos; 60 minutos; 30 minutos; 60 minutos

10 minutos; 45 minutos; 30 minutos; 300 minutos; 90 minutos;

30 minutos; 120 minutos; 60 minutos; 0 minutos; 20 minutos

Determine los cinco valores siguientes.

  • Mín. = 0
  • Q1 = 20
  • Med. = 40
  • Q3 = 60
  • Máx. = 300

Si usted fuera el director, ¿se justificaría la compra de nuevos equipos de acondicionamiento físico? Dado que el 75 % de los estudiantes hacen ejercicio durante 60 minutos o menos al día, y que el IQR es de 40 minutos (60 – 20 = 40), sabemos que la mitad de los estudiantes encuestados hacen ejercicio entre 20 y 60 minutos al día. Esto parece una cantidad razonable de tiempo de ejercicio, por lo que el director estaría justificado en la compra del nuevo equipamiento.

Sin embargo, el director debe tener cuidado. El valor 300 parece ser un posible valor atípico.

Q3 + 1,5(IQR) = 60 + (1,5)(40) = 120.

El valor 300 es mayor que 120, por lo que es un posible valor atípico. Si lo eliminamos y calculamos los cinco valores, obtenemos los siguientes valores:

  • Mín. = 0
  • Q1 = 20
  • Q3 = 60
  • Máx. = 120

Todavía tenemos un 75 % de los estudiantes que hacen ejercicio durante 60 minutos o menos al día y la mitad de los estudiantes que hacen ejercicio entre 20 y 60 minutos al día. Sin embargo, 15 estudiantes es una muestra pequeña y el director debería encuestar más estudiantes para estar seguro de los resultados de su encuesta.

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.