Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales

Introducción a la estadística2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales

Para la mayor parte del trabajo que se realiza en este libro se utilizará un histograma para mostrar los datos. Una de las ventajas de un histograma es que puede mostrar fácilmente grandes conjuntos de datos. Una regla general es utilizar un histograma cuando el conjunto de datos consta de 100 valores o más.

Un histograma está formado por recuadros contiguos (adyacentes). Tiene un eje horizontal y otro vertical. El eje horizontal está identificado con lo que representan los datos (por ejemplo, la distancia de su casa a la escuela). El eje vertical está identificado como frecuencia o frecuencia relativa (o porcentaje de frecuencia o probabilidad). El gráfico tendrá la misma forma con cualquiera de las dos etiquetas. El histograma (al igual que el diagrama de tallo) puede darle la forma de los datos, el centro y la dispersión de los datos.

La frecuencia relativa es igual a la frecuencia de un valor observado de los datos dividida por el número total de valores de datos de la muestra. (Recuerde que la frecuencia se define como el número de veces que se produce una respuesta). Si:

  • f = frecuencia
  • n = número total de valores de datos (o la suma de las frecuencias individuales) y
  • RF = frecuencia relativa,

entonces:

RF = e n RF = e n

Por ejemplo, si tres estudiantes de la clase de Inglés del Sr. Ahab compuesta por 40 estudiantes obtuvieron del 90 % al 100 %, entonces, f = 3, n = 40 y RF = enen = 340340 = 0,075. El 7,5 % de los estudiantes obtuvieron del 90 % al 100 %. Del 90 % al 100 % son medidas cuantitativas.

Para construir un histograma, primero hay que decidir cuántas barras o intervalos (también llamados clases) representan los datos. Muchos histogramas constan de cinco a 15 barras o clases para mayor claridad. Hay que elegir el número de barras. Elija un punto de partida para que el primer intervalo sea menor que el valor más pequeño de los datos. Un punto de partida conveniente es un valor inferior llevado a un decimal más que el valor con más decimales. Por ejemplo, si el valor con más decimales es 6,1 y este es el valor más pequeño, un punto de partida conveniente es 6,05 (6,1 – 0,05 = 6,05). Decimos que 6,05 tiene más precisión. Si el valor con más decimales es 2,23 y el valor más bajo es 1,5, un punto de partida conveniente es 1,495 (1,5 – 0,005 = 1,495). Si el valor con más decimales es 3,234 y el valor más bajo es 1,0, un punto de partida conveniente es 0,9995 (1,0 – 0,0005 = 0,9995). Si todos los datos son enteros y el valor más pequeño es dos, un punto de partida conveniente es 1,5 (2 – 0,5 = 1,5). Además, cuando el punto de partida y otros límites se llevan a un decimal adicional, ningún valor de los datos caerá en un límite. Los dos siguientes ejemplos detallan cómo construir un histograma utilizando datos continuos y cómo crear un histograma utilizando datos discretos.

Ejemplo 2.7

Los siguientes datos son las estaturas (en pulgadas con una aproximación de media pulgada) de 100 jugadores hombres de fútbol semiprofesional. Las alturas son datos continuos, ya que la altura se mide.
60; 60,5; 61; 61; 61,5
63,5; 63,5; 63,5
64; 64; 64; 64; 64; 64; 64; 64,5; 64,5; 64,5; 64,5; 64,5; 64,5; 64,5; 64,5
66; 66; 66; 66; 66; 66; 66; 66; 66; 66; 66,5; 66,5; 66,5; 66,5; 66,5; 66,5; 66,5; 66,5; 66,5; 66,5; 66,5; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67,5; 67,5; 67,5; 67,5; 67,5; 67,5; 67,5
68; 68; 69; 69; 69; 69; 69; 69; 69; 69; 69; 69; 69,5; 69,5; 69,5; 69,5; 69,5
70; 70; 70; 70; 70; 70; 70,5; 70,5; 70,5; 71; 71; 71
72; 72; 72; 72,5; 72,5; 73; 73,5
74

El valor de datos más pequeño es 60. Como los datos con más decimales tienen un decimal (por ejemplo, 61,5), queremos que nuestro punto de partida tenga dos decimales. Dado que los números 0,5, 0,05, 0,005, etc. son números convenientes, utilice 0,05 y réstelo a 60, el valor más pequeño, para el punto de partida conveniente.

60 – 0,05 = 59,95 que es más preciso que, por ejemplo, 61,5 por un decimal. El punto de partida es, pues, 59,95.

El valor mayor es 74, por lo que 74 + 0,05 = 74,05 es el valor final.

Luego, calcule el ancho de cada barra o intervalo de clase. Para calcular este ancho, reste el punto inicial del valor final y divídalo entre el número de barras (debe elegir el número de barras que desee). Suponga que elige ocho barras.

74,0559,958=1,76 74,05 59,95 8 1,76

NOTA

Redondearemos a dos y haremos que cada barra o intervalo de clase tenga dos unidades de ancho. Redondear a dos es una forma de evitar que un valor caiga en un límite. El redondeo al número siguiente es a menudo necesario, incluso si va en contra de las reglas estándar de redondeo. Para este ejemplo, utilizar 1,76 como ancho también funcionaría. Una pauta que siguen algunos para el número de barras o intervalos de clase es tomar la raíz cuadrada del número de valores de datos y luego redondear al número entero más cercano, si es necesario. Por ejemplo, si hay 150 valores de datos, tome la raíz cuadrada de 150 y redondee a 12 barras o intervalos.

Los límites son:

  • 59,95
  • 59,95 + 2 = 61,95
  • 61,95 + 2 = 63,95
  • 63,95 + 2 = 65,95
  • 65,95 + 2 = 67,95
  • 67,95 + 2 = 69,95
  • 69,95 + 2 = 71,95
  • 71,95 + 2 = 73,95
  • 73,95 + 2 = 75,95

Las alturas de 60 a 61,5 pulgadas están en el intervalo de 59,95 a 61,95. Las alturas que son 63,5 están en el intervalo de 61,95 a 63,95. Las alturas que van de 64 a 64,5 están en el intervalo de 63,95 a 65,95. Las alturas de 66 a 67,5 están en el intervalo de 65,95 a 67,95. Las alturas de 68 a 69,5 están en el intervalo de 67,95 a 69,95. Las alturas de 70 a 71 están en el intervalo de 69,95 a 71,95. Las alturas de 72 a 73,5 están en el intervalo de 71,95 a 73,95. La altura 74 está en el intervalo de 73,95 a 75,95.

El siguiente histograma muestra las alturas en el eje x y la frecuencia relativa en el eje y.

El histograma consta de 8 barras con el eje y en incrementos de 0,05 desde 0 hasta 0,4 y el eje x en intervalos de 2 desde 59,95 hasta 75,95.
Figura 2.5

Inténtelo 2.7

Los siguientes datos son las tallas de los zapatos de 50 estudiantes hombres. Las tallas son datos discretos, ya que el tamaño del calzado se mide solo en unidades enteras y medias. Construya un histograma y calcule el ancho de cada barra o intervalo de clase. Suponga que elige seis barras.
9; 9; 9,5; 9,5; 10; 10; 10; 10; 10; 10; 10,5; 10,5; 10,5; 10,5; 10,5; 10,5; 10,5; 10,5
11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11,5; 11,5; 11,5; 11,5; 11,5; 11,5; 11,5
12; 12; 12; 12; 12; 12; 12; 12,5; 12,5; 12,5; 12,5; 14

Ejemplo 2.8

Cree un histograma para los siguientes datos: el número de libros comprados por 50 estudiantes universitarios a tiempo parcial en el ABC College. El número de libros es un dato discreto, ya que los libros se cuentan.
1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1
2; 2; 2; 2; 2; 2; 2; 2; 2; 2
3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3
4; 4; 4; 4; 4; 4
5; 5; 5; 5; 5
6; 6

Once estudiantes compran un libro. Diez estudiantes compran dos libros. Dieciséis estudiantes compran tres libros. Seis estudiantes compran cuatro libros. Cinco estudiantes compran cinco libros. Dos estudiantes compran seis libros.

Como los datos son enteros, reste 0,5 a 1, el valor más pequeño de los datos, y sume 0,5 a 6, el valor más grande de los datos. Entonces el punto de partida es 0,5 y el valor final es 6,5.

Translation missing: es.problem

Luego, calcule el ancho de cada barra o intervalo de clase. Si los datos son discretos y no hay demasiados valores diferentes, lo más conveniente es un ancho que sitúe los valores de los datos en el centro del intervalo de barras o clases. Dado que los datos consisten en los números 1, 2, 3, 4, 5, 6, y el punto de partida es 0,5, un ancho de uno sitúa el 1 en el centro del intervalo de 0,5 a 1,5, el 2 en el centro del intervalo de 1,5 a 2,5, el 3 en el centro del intervalo de 2,5 a 3,5, el 4 en el centro del intervalo de _______ a _______, el 5 en el centro del intervalo de _______ a _______ y el _______ en el centro del intervalo de _______ a _______.

Calcule el número de barras de la siguiente manera:

6,50,5número de barras=1 6,5 0,5 número de barras 1

donde 1 es el ancho de una barra. Por lo tanto, barras = 6.

El siguiente histograma muestra el número de libros en el eje x y la frecuencia en el eje y.

El histograma consta de 6 barras con el eje y en incrementos de 2 de 0 a 16 y el eje x en intervalos de 1 de 0,5 a 6,5.
Figura 2.6

Uso de las calculadoras TI-83, 83+, 84, 84+

Diríjase al G - NOTAS PARA LAS CALCULADORAS TI-83, 83+, 84, 84+G - NOTAS PARA LAS CALCULADORAS TI-83, 83+, 84, 84+. Hay instrucciones de la calculadora para introducir datos y para crear un histograma personalizado. Cree el histograma para el Ejemplo 2.8.

  • Pulse Y=. Pulse CLEAR para borrar las ecuaciones.
  • Pulse STAT 1:EDIT. Si L1 tiene datos, flecha hacia arriba en el nombre L1, pulse CLEAR y luego flecha hacia abajo. Si es necesario, haga lo mismo con L2.
  • En L1, introduzca 1, 2, 3, 4, 5, 6.
  • En L2, introduzca 11, 10, 16, 6, 5, 2.
  • Pulse WINDOW. Escriba Xmin = 0,5, Xmax = 6,5, Xscl = (6,5 – 0.5)/6, Ymin = –1, Ymax = 20, Yscl = 1, Xres = 1.
  • Pulse 2.º Y =. Comience pulsando 4:Plotsoff ENTER.
  • Pulse 2.º Y =. Pulse 1: Plot1. Pulse ENTER. Flecha hacia abajo para TYPE. Flecha hacia la 3.ª imagen (histograma). Pulse ENTER.
  • Flecha hacia abajo a Xlist: Introduzca L1 (2,º 1). Flecha hacia abajo hasta Freq. Introduzca L2 (2.º 2).
  • Pulse GRAPH.
  • Utilice la tecla TRACE y las teclas de flecha para examinar el histograma.

Inténtelo 2.8

Los siguientes datos son el número de deportes practicados por 50 estudiantes deportistas. El número de deportes es un dato discreto, ya que los deportes se cuentan.

1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1
2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2
3; 3; 3; 3; 3; 3; 3; 3
20 estudiantes deportistas practican un deporte. 22 estudiantes deportistas practican dos deportes. Ocho estudiantes deportistas practican tres deportes.

Rellene los espacios en blanco de la siguiente oración. Como los datos consisten en los números 1, 2, 3, y el punto de partida es 0,5, una anchura de uno sitúa el 1 en el centro del intervalo 0,5 a _____, el 2 en el centro del intervalo de _____ a _____, y el 3 en el centro del intervalo de _____ a _____.

Ejemplo 2.9

Translation missing: es.problem

Con este conjunto de datos construya un histograma.

Número de horas que mis compañeros de clase pasan jugando a los videojuegos los fines de semana
9,95 10 2,25 16,75 0
19,5 22,5 7,5 15 12,75
5,5 11 10 20,75 17,5
23 21,9 24 23,75 18
20 15 22,9 18,8 20,5
Tabla 2.13

Inténtelo 2.9

Los siguientes datos representan el número de empleados de varios restaurantes de la ciudad de Nueva York. Con estos datos, cree un histograma.

22; 35; 15; 26; 40; 28; 18; 20; 25; 34; 39; 42; 24; 22; 19; 27; 22; 34; 40; 20; 38; y 28
Utilice 10-19 como primer intervalo.

Ejercicio colaborativo

Cuente el dinero (billetes y monedas) que lleva en el bolsillo o en el bolso. Su instructor registrará las cantidades. En clase, construya un histograma que muestre los datos. Analice cuántos intervalos cree que son apropiados. Puede experimentar con el número de intervalos.

Polígonos de frecuencia

Los polígonos de frecuencias son análogos a los gráficos de líneas y, al igual que los gráficos de líneas facilitan la interpretación visual de los datos continuos, también lo hacen los polígonos de frecuencias.

Para construir un polígono de frecuencias, primero hay que examinar los datos y decidir el número de intervalos, o intervalos de clase, que se van a utilizar en los ejes x y y. Después de elegir los rangos apropiados, comience a trazar los puntos de datos. Después de trazar todos los puntos, dibuje segmentos de línea para conectarlos.

Ejemplo 2.10

Se construyó un polígono de frecuencias a partir de la tabla de frecuencias que aparece a continuación.

Distribución de frecuencias de las calificaciones del examen final de Cálculo
Límite inferiorLímite superior FrecuenciaFrecuencia acumulada
49,5 59,555
59,569,51015
69,579,5 3045
79,589,54085
89,599,515100
Tabla 2.14
Se construyó un polígono de frecuencias a partir de la tabla de frecuencias que aparece a continuación.
Figura 2.8

La primera etiqueta del eje x es 44,5. Esto representa un intervalo que va de 39,5 a 49,5. Dado que la calificación más baja de la prueba es 54,5, este intervalo se utiliza solo para permitir que el gráfico toque el eje x. El punto identificado como 54,5 representa el siguiente intervalo, o el primer intervalo “real” de la tabla, y contiene cinco calificaciones. Este razonamiento se sigue para cada uno de los intervalos restantes, con el punto 104,5 que representa el intervalo de 99,5 a 109,5. De nuevo, este intervalo no contiene datos y solo se utiliza para que el gráfico toque el eje x. Observando el gráfico, decimos que esta distribución está distorsionada porque un lado del gráfico no es un espejo del otro.

Inténtelo 2.10

Construya un polígono de frecuencias de las edades de los presidentes de EE. UU. en el momento de la investidura que se muestra en la Tabla 2.15.

Edad en la investiduraFrecuencia
41,5-46,54
46,5-51,511
51,5-56,514
56,5-61,59
61,5-66,54
66,5-71,52
Tabla 2.15

Los polígonos de frecuencia son útiles para comparar distribuciones. Esto se consigue superponiendo los polígonos de frecuencia dibujados para diferentes conjuntos de datos.

Ejemplo 2.11

Construiremos un polígono de frecuencias superpuestas comparando las puntuaciones del Ejemplo 2.10 con la nota numérica final de los estudiantes.

Distribución de frecuencias de las calificaciones del examen final de Cálculo
Límite inferiorLímite superior FrecuenciaFrecuencia acumulada
49,559,55 5
59,569,510 15
69,579,530 45
79,589,540 85
89,599,515 100
Tabla 2.16
Distribución de frecuencias de las notas finales de Cálculo
Límite inferior Límite superior FrecuenciaFrecuencia acumulada
49,559,510 10
59,569,510 20
69,579,530 50
79,589,545 95
89,599,55 100
Tabla 2.17
Este es un polígono de frecuencia superpuesto que coincide con los datos suministrados. El eje x muestra las notas y el eje y muestra la frecuencia.
Figura 2.9

Supongamos que queremos estudiar el rango de temperaturas de una región durante todo un mes. Todos los días a mediodía anotamos la temperatura y la anotamos en un registro. Con estos datos se podrían realizar diversos estudios estadísticos. Podemos hallar la media o la mediana de la temperatura del mes. Podemos construir un histograma que muestre el número de días en que las temperaturas alcanzan un determinado rango de valores. Sin embargo, todos estos métodos ignoran una parte de los datos que hemos recopilado.

Una característica de los datos que podemos considerar es la del tiempo. Dado que cada fecha se empareja con la lectura de la temperatura del día, no tenemos que pensar que los datos son aleatorios. En cambio, podemos utilizar los tiempos indicados para imponer un orden cronológico a los datos. Un gráfico que reconoce esta ordenación y muestra la evolución de la temperatura a medida que avanza el mes se denomina gráfico de series temporales.

Construcción de un gráfico de series temporales

Para construir un gráfico de series temporales debemos observar las dos partes de nuestro conjunto de datos emparejados. Comenzamos con un sistema de coordenadas cartesianas estándar. El eje horizontal se utiliza para trazar la fecha o los incrementos de tiempo, y el eje vertical se utiliza para trazar los valores de la variable que estamos midiendo. De este modo, hacemos que cada punto del gráfico corresponda a una fecha y a una cantidad medida. Los puntos del gráfico suelen estar conectados por líneas rectas en el orden en que se producen.

Ejemplo 2.12

Translation missing: es.problem

Los siguientes datos muestran el Índice de Precios del Consumidor (IPC) Anual, cada mes, durante diez años. Construya un gráfico de series temporales solo para los datos del Índice de Precios del Consumidor Anual.

AñoEneFebMarAbrMayJunJul
2003 181,7183,1184,2183,8 183,5183,7183,9
2004 185,2186,2187,4188,0 189,1189,7189,4
2005 190,7191,8193,3194,6 194,4194,5195,4
2006 198,3198,7199,8201,5 202,5202,9203,5
2007 202,416203,499205,352 206,686207,949208,352 208,299
2008 211,080211,693213,528 214,823216,632218,815 219,964
2009 211,143212,193212,709 213,240213,856215,693 215,351
2010 216,687216,741217,631 218,009218,178217,965 218,011
2011 220,223221,309223,467 224,906225,964225,722 225,922
2012 226,665227,663229,392 230,085229,815229,478 229,104
Tabla 2.18
Año AgoSepOctNovDicAnual
2003 184,6 185,2185,0184,5184,3 184,0
2004 189,5 189,9190,9191,0190,3 188,9
2005 196,4 198,8199,2197,6196,8 195,3
2006 203,9 202,9201,8201,5201,8 201,6
2007 207,917208,490 208,936210,177210,036 207,342
2008 219,086218,783 216,573212,425210,228 215,303
2009 215,834215,969 216,177216,330215,949 214,537
2010 218,312218,439 218,711218,803219,179 218,056
2011 226,545226,889 226,421226,230225,672 224,939
2012 230,379231,407 231,317230,221229,601 229,594
Tabla 2.19

Inténtelo 2.12

La siguiente tabla es una parte de un conjunto de datos de www.worldbank.org. Utilice la tabla para construir un gráfico de la serie temporal de las emisiones de CO2 de Estados Unidos.

Emisiones de CO2
Ucrania Reino Unido Estados Unidos
2003 352.259 540.640 5.681.664
2004 343.121 540.409 5.790.761
2005 339.029 541.990 5.826.394
2006 327.797 542.045 5.737.615
2007 328.357 528.631 5.828.697
2008 323.657 522.247 5.656.839
2009 272.176 474.579 5.299.563
Tabla 2.20

Usos de un gráfico de series temporales

Los gráficos de series temporales son herramientas importantes en diversas aplicaciones de la estadística. Cuando se registran los valores de una misma variable durante un largo periodo, a veces, es difícil discernir cualquier tendencia o patrón. Sin embargo, una vez que los mismos puntos de datos se muestran gráficamente, algunas características saltan a la vista. Los gráficos de series temporales facilitan la detección de tendencias.

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.