Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax

12.1 Ecuaciones lineales

57.

Para cada una de las siguientes situaciones, indique la variable independiente y la variable dependiente.

  1. Se realiza un estudio para determinar si los conductores de edad avanzada están implicados en más accidentes de tráfico que otros conductores. El número de víctimas mortales por cada 100.000 conductores se compara con la edad de los conductores.
  2. Se realiza un estudio para determinar si la factura semanal de la compra de comestibles cambia en función del número de integrantes de la familia.
  3. Las compañías de seguros basan las primas de los seguros de vida parcialmente en la edad del solicitante.
  4. Las facturas de los servicios públicos varían según el consumo de energía.
  5. Se realiza un estudio para determinar si la educación superior reduce el índice de delincuencia en una población.
58.

Los sistemas de pago a destajo son planes de pago de incentivos ampliamente debatidos. En un estudio reciente sobre la eficacia de los agentes de crédito, se examinó el siguiente sistema de pago a destajo:

% alcanzado de la meta < 80 80 100 120
Incentivo n/a 4.000 dólares, con 125 dólares adicionales por cada punto porcentual entre el 81 y el 99 % 6.500 dólares, con 125 dólares adicionales por cada punto porcentual entre el 101 y el 119 % 9.500 dólares con 125 dólares adicionales por cada punto porcentual a partir del 121 %
Tabla 12.15

Si un agente de crédito alcanza el 95 % de su meta, escriba la función lineal que se aplica en función de la tabla del plan de incentivos. En el contexto, explique la intersección en y, así como la pendiente.

12.2 Diagramas de dispersión

59.

La Paridad de Poder Adquisitivo (PPA) del Producto Interno Bruto (PIB) es una indicación del valor de la moneda de un país en comparación con otro. La Tabla 12.16 muestra la PPA del PIB de Cuba en comparación con los dólares estadounidenses. Construya un diagrama de dispersión de los datos.

Año PPA de Cuba Año PPA de Cuba
1999 1.700 2006 4.000
2000 1.700 2007 11.000
2002 2.300 2008 9.500
2003 2.900 2009 9.700
2004 3.000 2010 9.900
2005 3.500
Tabla 12.16
60.

La siguiente tabla muestra los índices de pobreza y el uso del teléfono móvil en Estados Unidos. Construya un diagrama de dispersión de los datos

Año Índice de pobreza Uso del teléfono móvil per cápita
2003 12,7 54,67
2005 12,6 74,19
2007 12 84,86
2009 12 90,82
Tabla 12.17
61.

¿El mayor costo de la matrícula se traduce en empleos mejor pagados? La tabla muestra las diez mejores universidades en función del salario de mitad de carrera y los costos asociados de matrícula anual. Construya un diagrama de dispersión de los datos.

Escuela Salario a mitad de carrera (en miles) Matrícula anual
Princeton 137 28.540
Harvey Mudd 135 40.133
CalTech 127 39.900
Academia Naval de EE. UU. 122 0
West Point 120 0
MIT 118 42.050
Universidad de Lehigh 118 43.220
NYU-Poly 117 39.565
Babson College 117 40.400
Stanford 114 54.506
Tabla 12.18
62.

Si el nivel de significación es 0,05 y el valor p es 0,06, ¿a qué conclusión llega?

63.

Si hay 15 puntos de datos en un conjunto de datos, ¿cuál es el número de grados de libertad?

12.3 La ecuación de regresión

64.

¿Cuál es el proceso mediante el cual podemos calcular una línea que atraviesa un diagrama de dispersión con un patrón lineal?

65.

Explique qué significa que una correlación tenga un r2 de 0,72.

66.

¿Puede un coeficiente de determinación ser negativo? ¿Por qué sí o por qué no?

12.5 Predicción

67.

Recientemente, el número anual de muertes de conductores por cada 100.000 para los grupos etarios seleccionados fue el siguiente:

Edad Número de muertes de conductores por cada 100.000
16–19 38
20–24 36
25–34 24
35–54 20
55–74 18
75+ 28
Tabla 12.19
  1. Por cada grupo etario, elija el punto medio del intervalo para el valor de la x. (En el grupo de más de 75 años, utilice 80).
  2. Utilizando "edades" como variable independiente y "Número de muertes de conductores por cada 100.000" como variable dependiente, haga un diagrama de dispersión de los datos.
  3. Calcule la línea de mínimos cuadrados (de mejor ajuste). Ponga la ecuación en la forma de: ŷ = a + bx
  4. Halle el coeficiente de correlación. ¿Es significativo?
  5. Prediga el número de muertes para las edades de 40 y 60 años.
  6. Con base en los datos suministrados, ¿existe una relación lineal entre la edad de un conductor y la tasa de mortalidad de los conductores?
  7. ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
68.

La Tabla 12.20 señala la expectativa de vida de alguien nacido en Estados Unidos en determinados años.

Año de nacimiento Expectativa de vida
1930 59,7
1940 62,9
1950 70,2
1965 69,7
1973 71,4
1982 74,5
1987 75
1992 75,7
2010 78,7
Tabla 12.20
  1. Decida cuál variable debe ser la independiente y cuál la dependiente.
  2. Dibuje un diagrama de dispersión de los pares ordenados.
  3. Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx
  4. Halle el coeficiente de correlación. ¿Es significativo?
  5. Calcule la expectativa de vida para alguien nacido en 1950 y para otro nacido en 1982.
  6. ¿Por qué las respuestas a la parte e no coinciden con los valores de la Tabla 12.20 que corresponden a esos años?
  7. Utilice los dos puntos de la parte e para trazar la línea de mínimos cuadrados en su gráfico de la parte b.
  8. Según los datos, ¿existe una relación lineal entre el año de nacimiento y la expectativa de vida?
  9. ¿Existen valores atípicos en los datos?
  10. Utilizando la línea de mínimos cuadrados, calcule la expectativa de vida estimada para alguien nacido en 1850. ¿La línea de mínimos cuadrados da una estimación precisa para ese año? Explique por qué sí o por qué no.
  11. ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
69.

El valor máximo de descuento de la tarjeta Entertainment® para la sección "Alta Cocina", décima edición, para varias páginas se da en la Tabla 12.21

Número de página Valor máximo ($)
4 16
14 19
25 15
32 17
43 19
57 15
72 16
85 15
90 17
Tabla 12.21
  1. Decida cuál variable debe ser la independiente y cuál la dependiente.
  2. Dibuje un diagrama de dispersión de los pares ordenados.
  3. Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx
  4. Halle el coeficiente de correlación. ¿Es significativo?
  5. Calcule los valores máximos para los restaurantes de las páginas 10 y 70.
  6. ¿Parece que los restaurantes que dan el máximo valor se colocan al principio de la sección "Alta Cocina"? ¿Cómo ha llegado a su respuesta?
  7. Supongamos que hay 200 páginas de restaurantes. ¿Cuál estima que es el valor máximo de un restaurante de la página 200?
  8. ¿Es válida la línea de mínimos cuadrados para la página 200? ¿Por qué sí o por qué no?
  9. ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
70.

La Tabla 12.22 da los tiempos de las medallas de oro de todos los demás Juegos Olímpicos de Verano para los 100 metros libres femeninos (natación).

Año Tiempo (segundos)
1912 82,2
1924 72,4
1932 66,8
1952 66,8
1960 61,2
1968 60,0
1976 55,65
1984 55,92
1992 54,64
2000 53,8
2008 53,1
Tabla 12.22
  1. Decida cuál variable debe ser la independiente y cuál la dependiente.
  2. Dibuje un diagrama de dispersión de los datos.
  3. ¿Se desprende de la inspección que existe una relación entre las variables? ¿Por qué sí o por qué no?
  4. Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx.
  5. Halle el coeficiente de correlación. ¿Es significativa la disminución de los tiempos?
  6. Calcule el tiempo estimado de la medalla de oro de 1932. Calcule el tiempo estimado para 1984.
  7. ¿Por qué las respuestas de la parte f son diferentes de los valores de la tabla?
  8. ¿Parece que una línea es la mejor forma de ajustar los datos? ¿Por qué sí o por qué no?
  9. Utilice la línea de mínimos cuadrados para estimar el tiempo de la medalla de oro de los próximos Juegos Olímpicos de Verano. ¿Cree que su respuesta es razonable? ¿Por qué sí o por qué no?
71.
Estado N.º de letras en el nombre Año de entrada en la Unión Rango para entrar en la Unión Superficie (millas cuadradas)
Alabama 7 1819 22 52.423
Colorado 8 1876 38 104.100
Hawái 6 1959 50 10.932
Iowa 4 1846 29 56.276
Maryland 8 1788 7 12.407
Misuri 8 1821 24 69.709
Nueva Jersey 9 1787 3 8.722
Ohio 4 1803 17 44.828
Carolina del Sur 13 1788 8 32.008
Utah 4 1896 45 84.904
Wisconsin 9 1848 30 65.499
Tabla 12.23

Nos interesa saber si el número de letras del nombre de un estado depende o no del año en que ingresó en la Unión.

  1. Decida cuál variable debe ser la independiente y cuál la dependiente.
  2. Dibuje un diagrama de dispersión de los datos.
  3. ¿Se desprende de la inspección que existe una relación entre las variables? ¿Por qué sí o por qué no?
  4. Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx.
  5. Halle el coeficiente de correlación. ¿Qué implica esto sobre la importancia de la relación?
  6. Calcule el número aproximado de letras (al número entero más cercano) que tendría un estado si entrara en la Unión en 1900. Calcule el número aproximado de letras que tendría un estado si entrara en la Unión en 1940.
  7. ¿Parece que una línea es la mejor forma de ajustar los datos? ¿Por qué sí o por qué no?
  8. Utilice la línea de mínimos cuadrados para estimar el número de letras que tendría un nuevo estado que entrara en la Unión este año. ¿Se puede utilizar la línea de mínimos cuadrados para predecirlo? ¿Por qué sí o por qué no?

12.6 Valores atípicos

72.

La altura (de la acera al tejado) de los edificios altos más notables de Estados Unidos se compara con el número de pisos del edificio (empezando por el nivel de la calle).

Altura (en pies) Pisos
1.050 57
428 28
362 26
529 40
790 60
401 22
380 38
1.454 110
1.127 100
700 46
Tabla 12.24
  1. Utilizando "pisos" como variable independiente y "altura" como variable dependiente, haga un diagrama de dispersión de los datos.
  2. ¿Se desprende de la inspección que existe una relación entre las variables?
  3. Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx
  4. Halle el coeficiente de correlación. ¿Es significativo?
  5. Halle las alturas estimadas para 32 pisos y para 94 pisos.
  6. Según los datos de la Tabla 12.24, ¿existe una relación lineal entre el número de pisos de los edificios altos y su altura?
  7. ¿Existen valores atípicos en los datos? En caso afirmativo, ¿qué puntos?
  8. ¿Cuál es la altura estimada de un edificio de seis pisos? ¿La línea de mínimos cuadrados da una estimación precisa de la altura? Explique por qué sí o por qué no.
  9. Con base en la línea de mínimos cuadrados, se predice que añadir un piso más añadirá aproximadamente cuántos pies a un edificio?
  10. ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
73.

Los ornitólogos, científicos que estudian las aves, marcan a los gavilanes en 13 colonias diferentes para estudiar su población. Recogen datos sobre el porcentaje de nuevos gavilanes en cada colonia y el porcentaje de los que han regresado de la migración.

Porcentaje de retorno:74; 66; 81; 52; 73; 62; 52; 45; 62; 46; 60; 46; 38
Porcentaje nuevo:5; 6; 8; 11; 12; 15; 16; 17; 18; 18; 19; 20; 20

  1. Introduzca los datos en su calculadora y haga un diagrama de dispersión.
  2. Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión de la parte a.
  3. Explique con palabras lo que nos dicen la pendiente y la intersección en y de la línea de regresión.
  4. ¿Qué tan bien se ajusta la línea de regresión a los datos? Explique su respuesta.
  5. ¿Cuál punto tiene el mayor residuo? Explique el significado del residuo en su contexto. ¿Este punto es un valor atípico? ¿Un punto de influencia? Explique.
  6. Un ecologista quiere predecir cuántos pájaros se unirán a otra colonia de gavilanes a la que han regresado el 70 % de los adultos del año anterior. ¿Cuál es la predicción?
74.

La siguiente tabla muestra datos sobre el consumo promedio de café per cápita y la tasa de cardiopatías en una muestra aleatoria de 10 países.

Consumo anual de café en litros 2,5 3,9 2,9 2,4 2,9 0,8 9,1 2,7 0,8 0,7
Muerte por cardiopatías 221 167 131 191 220 297 71 172 211 300
Tabla 12.25
  1. Introduzca los datos en su calculadora y haga un diagrama de dispersión.
  2. Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión de la parte a.
  3. Explique con palabras lo que nos dicen la pendiente y la intersección en y de la línea de regresión.
  4. ¿Qué tan bien se ajusta la línea de regresión a los datos? Explique su respuesta.
  5. ¿Cuál punto tiene el mayor residuo? Explique el significado del residuo en su contexto. ¿Este punto es un valor atípico? ¿Un punto de influencia? Explique.
  6. ¿Proporcionan los datos pruebas convincentes de que existe una relación lineal entre la cantidad de café consumido y la tasa de mortalidad por cardiopatías? Lleve a cabo una prueba adecuada con un nivel de significación de 0,05 como ayuda para responder esta pregunta.
75.

La siguiente tabla consiste en el tiempo de un estudiante atleta (en minutos) para nadar 2000 yardas y la frecuencia cardíaca (latidos por minuto) después de nadar en una muestra aleatoria de 10 días:

Tiempo de natación Ritmo cardíaco
34,12 144
35,72 152
34,72 124
34,05 140
34,13 152
35,73 146
36,17 128
35,57 136
35,37 144
35,57 148
Tabla 12.26
  1. Introduzca los datos en su calculadora y haga un diagrama de dispersión.
  2. Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión de la parte a.
  3. Explique con palabras lo que nos dicen la pendiente y la intersección en y de la línea de regresión.
  4. ¿Qué tan bien se ajusta la línea de regresión a los datos? Explique su respuesta.
  5. ¿Cuál punto tiene el mayor residuo? Explique el significado del residuo en su contexto. ¿Este punto es un valor atípico? ¿Un punto de influencia? Explique.
76.

Un investigador estudia si la población influye en la tasa de homicidios. Utiliza datos demográficos de Detroit, MI, para comparar las tasas de homicidio y el número de habitantes que son hombres blancos.

Tamaño de la población Tasa de homicidios por cada 100.000 habitantes
558.724 8,6
538.584 8,9
519.171 8,52
500.457 8,89
482.418 13,07
465.029 14,57
448.267 21,36
432.109 28,03
416.533 31,49
401.518 37,39
387.046 46,26
373.095 47,24
359.647 52,33
Tabla 12.27
  1. Utilice su calculadora para construir un diagrama de dispersión de los datos. ¿Cuál debería ser la variable independiente? ¿Por qué?
  2. Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión.
  3. Comente el significado de lo siguiente en su contexto.
    1. La pendiente de la ecuación de regresión
    2. La intersección en y de la ecuación de regresión
    3. La correlación r
    4. El coeficiente de determinación r2.
  4. ¿Aportan los datos pruebas convincentes de que exista una relación lineal entre el tamaño de la población y la tasa de homicidios? Lleve a cabo una prueba adecuada con un nivel de significación de 0,05 como ayuda para responder esta pregunta.
77.
Escuela Salario a mitad de carrera (en miles) Matrícula anual
Princeton 137 28.540
Harvey Mudd 135 40.133
CalTech 127 39.900
Academia Naval de EE. UU. 122 0
West Point 120 0
MIT 118 42.050
Universidad de Lehigh 118 43.220
NYU-Poly 117 39.565
Babson College 117 40.400
Stanford 114 54.506
Tabla 12.28

Utilice los datos para determinar la ecuación de la línea de regresión lineal con los valores atípicos eliminados. ¿Existe una correlación lineal para el conjunto de datos con los valores atípicos eliminados? Justifique su respuesta.

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.