12.1 Ecuaciones lineales
Para cada una de las siguientes situaciones, indique la variable independiente y la variable dependiente.
- Se realiza un estudio para determinar si los conductores de edad avanzada están implicados en más accidentes de tráfico que otros conductores. El número de víctimas mortales por cada 100.000 conductores se compara con la edad de los conductores.
- Se realiza un estudio para determinar si la factura semanal de la compra de comestibles cambia en función del número de integrantes de la familia.
- Las compañías de seguros basan las primas de los seguros de vida parcialmente en la edad del solicitante.
- Las facturas de los servicios públicos varían según el consumo de energía.
- Se realiza un estudio para determinar si la educación superior reduce el índice de delincuencia en una población.
Los sistemas de pago a destajo son planes de pago de incentivos ampliamente debatidos. En un estudio reciente sobre la eficacia de los agentes de crédito, se examinó el siguiente sistema de pago a destajo:
% alcanzado de la meta | < 80 | 80 | 100 | 120 |
Incentivo | n/a | 4.000 dólares, con 125 dólares adicionales por cada punto porcentual entre el 81 y el 99 % | 6.500 dólares, con 125 dólares adicionales por cada punto porcentual entre el 101 y el 119 % | 9.500 dólares con 125 dólares adicionales por cada punto porcentual a partir del 121 % |
Si un agente de crédito alcanza el 95 % de su meta, escriba la función lineal que se aplica en función de la tabla del plan de incentivos. En el contexto, explique la intersección en y, así como la pendiente.
12.2 Diagramas de dispersión
La Paridad de Poder Adquisitivo (PPA) del Producto Interno Bruto (PIB) es una indicación del valor de la moneda de un país en comparación con otro. La Tabla 12.16 muestra la PPA del PIB de Cuba en comparación con los dólares estadounidenses. Construya un diagrama de dispersión de los datos.
Año | PPA de Cuba | Año | PPA de Cuba |
---|---|---|---|
1999 | 1.700 | 2006 | 4.000 |
2000 | 1.700 | 2007 | 11.000 |
2002 | 2.300 | 2008 | 9.500 |
2003 | 2.900 | 2009 | 9.700 |
2004 | 3.000 | 2010 | 9.900 |
2005 | 3.500 |
La siguiente tabla muestra los índices de pobreza y el uso del teléfono móvil en Estados Unidos. Construya un diagrama de dispersión de los datos
Año | Índice de pobreza | Uso del teléfono móvil per cápita |
---|---|---|
2003 | 12,7 | 54,67 |
2005 | 12,6 | 74,19 |
2007 | 12 | 84,86 |
2009 | 12 | 90,82 |
¿El mayor costo de la matrícula se traduce en empleos mejor pagados? La tabla muestra las diez mejores universidades en función del salario de mitad de carrera y los costos asociados de matrícula anual. Construya un diagrama de dispersión de los datos.
Escuela | Salario a mitad de carrera (en miles) | Matrícula anual |
---|---|---|
Princeton | 137 | 28.540 |
Harvey Mudd | 135 | 40.133 |
CalTech | 127 | 39.900 |
Academia Naval de EE. UU. | 122 | 0 |
West Point | 120 | 0 |
MIT | 118 | 42.050 |
Universidad de Lehigh | 118 | 43.220 |
NYU-Poly | 117 | 39.565 |
Babson College | 117 | 40.400 |
Stanford | 114 | 54.506 |
Si el nivel de significación es 0,05 y el valor p es 0,06, ¿a qué conclusión llega?
12.3 La ecuación de regresión
¿Cuál es el proceso mediante el cual podemos calcular una línea que atraviesa un diagrama de dispersión con un patrón lineal?
¿Puede un coeficiente de determinación ser negativo? ¿Por qué sí o por qué no?
12.5 Predicción
Recientemente, el número anual de muertes de conductores por cada 100.000 para los grupos etarios seleccionados fue el siguiente:
Edad | Número de muertes de conductores por cada 100.000 |
---|---|
16–19 | 38 |
20–24 | 36 |
25–34 | 24 |
35–54 | 20 |
55–74 | 18 |
75+ | 28 |
- Por cada grupo etario, elija el punto medio del intervalo para el valor de la x. (En el grupo de más de 75 años, utilice 80).
- Utilizando "edades" como variable independiente y "Número de muertes de conductores por cada 100.000" como variable dependiente, haga un diagrama de dispersión de los datos.
- Calcule la línea de mínimos cuadrados (de mejor ajuste). Ponga la ecuación en la forma de: ŷ = a + bx
- Halle el coeficiente de correlación. ¿Es significativo?
- Prediga el número de muertes para las edades de 40 y 60 años.
- Con base en los datos suministrados, ¿existe una relación lineal entre la edad de un conductor y la tasa de mortalidad de los conductores?
- ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
La Tabla 12.20 señala la expectativa de vida de alguien nacido en Estados Unidos en determinados años.
Año de nacimiento | Expectativa de vida |
---|---|
1930 | 59,7 |
1940 | 62,9 |
1950 | 70,2 |
1965 | 69,7 |
1973 | 71,4 |
1982 | 74,5 |
1987 | 75 |
1992 | 75,7 |
2010 | 78,7 |
- Decida cuál variable debe ser la independiente y cuál la dependiente.
- Dibuje un diagrama de dispersión de los pares ordenados.
- Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx
- Halle el coeficiente de correlación. ¿Es significativo?
- Calcule la expectativa de vida para alguien nacido en 1950 y para otro nacido en 1982.
- ¿Por qué las respuestas a la parte e no coinciden con los valores de la Tabla 12.20 que corresponden a esos años?
- Utilice los dos puntos de la parte e para trazar la línea de mínimos cuadrados en su gráfico de la parte b.
- Según los datos, ¿existe una relación lineal entre el año de nacimiento y la expectativa de vida?
- ¿Existen valores atípicos en los datos?
- Utilizando la línea de mínimos cuadrados, calcule la expectativa de vida estimada para alguien nacido en 1850. ¿La línea de mínimos cuadrados da una estimación precisa para ese año? Explique por qué sí o por qué no.
- ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
El valor máximo de descuento de la tarjeta Entertainment® para la sección "Alta Cocina", décima edición, para varias páginas se da en la Tabla 12.21
Número de página | Valor máximo ($) |
---|---|
4 | 16 |
14 | 19 |
25 | 15 |
32 | 17 |
43 | 19 |
57 | 15 |
72 | 16 |
85 | 15 |
90 | 17 |
- Decida cuál variable debe ser la independiente y cuál la dependiente.
- Dibuje un diagrama de dispersión de los pares ordenados.
- Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx
- Halle el coeficiente de correlación. ¿Es significativo?
- Calcule los valores máximos para los restaurantes de las páginas 10 y 70.
- ¿Parece que los restaurantes que dan el máximo valor se colocan al principio de la sección "Alta Cocina"? ¿Cómo ha llegado a su respuesta?
- Supongamos que hay 200 páginas de restaurantes. ¿Cuál estima que es el valor máximo de un restaurante de la página 200?
- ¿Es válida la línea de mínimos cuadrados para la página 200? ¿Por qué sí o por qué no?
- ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
La Tabla 12.22 da los tiempos de las medallas de oro de todos los demás Juegos Olímpicos de Verano para los 100 metros libres femeninos (natación).
Año | Tiempo (segundos) |
---|---|
1912 | 82,2 |
1924 | 72,4 |
1932 | 66,8 |
1952 | 66,8 |
1960 | 61,2 |
1968 | 60,0 |
1976 | 55,65 |
1984 | 55,92 |
1992 | 54,64 |
2000 | 53,8 |
2008 | 53,1 |
- Decida cuál variable debe ser la independiente y cuál la dependiente.
- Dibuje un diagrama de dispersión de los datos.
- ¿Se desprende de la inspección que existe una relación entre las variables? ¿Por qué sí o por qué no?
- Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx.
- Halle el coeficiente de correlación. ¿Es significativa la disminución de los tiempos?
- Calcule el tiempo estimado de la medalla de oro de 1932. Calcule el tiempo estimado para 1984.
- ¿Por qué las respuestas de la parte f son diferentes de los valores de la tabla?
- ¿Parece que una línea es la mejor forma de ajustar los datos? ¿Por qué sí o por qué no?
- Utilice la línea de mínimos cuadrados para estimar el tiempo de la medalla de oro de los próximos Juegos Olímpicos de Verano. ¿Cree que su respuesta es razonable? ¿Por qué sí o por qué no?
Estado | N.º de letras en el nombre | Año de entrada en la Unión | Rango para entrar en la Unión | Superficie (millas cuadradas) |
---|---|---|---|---|
Alabama | 7 | 1819 | 22 | 52.423 |
Colorado | 8 | 1876 | 38 | 104.100 |
Hawái | 6 | 1959 | 50 | 10.932 |
Iowa | 4 | 1846 | 29 | 56.276 |
Maryland | 8 | 1788 | 7 | 12.407 |
Misuri | 8 | 1821 | 24 | 69.709 |
Nueva Jersey | 9 | 1787 | 3 | 8.722 |
Ohio | 4 | 1803 | 17 | 44.828 |
Carolina del Sur | 13 | 1788 | 8 | 32.008 |
Utah | 4 | 1896 | 45 | 84.904 |
Wisconsin | 9 | 1848 | 30 | 65.499 |
Nos interesa saber si el número de letras del nombre de un estado depende o no del año en que ingresó en la Unión.
- Decida cuál variable debe ser la independiente y cuál la dependiente.
- Dibuje un diagrama de dispersión de los datos.
- ¿Se desprende de la inspección que existe una relación entre las variables? ¿Por qué sí o por qué no?
- Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx.
- Halle el coeficiente de correlación. ¿Qué implica esto sobre la importancia de la relación?
- Calcule el número aproximado de letras (al número entero más cercano) que tendría un estado si entrara en la Unión en 1900. Calcule el número aproximado de letras que tendría un estado si entrara en la Unión en 1940.
- ¿Parece que una línea es la mejor forma de ajustar los datos? ¿Por qué sí o por qué no?
- Utilice la línea de mínimos cuadrados para estimar el número de letras que tendría un nuevo estado que entrara en la Unión este año. ¿Se puede utilizar la línea de mínimos cuadrados para predecirlo? ¿Por qué sí o por qué no?
12.6 Valores atípicos
La altura (de la acera al tejado) de los edificios altos más notables de Estados Unidos se compara con el número de pisos del edificio (empezando por el nivel de la calle).
Altura (en pies) | Pisos |
---|---|
1.050 | 57 |
428 | 28 |
362 | 26 |
529 | 40 |
790 | 60 |
401 | 22 |
380 | 38 |
1.454 | 110 |
1.127 | 100 |
700 | 46 |
- Utilizando "pisos" como variable independiente y "altura" como variable dependiente, haga un diagrama de dispersión de los datos.
- ¿Se desprende de la inspección que existe una relación entre las variables?
- Calcule la línea de mínimos cuadrados. Ponga la ecuación en la forma de: ŷ = a + bx
- Halle el coeficiente de correlación. ¿Es significativo?
- Halle las alturas estimadas para 32 pisos y para 94 pisos.
- Según los datos de la Tabla 12.24, ¿existe una relación lineal entre el número de pisos de los edificios altos y su altura?
- ¿Existen valores atípicos en los datos? En caso afirmativo, ¿qué puntos?
- ¿Cuál es la altura estimada de un edificio de seis pisos? ¿La línea de mínimos cuadrados da una estimación precisa de la altura? Explique por qué sí o por qué no.
- Con base en la línea de mínimos cuadrados, se predice que añadir un piso más añadirá aproximadamente cuántos pies a un edificio?
- ¿Cuál es la pendiente de la línea de mínimos cuadrados (de mejor ajuste)? Interprete la pendiente.
Los ornitólogos, científicos que estudian las aves, marcan a los gavilanes en 13 colonias diferentes para estudiar su población. Recogen datos sobre el porcentaje de nuevos gavilanes en cada colonia y el porcentaje de los que han regresado de la migración.
Porcentaje de retorno:74; 66; 81; 52; 73; 62; 52; 45; 62; 46; 60; 46; 38
Porcentaje nuevo:5; 6; 8; 11; 12; 15; 16; 17; 18; 18; 19; 20; 20
- Introduzca los datos en su calculadora y haga un diagrama de dispersión.
- Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión de la parte a.
- Explique con palabras lo que nos dicen la pendiente y la intersección en y de la línea de regresión.
- ¿Qué tan bien se ajusta la línea de regresión a los datos? Explique su respuesta.
- ¿Cuál punto tiene el mayor residuo? Explique el significado del residuo en su contexto. ¿Este punto es un valor atípico? ¿Un punto de influencia? Explique.
- Un ecologista quiere predecir cuántos pájaros se unirán a otra colonia de gavilanes a la que han regresado el 70 % de los adultos del año anterior. ¿Cuál es la predicción?
La siguiente tabla muestra datos sobre el consumo promedio de café per cápita y la tasa de cardiopatías en una muestra aleatoria de 10 países.
Consumo anual de café en litros | 2,5 | 3,9 | 2,9 | 2,4 | 2,9 | 0,8 | 9,1 | 2,7 | 0,8 | 0,7 |
Muerte por cardiopatías | 221 | 167 | 131 | 191 | 220 | 297 | 71 | 172 | 211 | 300 |
- Introduzca los datos en su calculadora y haga un diagrama de dispersión.
- Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión de la parte a.
- Explique con palabras lo que nos dicen la pendiente y la intersección en y de la línea de regresión.
- ¿Qué tan bien se ajusta la línea de regresión a los datos? Explique su respuesta.
- ¿Cuál punto tiene el mayor residuo? Explique el significado del residuo en su contexto. ¿Este punto es un valor atípico? ¿Un punto de influencia? Explique.
- ¿Proporcionan los datos pruebas convincentes de que existe una relación lineal entre la cantidad de café consumido y la tasa de mortalidad por cardiopatías? Lleve a cabo una prueba adecuada con un nivel de significación de 0,05 como ayuda para responder esta pregunta.
La siguiente tabla consiste en el tiempo de un estudiante atleta (en minutos) para nadar 2000 yardas y la frecuencia cardíaca (latidos por minuto) después de nadar en una muestra aleatoria de 10 días:
Tiempo de natación | Ritmo cardíaco |
---|---|
34,12 | 144 |
35,72 | 152 |
34,72 | 124 |
34,05 | 140 |
34,13 | 152 |
35,73 | 146 |
36,17 | 128 |
35,57 | 136 |
35,37 | 144 |
35,57 | 148 |
- Introduzca los datos en su calculadora y haga un diagrama de dispersión.
- Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión de la parte a.
- Explique con palabras lo que nos dicen la pendiente y la intersección en y de la línea de regresión.
- ¿Qué tan bien se ajusta la línea de regresión a los datos? Explique su respuesta.
- ¿Cuál punto tiene el mayor residuo? Explique el significado del residuo en su contexto. ¿Este punto es un valor atípico? ¿Un punto de influencia? Explique.
Un investigador estudia si la población influye en la tasa de homicidios. Utiliza datos demográficos de Detroit, MI, para comparar las tasas de homicidio y el número de habitantes que son hombres blancos.
Tamaño de la población | Tasa de homicidios por cada 100.000 habitantes |
---|---|
558.724 | 8,6 |
538.584 | 8,9 |
519.171 | 8,52 |
500.457 | 8,89 |
482.418 | 13,07 |
465.029 | 14,57 |
448.267 | 21,36 |
432.109 | 28,03 |
416.533 | 31,49 |
401.518 | 37,39 |
387.046 | 46,26 |
373.095 | 47,24 |
359.647 | 52,33 |
- Utilice su calculadora para construir un diagrama de dispersión de los datos. ¿Cuál debería ser la variable independiente? ¿Por qué?
- Utilice la función de regresión de su calculadora para hallar la ecuación de la línea de regresión por mínimos cuadrados. Añada esto a su diagrama de dispersión.
- Comente el significado de lo siguiente en su contexto.
- La pendiente de la ecuación de regresión
- La intersección en y de la ecuación de regresión
- La correlación r
- El coeficiente de determinación r2.
- ¿Aportan los datos pruebas convincentes de que exista una relación lineal entre el tamaño de la población y la tasa de homicidios? Lleve a cabo una prueba adecuada con un nivel de significación de 0,05 como ayuda para responder esta pregunta.
Escuela | Salario a mitad de carrera (en miles) | Matrícula anual |
---|---|---|
Princeton | 137 | 28.540 |
Harvey Mudd | 135 | 40.133 |
CalTech | 127 | 39.900 |
Academia Naval de EE. UU. | 122 | 0 |
West Point | 120 | 0 |
MIT | 118 | 42.050 |
Universidad de Lehigh | 118 | 43.220 |
NYU-Poly | 117 | 39.565 |
Babson College | 117 | 40.400 |
Stanford | 114 | 54.506 |
Utilice los datos para determinar la ecuación de la línea de regresión lineal con los valores atípicos eliminados. ¿Existe una correlación lineal para el conjunto de datos con los valores atípicos eliminados? Justifique su respuesta.