Barbara Illowsky; Susan Dean

Soluciones

1.

variable dependiente: monto de la tarifa; variable independiente: tiempo

3.

Este es un gráfico de la ecuación y = 25 + 12,50x. El eje x está marcado en intervalos de 1 de 0 a 7; el eje y está marcado en intervalos de 25 de 0 a 100. El gráfico de la ecuación es una línea que cruza el eje y en 25 y tiene una pendiente hacia arriba y hacia la derecha, subiendo 12,50 unidades por cada unidad de recorrido.

Figura 12.31

5.

Este es un gráfico de la ecuación y = 10 + 5x. El eje x está marcado en intervalos de 1 de 0 a 7; el eje y está marcado en intervalos de 10 de 0 a 50. El gráfico de la ecuación es una línea que cruza el eje y en 10 y tiene una pendiente hacia arriba y hacia la derecha, subiendo 5 unidades por cada unidad de recorrido.

Figura 12.32

7.

y = 6x + 8, 4y = 8, and y + 7 = 3x son todas ecuaciones lineales.

9.

El número de casos de gripe depende del año. Por lo tanto, el año se convierte en la variable independiente y el número de casos de gripe es la variable dependiente.

11.

La intersección em y es 50 (a = 50). Al comienzo de la limpieza, la compañía cobra una tarifa única de 50 dólares (esto es cuando x = 0). La pendiente es 100 (b = 100). Por cada sesión, la compañía cobra 100 dólares por cada hora de limpieza.

13.

12.000 libras de suelo

15.

La pendiente es –1,5 (b = –1,5). Esto significa que las acciones se desvalorizan a un ritmo de 1,50 dólares por hora. La intersección en y es de 15 dólares (a = 15). Esto significa que el precio de las acciones antes del día de negociación era de 15 dólares.

17.

Los datos parecen ser lineales con una fuerte correlación positiva.

19.

Los datos parecen no tener correlación.

21.

ŷ = 2,23 + 1,99x

23.

La pendiente es de 1,99 (b = 1,99). Significa que por cada contrato de patrocinio que consigue un jugador profesional, obtiene un promedio de otros 1,99 millones de dólares de sueldo cada año.

25.

Significa que no hay correlación entre los conjuntos de datos.

27.

Sí, hay suficientes puntos de datos y el valor de r es lo suficientemente fuerte como para mostrar que hay una fuerte correlación negativa entre los conjuntos de datos.

29.

H_a: ρ ≠ 0

31.

$250.120

33.

1.326 acres

35.

1.125 horas, o cuando x = 1.125

37.

Compruebe la solución del estudiante.

39.

Cuando x = 1985, ŷ = 25,52
Cuando x = 1990, ŷ = 34.275
Cuando x = 1970, ŷ = -725 ¿Por qué no tiene sentido esta respuesta? El rango de valores de x fue de 1981 a 2002; el año 1970 no está en este rango. La ecuación de regresión no se aplica, porque la predicción para el año 1970 es una extrapolación, que requiere otro proceso. Además, una cifra negativa no tiene sentido en este contexto, en el que estamos prediciendo los casos diagnosticados de gripe.

41.

Además, la correlación r = 0,4526. Si se compara r con el valor de los valores críticos al 95 % de la tabla de coeficientes de correlación de la muestra, porque r > 0,423, r es significativa, y se podría pensar que la línea podría utilizarse para la predicción. Pero el diagrama de dispersión indica lo contrario.

43.

$\hat{y}$ = -3.448.225 + 1750x

45.

Hasta 1993 se produjo un aumento de los casos diagnosticados de gripe. Desde 1993 hasta 2002, el número de casos diagnosticados de gripe disminuyó cada año. No es apropiado utilizar una línea de regresión lineal para ajustar los datos.

47.

Dado que no existe ninguna asociación lineal entre el año y el número de casos diagnosticados de gripe, no es apropiado calcular un coeficiente de correlación lineal. Cuando existe una asociación lineal y conviene calcular una correlación, no podemos decir que una variable "causa" la otra.

49.

No sabemos si los datos anteriores a 1981 se recogieron en un solo año. Así que no tenemos un valor de la x exacto para esta cifra.

Ecuación de regresión: ŷ (N.º casos de gripe) = -3.448.225 + 1749,777 (año)

	Coeficientes
Intersección	-3.448.225
X Variable 1	1.749,777

Tabla 12.36

51.

Sí, parece que hay un valor atípico en (6, 58).

53.

El posible valor atípico aplanó la pendiente de la línea de mejor ajuste porque estaba por debajo del conjunto de datos. Hizo que la línea de mejor ajuste fuera menos precisa como predictor de los datos.

55.

s = 1,75

57.

variable independiente: edad; variable dependiente: víctimas mortales
variable independiente: número de integrantes de la familia; variable dependiente: factura de compra de comestibles
variable independiente: edad del solicitante; variable dependiente: prima de seguro
variable independiente: consumo de energía; variable dependiente: factura de servicio
variable independiente: educación superior (años); variable dependiente: índices de delincuencia

59.

Compruebe la solución del estudiante.

61.

Para el gráfico: compruebe la solución del estudiante. Tenga en cuenta que la matrícula es la variable independiente y el salario es la variable dependiente.

63.

13

65.

Significa que el 72 % de la variación de la variable dependiente (y) puede explicarse por la variación de la variable independiente (x).

67.

Edad	Número de muertes de conductores por cada 100.000
16–19	38
20–24	36
25–34	24
35–54	20
55–74	18
75+	28

Tabla 12.37

Compruebe la solución del estudiante.
ŷ = 35,5818045 - 0,19182491x
r = –0,57874
Para cuatro df y alfa = 0,05, el LinRegTTest da un valor p = 0,2288, por lo que no rechazamos la hipótesis nula; no hay ninguna relación lineal significativa entre las muertes y la edad.
Utilizando la tabla de valores críticos para el coeficiente de correlación, con cuatro df, el valor crítico es 0,811. El coeficiente de correlación r = -0,57874 no es inferior a -0,811, por lo que no rechazamos la hipótesis nula.
No existe ninguna relación lineal entre las dos variables, como lo demuestra un valor p superior a 0,05.

69.

Nos preguntamos si los mejores descuentos aparecen antes en el libro, así que seleccionamos la página como X y el descuento como Y.
Compruebe la solución del estudiante.
ŷ = 17,21757 - 0,01412x
r = –0,2752
Para siete df y alfa = 0,05, utilizando la función LinRegTTest, el valor p = 0,4736 por lo que no lo rechazamos; no hay ninguna relación lineal significativa entre la página y el descuento.
Utilizando la tabla de valores críticos para el coeficiente de correlación, con siete df, el valor crítico es 0,666. El coeficiente de correlación xi = -0,2752 no es inferior a 0,666 por lo que no lo rechazamos.
No hay ninguna correlación lineal significativa, por lo que parece que no hay relación entre la página y el monto del descuento.

A medida que se aumenta una página, el descuento disminuye en 0,01412

71.

El año es la variable independiente o x; el número de letras es la variable dependiente o y.
Compruebe la solución del estudiante.
no
ŷ = 47,03 - 0,0216x
–0,4280 El valor r indica que no existe ninguna correlación significativa entre el año en que el estado entró en la unión y el número de letras del nombre.
No, la relación no parece ser lineal; la correlación es despreciable.

73.

a. y b. Compruebe la solución del estudiante.

c. La pendiente de la línea de regresión es –0,3031 con una intersección en y de 31,93. En el contexto, la intersección en y indica que, cuando no haya gavilanes que regresen, habrá casi un 32 % de gavilanes nuevos. Esto no tiene sentido, ya que si no hay aves que regresen, entonces el nuevo porcentaje tendría que ser del 100 % (este es un ejemplo de por qué no extrapolamos). La pendiente nos indica que, por cada incremento porcentual de aves que regresan, el porcentaje de aves nuevas en la colonia disminuye en un 30,3 %.

d. Si examinamos r2, vemos que solo el 57,52 % de la variación en el porcentaje de aves nuevas se explica por el modelo y el coeficiente de correlación, r = -,7584 solo indica una correlación algo fuerte entre los porcentajes de retorno y los nuevos.

e. El par ordenado (66, 6) genera el mayor residuo de 6,0. Esto significa que cuando el porcentaje de retorno observado es del 66 %, nuestro nuevo porcentaje observado, el 6 %, es casi un 6 % menos que el nuevo valor predicho del 11,98 %. Si eliminamos este par de datos, solo vemos una pendiente ajustada de -0,2789 y un intersección ajustada de 30,9816. En otras palabras, aunque este dato genera el mayor residual, no es un valor atípico, ni el par de datos es un punto influyente.

f. Si hay un 70 % de aves que regresan, esperaríamos ver y = -,2789(70) + 30,9816 = 0,114 o 11,4 % de aves nuevas en la colonia.

75.

Compruebe la solución del estudiante.
Compruebe la solución del estudiante.
Tenemos una pendiente de –1,4946 con una intersección en y de 193,88. La pendiente, en contexto, indica que, por cada minuto adicional que se añada al tiempo de natación, la frecuencia cardíaca disminuirá en 1,5 latidos por minuto. Si el estudiante no está nadando en absoluto, la intersección en y indica que su frecuencia cardíaca será de 193,88 latidos por minuto. Mientras que la pendiente tiene sentido (cuanto más tiempo se tarda en nadar 2.000 metros, menos esfuerzo hace el corazón), la intersección en y no tiene sentido. Si el atleta no está nadando (descansando), su frecuencia cardíaca debe ser muy baja.
Dado que solo el 1,5 % de la variación de la frecuencia cardíaca se explica mediante esta ecuación de regresión, debemos concluir que esta asociación no se explica con una relación lineal.
El punto (34,72, 124) genera el mayor residuo de -11,82. Esto significa que nuestra frecuencia cardíaca observada es casi 12 latidos menos que nuestra frecuencia prevista de 136 latidos por minuto. Cuando se elimina este punto, la pendiente se convierte en –2,953 y la intersección en y cambia a 247,1616. Aunque la asociación lineal sigue siendo muy débil, vemos que el par de datos eliminado puede considerarse un punto influyente en el sentido de que la intersección en y adquiere mayor significado.

77.

Si eliminamos las dos academias de servicio (la matrícula es de 0,00 dólares), construimos una nueva ecuación de regresión de y = -0,0009x + 160 con un coeficiente de correlación de 0,71397 y un coeficiente de determinación de 0,50976. Esto nos permite afirmar que existe una asociación lineal bastante fuerte entre los costos de matrícula y los salarios si se eliminan las academias de servicio del conjunto de datos.

79.

Compruebe la solución del estudiante.
sí
ŷ = -266,8863+0,1656x
0,9448; Sí
62,8233; 62,3265
sí
no; (1987, 62,7)
72,5937; no
pendiente = 0,1656.
A medida que el año se incrementa en uno, el porcentaje de trabajadoras que cobran una tarifa por hora tiende a aumentar en 0,1656.

81.

Tamaño (onzas) Costo (dólares) centavos / onza

16 3,99 24,94

32 4,99 15,59

64 5,99 9,36

200 10,99 5,50

Tabla 12.38
Compruebe la solución del estudiante.
Existe una relación lineal para los tamaños 16 a 64, pero esa tendencia lineal no continúa hasta el tamaño de 200 onzas.
ŷ = 20,2368 - 0,0819x
r = -0,8086
40-oz: 16,96 centavos / onza
90-oz: 12,87 centavos / onza
La relación no es lineal; la línea de mínimos cuadrados no es apropiada.
no hay valores atípicos
No, estaría extrapolando. El tamaño de 300 onzas está fuera del rango de x.
pendiente = -0,08194; por cada onza adicional de tamaño, el costo por onza disminuye en 0,082 centavos.

83.

El tamaño es x, la variable independiente, el precio es y, la variable dependiente.
Compruebe la solución del estudiante.
La relación no parece ser lineal.
ŷ = -745,252 + 54,75569x
r = 0,8944, sí es significativo
32 pulgadas: 1006,93 dólares, 50 pulgadas: 1992,53 dólares
No, la relación no parece ser lineal. Sin embargo, r es significativo.
no, el televisor de 60 pulgadas
Por cada pulgada adicional, el precio aumenta en 54,76 dólares

85.

Supongamos que la clasificación es la variable independiente y el área la variable dependiente.
Compruebe la solución del estudiante.
Parece haber una relación lineal, con un valor atípico.
ŷ (área) = 24177,06 + 1010,478x
r = 0,50047, r no es significativa por lo que no hay relación entre las variables.
Alabama: 46407,576 Colorado: 62575,224
La estimación de Alabama está más cerca que la de Colorado.
Si se elimina el valor atípico, existe una relación lineal.
Hay un caso atípico (Hawái).
clasificación 51: 75711,4; no

Alabama	7	1819	22	52.423
Colorado	8	1876	38	104.100
Hawái	6	1959	50	10.932
Iowa	4	1846	29	56.276
Maryland	8	1788	7	12.407
Misuri	8	1821	24	69.709
Nueva Jersey	9	1787	3	8.722
Ohio	4	1803	17	44.828
Carolina del Sur	13	1788	8	32.008
Utah	4	1896	45	84.904
Wisconsin	9	1848	30	65.499

Tabla 12.39

ŷ = -87065,3 + 7828,532x
Alabama: 85.162,404; la estimación anterior estaba más cerca. Alaska es un caso atípico.
sí, con la excepción de Hawái.

Tamaño (onzas)	Costo (dólares)	centavos / onza
16	3,99	24,94
32	4,99	15,59
64	5,99	9,36
200	10,99	5,50