El número de casos de gripe depende del año. Por lo tanto, el año se convierte en la variable independiente y el número de casos de gripe es la variable dependiente.
La intersección em y es 50 (a = 50). Al comienzo de la limpieza, la compañía cobra una tarifa única de 50 dólares (esto es cuando x = 0). La pendiente es 100 (b = 100). Por cada sesión, la compañía cobra 100 dólares por cada hora de limpieza.
La pendiente es –1,5 (b = –1,5). Esto significa que las acciones se desvalorizan a un ritmo de 1,50 dólares por hora. La intersección en y es de 15 dólares (a = 15). Esto significa que el precio de las acciones antes del día de negociación era de 15 dólares.
La pendiente es de 1,99 (b = 1,99). Significa que por cada contrato de patrocinio que consigue un jugador profesional, obtiene un promedio de otros 1,99 millones de dólares de sueldo cada año.
Sí, hay suficientes puntos de datos y el valor de r es lo suficientemente fuerte como para mostrar que hay una fuerte correlación negativa entre los conjuntos de datos.
- Cuando x = 1985, ŷ = 25,52
- Cuando x = 1990, ŷ = 34.275
- Cuando x = 1970, ŷ = -725 ¿Por qué no tiene sentido esta respuesta? El rango de valores de x fue de 1981 a 2002; el año 1970 no está en este rango. La ecuación de regresión no se aplica, porque la predicción para el año 1970 es una extrapolación, que requiere otro proceso. Además, una cifra negativa no tiene sentido en este contexto, en el que estamos prediciendo los casos diagnosticados de gripe.
Además, la correlación r = 0,4526. Si se compara r con el valor de los valores críticos al 95 % de la tabla de coeficientes de correlación de la muestra, porque r > 0,423, r es significativa, y se podría pensar que la línea podría utilizarse para la predicción. Pero el diagrama de dispersión indica lo contrario.
Hasta 1993 se produjo un aumento de los casos diagnosticados de gripe. Desde 1993 hasta 2002, el número de casos diagnosticados de gripe disminuyó cada año. No es apropiado utilizar una línea de regresión lineal para ajustar los datos.
Dado que no existe ninguna asociación lineal entre el año y el número de casos diagnosticados de gripe, no es apropiado calcular un coeficiente de correlación lineal. Cuando existe una asociación lineal y conviene calcular una correlación, no podemos decir que una variable "causa" la otra.
No sabemos si los datos anteriores a 1981 se recogieron en un solo año. Así que no tenemos un valor de la x exacto para esta cifra.
Ecuación de regresión: ŷ (N.º casos de gripe) = -3.448.225 + 1749,777 (año)
Coeficientes | |
---|---|
Intersección | -3.448.225 |
X Variable 1 | 1.749,777 |
El posible valor atípico aplanó la pendiente de la línea de mejor ajuste porque estaba por debajo del conjunto de datos. Hizo que la línea de mejor ajuste fuera menos precisa como predictor de los datos.
- variable independiente: edad; variable dependiente: víctimas mortales
- variable independiente: número de integrantes de la familia; variable dependiente: factura de compra de comestibles
- variable independiente: edad del solicitante; variable dependiente: prima de seguro
- variable independiente: consumo de energía; variable dependiente: factura de servicio
- variable independiente: educación superior (años); variable dependiente: índices de delincuencia
Para el gráfico: compruebe la solución del estudiante. Tenga en cuenta que la matrícula es la variable independiente y el salario es la variable dependiente.
Significa que el 72 % de la variación de la variable dependiente (y) puede explicarse por la variación de la variable independiente (x).
Edad Número de muertes de conductores por cada 100.000 16–19 38 20–24 36 25–34 24 35–54 20 55–74 18 75+ 28 - Compruebe la solución del estudiante.
- ŷ = 35,5818045 - 0,19182491x
- r = –0,57874
Para cuatro df y alfa = 0,05, el LinRegTTest da un valor p = 0,2288, por lo que no rechazamos la hipótesis nula; no hay ninguna relación lineal significativa entre las muertes y la edad.
Utilizando la tabla de valores críticos para el coeficiente de correlación, con cuatro df, el valor crítico es 0,811. El coeficiente de correlación r = -0,57874 no es inferior a -0,811, por lo que no rechazamos la hipótesis nula. - No existe ninguna relación lineal entre las dos variables, como lo demuestra un valor p superior a 0,05.
- Nos preguntamos si los mejores descuentos aparecen antes en el libro, así que seleccionamos la página como X y el descuento como Y.
- Compruebe la solución del estudiante.
- ŷ = 17,21757 - 0,01412x
- r = –0,2752
Para siete df y alfa = 0,05, utilizando la función LinRegTTest, el valor p = 0,4736 por lo que no lo rechazamos; no hay ninguna relación lineal significativa entre la página y el descuento.
Utilizando la tabla de valores críticos para el coeficiente de correlación, con siete df, el valor crítico es 0,666. El coeficiente de correlación xi = -0,2752 no es inferior a 0,666 por lo que no lo rechazamos. - No hay ninguna correlación lineal significativa, por lo que parece que no hay relación entre la página y el monto del descuento.
A medida que se aumenta una página, el descuento disminuye en 0,01412
- El año es la variable independiente o x; el número de letras es la variable dependiente o y.
- Compruebe la solución del estudiante.
- no
- ŷ = 47,03 - 0,0216x
- –0,4280 El valor r indica que no existe ninguna correlación significativa entre el año en que el estado entró en la unión y el número de letras del nombre.
- No, la relación no parece ser lineal; la correlación es despreciable.
a. y b. Compruebe la solución del estudiante.
c. La pendiente de la línea de regresión es –0,3031 con una intersección en y de 31,93. En el contexto, la intersección en y indica que, cuando no haya gavilanes que regresen, habrá casi un 32 % de gavilanes nuevos. Esto no tiene sentido, ya que si no hay aves que regresen, entonces el nuevo porcentaje tendría que ser del 100 % (este es un ejemplo de por qué no extrapolamos). La pendiente nos indica que, por cada incremento porcentual de aves que regresan, el porcentaje de aves nuevas en la colonia disminuye en un 30,3 %.
d. Si examinamos r2, vemos que solo el 57,52 % de la variación en el porcentaje de aves nuevas se explica por el modelo y el coeficiente de correlación, r = -,7584 solo indica una correlación algo fuerte entre los porcentajes de retorno y los nuevos.
e. El par ordenado (66, 6) genera el mayor residuo de 6,0. Esto significa que cuando el porcentaje de retorno observado es del 66 %, nuestro nuevo porcentaje observado, el 6 %, es casi un 6 % menos que el nuevo valor predicho del 11,98 %. Si eliminamos este par de datos, solo vemos una pendiente ajustada de -0,2789 y un intersección ajustada de 30,9816. En otras palabras, aunque este dato genera el mayor residual, no es un valor atípico, ni el par de datos es un punto influyente.
f. Si hay un 70 % de aves que regresan, esperaríamos ver y = -,2789(70) + 30,9816 = 0,114 o 11,4 % de aves nuevas en la colonia.
- Compruebe la solución del estudiante.
- Compruebe la solución del estudiante.
- Tenemos una pendiente de –1,4946 con una intersección en y de 193,88. La pendiente, en contexto, indica que, por cada minuto adicional que se añada al tiempo de natación, la frecuencia cardíaca disminuirá en 1,5 latidos por minuto. Si el estudiante no está nadando en absoluto, la intersección en y indica que su frecuencia cardíaca será de 193,88 latidos por minuto. Mientras que la pendiente tiene sentido (cuanto más tiempo se tarda en nadar 2.000 metros, menos esfuerzo hace el corazón), la intersección en y no tiene sentido. Si el atleta no está nadando (descansando), su frecuencia cardíaca debe ser muy baja.
- Dado que solo el 1,5 % de la variación de la frecuencia cardíaca se explica mediante esta ecuación de regresión, debemos concluir que esta asociación no se explica con una relación lineal.
- El punto (34,72, 124) genera el mayor residuo de -11,82. Esto significa que nuestra frecuencia cardíaca observada es casi 12 latidos menos que nuestra frecuencia prevista de 136 latidos por minuto. Cuando se elimina este punto, la pendiente se convierte en –2,953 y la intersección en y cambia a 247,1616. Aunque la asociación lineal sigue siendo muy débil, vemos que el par de datos eliminado puede considerarse un punto influyente en el sentido de que la intersección en y adquiere mayor significado.
Si eliminamos las dos academias de servicio (la matrícula es de 0,00 dólares), construimos una nueva ecuación de regresión de y = -0,0009x + 160 con un coeficiente de correlación de 0,71397 y un coeficiente de determinación de 0,50976. Esto nos permite afirmar que existe una asociación lineal bastante fuerte entre los costos de matrícula y los salarios si se eliminan las academias de servicio del conjunto de datos.
- Compruebe la solución del estudiante.
- sí
- ŷ = -266,8863+0,1656x
- 0,9448; Sí
- 62,8233; 62,3265
- sí
- no; (1987, 62,7)
- 72,5937; no
- pendiente = 0,1656.
A medida que el año se incrementa en uno, el porcentaje de trabajadoras que cobran una tarifa por hora tiende a aumentar en 0,1656.
-
Tamaño (onzas) Costo (dólares) centavos / onza 16 3,99 24,94 32 4,99 15,59 64 5,99 9,36 200 10,99 5,50 - Compruebe la solución del estudiante.
- Existe una relación lineal para los tamaños 16 a 64, pero esa tendencia lineal no continúa hasta el tamaño de 200 onzas.
- ŷ = 20,2368 - 0,0819x
- r = -0,8086
- 40-oz: 16,96 centavos / onza
- 90-oz: 12,87 centavos / onza
- La relación no es lineal; la línea de mínimos cuadrados no es apropiada.
- no hay valores atípicos
- No, estaría extrapolando. El tamaño de 300 onzas está fuera del rango de x.
- pendiente = -0,08194; por cada onza adicional de tamaño, el costo por onza disminuye en 0,082 centavos.
- El tamaño es x, la variable independiente, el precio es y, la variable dependiente.
- Compruebe la solución del estudiante.
- La relación no parece ser lineal.
- ŷ = -745,252 + 54,75569x
- r = 0,8944, sí es significativo
- 32 pulgadas: 1006,93 dólares, 50 pulgadas: 1992,53 dólares
- No, la relación no parece ser lineal. Sin embargo, r es significativo.
- no, el televisor de 60 pulgadas
- Por cada pulgada adicional, el precio aumenta en 54,76 dólares
- Supongamos que la clasificación es la variable independiente y el área la variable dependiente.
- Compruebe la solución del estudiante.
- Parece haber una relación lineal, con un valor atípico.
- ŷ (área) = 24177,06 + 1010,478x
- r = 0,50047, r no es significativa por lo que no hay relación entre las variables.
- Alabama: 46407,576 Colorado: 62575,224
- La estimación de Alabama está más cerca que la de Colorado.
- Si se elimina el valor atípico, existe una relación lineal.
- Hay un caso atípico (Hawái).
- clasificación 51: 75711,4; no
Alabama 7 1819 22 52.423 Colorado 8 1876 38 104.100 Hawái 6 1959 50 10.932 Iowa 4 1846 29 56.276 Maryland 8 1788 7 12.407 Misuri 8 1821 24 69.709 Nueva Jersey 9 1787 3 8.722 Ohio 4 1803 17 44.828 Carolina del Sur 13 1788 8 32.008 Utah 4 1896 45 84.904 Wisconsin 9 1848 30 65.499 - ŷ = -87065,3 + 7828,532x
- Alabama: 85.162,404; la estimación anterior estaba más cerca. Alaska es un caso atípico.
- sí, con la excepción de Hawái.