Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax

13.1 El coeficiente de correlación r

1.

Para tener un coeficiente de correlación entre los rasgos A y B, es necesario tener:

  1. un grupo de sujetos, algunos de los cuales poseen características del rasgo A, el restante posee las del rasgo B
  2. medidas del rasgo A en un grupo de sujetos y del rasgo B en otro grupo
  3. dos grupos de sujetos, uno que podría clasificarse como A o no A, y el otro como B o no B
  4. dos grupos de sujetos, uno que podría clasificarse como A o no A, y el otro como B o no B
2.

Defina el coeficiente de correlación y dé un ejemplo único de su uso.

3.

Si la correlación entre la edad de un automóvil y el dinero gastado en reparaciones es de +0,90

  1. El 81 % de la variación del dinero gastado en reparaciones se explica por la edad del automóvil
  2. El 81 % del dinero gastado en reparaciones no se explica por la edad del automóvil
  3. El 90 % del dinero que se gasta en reparaciones se explica por la edad del automóvil
  4. Ninguna de las anteriores
4.

Supongamos que el promedio general de calificaciones del instituto universitario y la parte verbal de una prueba de coeficiente intelectual tienen una correlación de 0,40. ¿Qué porcentaje de la varianza tienen ambas en común?

  1. 20
  2. 16
  3. 40
  4. 80
5.

¿Verdadero o falso? Si es falso, explique por qué: El coeficiente de determinación puede tener valores entre -1 y +1.

6.

Verdadero o falso: Siempre que se calcula r a partir de una muestra, el valor que obtenemos es solo una estimación del verdadero coeficiente de correlación que obtendríamos si lo calculáramos para toda la población.

7.

Bajo un "diagrama de dispersión" se anota que el coeficiente de correlación es de 0,10. ¿Qué significa esto?

  1. más y menos el 10 % de la media incluye alrededor del 68 % de los casos
  2. una décima parte de la varianza de una variable se comparte con la otra variable
  3. una décima parte de una variable es causada por la otra variable
  4. en una escala de -1 a +1, el grado de relación lineal entre las dos variables es de +0,10
8.

Se sabe que el coeficiente de correlación de la X y de la Y es cero. Entonces podemos concluir que:

  1. la X y la Y tienen distribuciones estándar
  2. las varianzas de la X y de la Y son iguales
  3. no existe ninguna relación entre la X y la Y
  4. no existe ninguna relación lineal entre la X y la Y
  5. ninguno de estos
9.

¿Cuál cree que es el valor del coeficiente de correlación para el par de variables: "número de horas de trabajo" y "número de unidades de trabajo realizadas"?

  1. Aproximadamente 0,9
  2. Aproximadamente 0,4
  3. Aproximadamente 0,0
  4. Aproximadamente -0,4
  5. Aproximadamente -0,9
10.

En un grupo determinado, la correlación entre la estatura en pies y el peso en libras es de +0,68. ¿Cuál de las siguientes opciones alteraría el valor de r?

  1. la altura se expresa en centímetros.
  2. el peso se expresa en kilogramos.
  3. ambos afectarán a r.
  4. ninguno de los cambios anteriores afectará a r.

13.2 Comprobación de la importancia del coeficiente de correlación

11.

Defina la prueba t de un coeficiente de regresión y dé un ejemplo único de su uso.

12.

La correlación entre las puntuaciones en una prueba de neurosis y las puntuaciones en una prueba de ansiedad es alta y positiva; por lo tanto,

  1. la ansiedad causa neurosis.
  2. los que obtienen una puntuación baja en una prueba tienden a obtener una puntuación alta en la otra.
  3. los que obtienen una puntuación baja en una prueba tienden a obtener una puntuación baja en la otra.
  4. no se puede hacer ninguna predicción significativa de una prueba a la otra.

13.3 Ecuaciones lineales

13.

¿Verdadero o falso? Si es falso, corríjalo: Supongamos un intervalo de confianza del 95 % para la pendiente β de la línea recta de regresión de Y sobre X viene dado por -3,5 < β < -0,5. Entonces una prueba de dos lados de la hipótesis H0:β=-1H0:β=-1 provocaría el rechazo de H0H0 al nivel de significación del 1 %.

14.

Verdadero o falso: Es más seguro interpretar los coeficientes de correlación como medidas de asociación y no de causalidad debido a la posibilidad de correlación espuria.

15.

Nos interesa hallar la relación lineal entre el número de miniaplicaciones compradas de una vez y el coste por miniaplicación. Se han obtenido los siguientes datos:

X: Número de miniaplicaciones compradas – 1, 3, 6, 10, 15

Y: Coste por miniaplicación (en dólares) – 55, 52, 46, 32, 25

Supongamos que la línea de regresión es y^=-2,5x+60y^=-2,5x+60. Calculamos el precio promedio por miniaplicación si se compran 30 y observamos alguno de los siguientes elementos:

  1. y^=15dólaresy^=15dólares; obviamente, estamos equivocados; la predicción y^y^ es en realidad, +15 dólares.
  2. y^=15dólaresy^=15dólares, lo que parece razonable, a juzgar por los datos.
  3. y^=-15dólaresy^=-15dólares, lo cual es un sinsentido evidente. La línea de regresión debe ser incorrecta.
  4. y^=-15dólaresy^=-15dólares, lo cual es un sinsentido evidente. Esto nos recuerda que predecir la Y fuera del rango de valores de la X en nuestros datos es una práctica muy mala.
16.

Comente brevemente la distinción entre correlación y causalidad.

17.

Verdadero o falso: Si r se acerca a + o -1, diremos que hay una fuerte correlación, en el entendido tácito de que nos referimos a una relación lineal y nada más.

13.4 La ecuación de regresión

18.

Supongamos que tiene a su disposición la información que figura a continuación para cada uno de los 30 conductores. Proponga un modelo (con una breve indicación de los símbolos utilizados para representar las variables independientes) para explicar cómo varían las millas por galón de un conductor a otro, en función de los factores medidos.

Información:
  1. millas conducidas por día
  2. peso del automóvil
  3. número de cilindros del automóvil
  4. rapidez promedio
  5. millas por galón
  6. número de pasajeros
19.

Considere un análisis de regresión de mínimos cuadrados entre una variable dependiente (Y) y una variable independiente (X). El coeficiente de correlación muestral de −1 (menos uno) nos indica que:

  1. no hay relación entre Y y X en la muestra
  2. no hay relación entre Y y X en la población
  3. existe una relación negativa perfecta entre Y y X en la población
  4. existe una relación negativa perfecta entre Y y X en la muestra.
20.

En el análisis correlacional, cuando los puntos se dispersan ampliamente alrededor de la línea de regresión, esto significa que la correlación es:

  1. negativa.
  2. baja.
  3. heterogénea.
  4. entre dos medidas que no son fiables.

13.5 Interpretación de los coeficientes de regresión: elasticidad y transformación logarítmica

21.

En una regresión lineal, ¿por qué tenemos que preocuparnos por el rango de la variable independiente (X)?

22.

Supongamos que se recoge la siguiente información, donde la X es el diámetro del tronco del árbol y la Y es la altura del árbol.

X Y
4 8
2 4
8 18
6 22
10 30
6 8
Tabla 13.3

Ecuación de regresión: y^i=-3,6+3,1Xiy^i=-3,6+3,1Xi

¿Cuál es su estimación de la altura promedio de todos los árboles con un diámetro de tronco de 7 pulgadas?

23.

Los fabricantes de un producto químico utilizado en los collares antipulgas afirman que, en las típicas condiciones de ensayo, cada unidad adicional del producto químico provocará una reducción de 5 pulgas (es decir, cuando Xj=cantidad de producto químicoXj=cantidad de producto químico y YJ=B0+B1XJ+EJYJ=B0+B1XJ+EJ, H0H0: B1=−5B1=−5

Supongamos que se ha realizado una prueba y los resultados de la computadora incluyen:

Intersección = 60

Pendiente = −4

Error estándar del coeficiente de regresión = 1,0

Grados de libertad para el error = 2000

Intervalo de confianza del 95% para la pendiente −2,04; −5,96

¿Son estas pruebas coherentes con la afirmación de que el número de pulgas se reduce a razón de 5 por unidad de producto químico?

13.6 Predicción con una ecuación de regresión

24.

¿Verdadero o falso? Si es falso, corríjalo: Supongamos que se realiza una regresión lineal simple de Y sobre X y se comprueba la hipótesis de que la pendiente β es cero frente a una alternativa de dos lados. Usted tiene n=25n=25 observaciones y su estadístico de prueba (t) calculado es 2,6. Entonces su valor P viene dado por 0,01 < P < 0,02, lo que da una significación límite (es decir, se rechazaría H0H0 a α=0,02α=0,02, pero no se rechaza H0H0 a α=0,01α=0,01).

25.

Un economista se interesa por la posible influencia del "trigo milagroso" en el rendimiento promedio del trigo en un distrito. Para ello, realiza una regresión lineal del rendimiento promedio anual con respecto al año posterior a la introducción del "trigo milagroso" durante un periodo de diez años.

La línea de tendencia ajustada es

y ^ j = 80 + 1,5 X j y ^ j = 80 + 1,5 X j

(YjYj: Rendimiento promedio en j año después de la introducción)

(XjXj: j año después de la introducción).

  1. ¿Cuál es el rendimiento promedio estimado para el cuarto año tras la introducción?
  2. ¿Quiere utilizar esta línea de tendencia para estimar el rendimiento, por ejemplo, 20 años después de la introducción? ¿Por qué? ¿Cuál sería su estimación?
26.

Una interpretación de r=0,5r=0,5 es que la siguiente parte de la variación de la Y está asociada a qué variación en la X:

  1. la mayor parte
  2. la mitad
  3. muy poco
  4. una cuarta parte
  5. ninguno de estos
27.

¿Cuál de los siguientes valores de r indica la predicción más precisa de una variable a partir de otra?

  1. r=1,18r=1,18
  2. r=-0,77r=-0,77
  3. r=0,68r=0,68

13.7 Cómo utilizar Microsoft Excel® para el análisis de regresión

28.

Se ha utilizado un programa computarizado de regresión múltiple para ajustar y^j=b0+b1X1j+b2X2j+b3X3jy^j=b0+b1X1j+b2X2j+b3X3j.

Parte del resultado de la computadora incluye:

i bibi SbiSbi
0 8 1,6
1 2,2 0,24
2 -0,72 0,32
3 0,005 0,002
Tabla 13.4
  1. Cálculo del intervalo de confianza para b2b2 se compone de _______± (un valor t de Student) (_______)
  2. El nivel de confianza de este intervalo se refleja en el valor utilizado para _______.
  3. Los grados de libertad disponibles para estimar la varianza están directamente relacionados con el valor utilizado para _______
29.

Un investigador ha utilizado un programa de regresión múltiple sobre 20 puntos de datos para obtener una ecuación de regresión con 3 variables. Parte del resultado de la computadora es:

Variable Coeficiente Error estándar de bibi
1 0,45 0,21
2 0,80 0,10
3 3,10 0,86
Tabla 13.5
  1. 0,80 es una estimación de ___________.
  2. 0,10 es una estimación de ___________.
  3. Asumiendo que las respuestas satisfacen el supuesto de normalidad, podemos estar seguros al 95% de que el valor de β2β2 está en el intervalo, _______ ± [t0,025 ⋅ _______], donde t0,025 es el valor crítico de la distribución t de Student con ____ grados de libertad.
Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.