Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística empresarial

13.6 Predicción con una ecuación de regresión

Introducción a la estadística empresarial13.6 Predicción con una ecuación de regresión

Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Niveles de medición
    5. 1.4 Diseño experimental y ética
    6. Términos clave
    7. Repaso del capítulo
    8. Tarea para la casa
    9. Referencias
    10. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Datos mostrados
    3. 2.2 Medidas de la ubicación de los datos
    4. 2.3 Medidas del centro de los datos
    5. 2.4 Notación sigma y cálculo de la media aritmética
    6. 2.5 Media geométrica
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. Términos clave
    10. Repaso del capítulo
    11. Repaso de fórmulas
    12. Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia y árboles de probabilidad
    6. 3.5 Diagramas de Venn
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Uniéndolo todo: Práctica
    12. Tarea para la casa
    13. Resúmalo todo: tarea para la casa
    14. Referencias
    15. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Distribución hipergeométrica
    3. 4.2 Distribución binomial
    4. 4.3 Distribución geométrica
    5. 4.4 Distribución de Poisson
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Propiedades de las funciones de densidad de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. Términos clave
    6. Repaso del capítulo
    7. Repaso de fórmulas
    8. Práctica
    9. Tarea para la casa
    10. Referencias
    11. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Estimación de la binomial con la distribución normal
    5. Términos clave
    6. Repaso del capítulo
    7. Repaso de fórmulas
    8. Práctica
    9. Tarea para la casa
    10. Referencias
    11. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de las medias muestrales
    3. 7.2 Uso del teorema del límite central
    4. 7.3 Teorema del límite central de las proporciones
    5. 7.4 Factor de corrección de población finita
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 Un intervalo de confianza para una desviación típica de la población, con un tamaño de muestra conocido o grande
    3. 8.2 Un intervalo de confianza para una desviación típica de población desconocida, caso de una muestra pequeña
    4. 8.3 Un intervalo de confianza para una proporción de población
    5. 8.4 Cálculo del tamaño de la muestra n: variables aleatorias continuas y binarias
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Ejemplos de pruebas de hipótesis completas
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Comparación de las medias de dos poblaciones independientes
    3. 10.2 Criterios de Cohen para efectos de tamaño pequeño, mediano y grande
    4. 10.3 Prueba de diferencias de medias: suponer varianzas de población iguales
    5. 10.4 Comparación de dos proporciones de población independientes
    6. 10.5 Dos medias poblacionales con desviaciones típicas conocidas
    7. 10.6 Muestras coincidentes o emparejadas
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Resúmalo todo: tarea para la casa
    14. Referencias
    15. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de una sola varianza
    4. 11.3 Prueba de bondad de ajuste
    5. 11.4 Prueba de independencia
    6. 11.5 Prueba de homogeneidad
    7. 11.6 Comparación de las pruebas chi-cuadrado
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Resúmalo todo: tarea para la casa
    14. Referencias
    15. Soluciones
  13. 12 La distribución F y el anova de una vía
    1. Introducción
    2. 12.1 Prueba de dos varianzas
    3. 12.2 ANOVA de una vía
    4. 12.3 La distribución F y el cociente F
    5. 12.4 Datos sobre la distribución F
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  14. 13 Regresión lineal y correlación
    1. Introducción
    2. 13.1 El coeficiente de correlación r
    3. 13.2 Comprobación de la importancia del coeficiente de correlación
    4. 13.3 Ecuaciones lineales
    5. 13.4 La ecuación de regresión
    6. 13.5 Interpretación de los coeficientes de regresión: elasticidad y transformación logarítmica
    7. 13.6 Predicción con una ecuación de regresión
    8. 13.7 Cómo utilizar Microsoft Excel® para el análisis de regresión
    9. Términos clave
    10. Repaso del capítulo
    11. Práctica
    12. Soluciones
  15. A Cuadros estadísticos
  16. B Oraciones, símbolos y fórmulas matemáticas
  17. Índice

Un valor importante de una ecuación de regresión estimada es su capacidad para predecir los efectos sobre Y de un cambio en uno o más valores de las variables independientes. El valor de esto es evidente. No se puede hacer ninguna política cuidadosa sin estimar los efectos que pueda tener. De hecho, es el deseo de obtener resultados concretos lo que impulsa la formación de la mayoría de las políticas. Los modelos de regresión pueden ser, y han sido, una ayuda inestimable para la elaboración de estas políticas.

El teorema de Gauss-Markov nos asegura que la estimación puntual del impacto sobre la variable dependiente derivada de poner en la ecuación los valores hipotéticos de las variables independientes que se desea simular dará como resultado una estimación de la variable dependiente que es de varianza mínima e imparcial. Es decir, de esta ecuación sale la mejor estimación puntual imparcial de la y, dados los valores de la x.

ŷ = b 0 + b , X 1 i + + b k X k i ŷ= b 0 +b, X 1 i ++ b k X k i

Recuerde que las estimaciones puntuales no conllevan un determinado nivel de probabilidad, o nivel de confianza, porque los puntos no tienen un "ancho" por encima del cual haya un área que medir. Por eso hemos desarrollado antes intervalos de confianza para la media y la proporción. Aquí también surge la misma preocupación. En realidad, existen dos enfoques diferentes para la elaboración de estimaciones de los cambios de la variable o variables independientes sobre la variable dependiente. El primer enfoque desea medir el valor medio esperado de y a partir de un cambio específico en el valor de la x: este valor específico implica el valor esperado. En este caso, la pregunta es: ¿Cuál es el impacto medio en la y que resultaría de múltiples experimentos hipotéticos en la y a este valor específico de la x? Recuerde que existe una varianza en torno al parámetro estimado de la x; así, cada experimento dará lugar a una estimación un poco diferente del valor predicho de la y.

El segundo enfoque para estimar el efecto de un valor específico de la x en la y trata el evento como un solo experimento: se elige la x y se multiplica por el coeficiente; eso proporciona una única estimación de la y. Dado que este enfoque actúa como si hubiera un solo experimento, la varianza que existe en la estimación de los parámetros es mayor que la asociada al enfoque del valor esperado.

La conclusión es que tenemos dos formas diferentes de predecir el efecto de los valores de la o las variables independientes sobre la variable dependiente; así, tenemos dos intervalos diferentes. Ambas son respuestas correctas a la pregunta planteada, pero con dos preguntas diferentes. Para evitar confusiones, el primer caso en el que pedimos el valor esperado de la media de la y estimada, se denomina intervalo de confianza, tal y como hemos nombrado este concepto anteriormente. El segundo caso, en el que se pide la estimación del impacto sobre la variable dependiente y de un solo experimento utilizando un valor de x, se denomina intervalo de predicción. Las estadísticas de la prueba para estas dos medidas de intervalo dentro de las cuales caerá el valor estimado de la y son:

Intervalo de confianza para el valor esperado del valor medio de la y para x = xp
ŷ = ± t α 2 s e ( 1 n + ( x p x ) 2 sx ) ŷ=± t α 2 s e ( 1 n + ( x p x ) 2 sx )


Intervalo de predicción de un individuo y para x = xp
ŷ = ± t α 2 s e ( 1 + 1 n + ( x p x ) 2 sx ) ŷ=± t α 2 s e ( 1 + 1 n + ( x p x ) 2 sx )

Donde se es la desviación típica del término de error y sx es la desviación típica de la variable x.

Los cálculos matemáticos de estas dos estadísticas de la prueba son complejos. Varios paquetes de software ofrecen programas dentro de las funciones de regresión que dan respuestas a las preguntas acerca de los valores estimados de predicción de la y, dados diversos valores elegidos para las variables x. Es importante saber qué intervalo se está probando en el paquete computarizado porque la diferencia en el tamaño de las desviaciones típicas cambiará el tamaño del intervalo estimado. Esto se muestra en la Figura 13.15.

...
Figura 13.15 Predicción e intervalos de confianza para la ecuación de regresión; nivel de confianza del 95 %.

La Figura 13.15 muestra visualmente la diferencia que supone la desviación típica en el tamaño de los intervalos estimados. El intervalo de confianza, que mide el valor esperado de la variable dependiente, es menor que el intervalo de predicción para el mismo nivel de confianza. El método del valor esperado supone que el experimento se realiza varias veces y no solo una, como en el otro método. La lógica aquí es similar, aunque no idéntica, a la analizada cuando se desarrolla la relación entre el tamaño de la muestra y el intervalo de confianza mediante el teorema del límite central. Allí, a medida que aumentaba el número de experimentos, la distribución se estrechaba y el intervalo de confianza se acortaba más en torno al valor esperado de la media.

También es importante señalar que los intervalos en torno a una estimación puntual dependen en gran medida del rango de datos utilizado para estimar la ecuación, sin importar el enfoque que se utilice para la predicción. Recuerde que todas las ecuaciones de regresión pasan por el punto de las medias, es decir, el valor medio de la y, así como los valores medios de todas las variables independientes de la ecuación. A medida que el valor de la x que se elige para estimar el valor asociado de la y se aleja del punto de las medias, el ancho del intervalo estimado alrededor de la estimación puntual aumenta. La elección de valores de la x más allá del intervalo de los datos utilizados para estimar la ecuación plantea el peligro aun mayor de crear estimaciones de poca utilidad, intervalos muy grandes y riesgo de error. La Figura 13.16 muestra esta relación.

...
Figura 13.16 Intervalo de confianza para un valor individual de la x, Xp, con un nivel de confianza del 95 %

La Figura 13.16 demuestra la preocupación por la calidad del intervalo estimado, ya sea uno de predicción o de confianza. A medida que el valor que se elige para predecir la y, Xp en el gráfico, se aleja del peso central de los datos, XX, observamos que el intervalo se expande, a la vez que se mantiene constante el nivel de confianza. Esto demuestra que la precisión de cualquier estimación disminuirá a medida que se intente predecir más allá del mayor peso de los datos y, con toda seguridad, se degradará rápidamente con respecto a las predicciones más allá del rango de los datos. Desgraciadamente, justo aquí es donde se desea la mayoría de las predicciones. Se pueden hacer, pero la amplitud del intervalo de confianza puede ser tan grande que haga inútil la predicción. Sin embargo, solo el cálculo real y la aplicación concreta pueden determinarlo.

Ejemplo 13.6

Recordemos el ejemplo del tercer examen o examen final.

Hallamos la ecuación de la línea de mejor ajuste para la calificación del examen final como una función de la calificación del tercer examen. Ahora podemos utilizar la línea de regresión por mínimos cuadrados para la predicción. Supongamos que se ha determinado que el coeficiente de X es significativamente diferente de cero.

Suponga que quiere estimar, o predecir, la calificación media del examen final de los estudiantes de Estadística que obtuvieron 73 en el tercer examen. Las calificaciones del examen (valores x) oscilan entre 65 y 75. Dado que 73 está entre los valores de la x, 65 y 75, nos sentimos cómodos al sustituir x = 73 en la ecuación. Entonces:

y ^ =173,51+4,83(73)=179,08 y ^ =173,51+4,83(73)=179,08

Predecimos que los estudiantes de Estadística que obtienen una calificación de 73 en el tercer examen obtendrán una calificación de 179,08 en el examen final, en promedio.

Translation missing: es.problem

a. ¿Cuál sería la calificación del examen final de un estudiante que ha obtenido 66 en el tercer examen?

Translation missing: es.problem

b. ¿Cuál sería la calificación del examen final de un estudiante que ha obtenido 90 en el tercer examen?

Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.