Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax

Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Frecuencia, tablas de frecuencia y niveles de medición
    5. 1.4 Diseño experimental y ética
    6. 1.5 Experimento de recopilación de datos
    7. 1.6 Experimento de muestreo
    8. Términos clave
    9. Repaso del capítulo
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
    3. 2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
    4. 2.3 Medidas de la ubicación de los datos
    5. 2.4 Diagramas de caja
    6. 2.5 Medidas del centro de los datos
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. 2.8 Estadística descriptiva
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia
    6. 3.5 Diagramas de árbol y de Venn
    7. 3.6 Temas de probabilidad
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Uniéndolo todo: Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
    3. 4.2 Media o valor esperado y desviación típica
    4. 4.3 Distribución binomial
    5. 4.4 Distribución geométrica
    6. 4.5 Distribución hipergeométrica
    7. 4.6 Distribución de Poisson
    8. 4.7 Distribución discreta (experimento con cartas)
    9. 4.8 Distribución discreta (experimento de los dados de la suerte)
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Referencias
    16. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Funciones de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. 5.4 Distribución continua
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Distribución normal (tiempos de vuelta)
    5. 6.4 Distribución normal (longitud del meñique)
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de medias muestrales (promedios)
    3. 7.2 El teorema del límite central para las sumas
    4. 7.3 Uso del teorema del límite central
    5. 7.4 Teorema del límite central (monedas en el bolsillo)
    6. 7.5 Teorema del límite central (recetas de galletas)
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 La media de una población utilizando la distribución normal
    3. 8.2 La media de una población utilizando la distribución t de Student
    4. 8.3 Una proporción de la población
    5. 8.4 Intervalo de confianza (costos de hogares)
    6. 8.5 Intervalo de confianza (lugar de nacimiento)
    7. 8.6 Intervalo de confianza (altura de las mujeres)
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Eventos poco comunes, la muestra, decisión y conclusión
    6. 9.5 Información adicional y ejemplos de pruebas de hipótesis completas
    7. 9.6 Pruebas de hipótesis de una sola media y una sola proporción
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Medias de dos poblaciones con desviaciones típicas desconocidas
    3. 10.2 Dos medias poblacionales con desviaciones típicas conocidas
    4. 10.3 Comparación de dos proporciones de población independientes
    5. 10.4 Muestras coincidentes o emparejadas
    6. 10.5 Prueba de hipótesis para dos medias y dos proporciones
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de bondad de ajuste
    4. 11.3 Prueba de independencia
    5. 11.4 Prueba de homogeneidad
    6. 11.5 Comparación de las pruebas chi-cuadrado
    7. 11.6 Prueba de una sola varianza
    8. 11.7 Laboratorio 1: Bondad de ajuste de chi-cuadrado
    9. 11.8 Laboratorio 2: prueba de independencia de chi-cuadrado
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  13. 12 Regresión lineal y correlación
    1. Introducción
    2. 12.1 Ecuaciones lineales
    3. 12.2 Diagramas de dispersión
    4. 12.3 La ecuación de regresión
    5. 12.4 Comprobación de la importancia del coeficiente de correlación
    6. 12.5 Predicción
    7. 12.6 Valores atípicos
    8. 12.7 Regresión (distancia desde la escuela)
    9. 12.8 Regresión (costo de los libros de texto)
    10. 12.9 Regresión (eficiencia del combustible)
    11. Términos clave
    12. Repaso del capítulo
    13. Repaso de fórmulas
    14. Práctica
    15. Tarea para la casa
    16. Resúmalo todo: tarea para la casa
    17. Referencias
    18. Soluciones
  14. 13 Distribución F y análisis de varianza anova de una vía
    1. Introducción
    2. 13.1 ANOVA de una vía
    3. 13.2 La distribución F y el cociente F
    4. 13.3 Datos sobre la distribución F
    5. 13.4 Prueba de dos varianzas
    6. 13.5 Laboratorio: ANOVA de una vía
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  15. A Ejercicios de repaso (caps. 3-13)
  16. B Pruebas prácticas (de la 1 a la 4) y exámenes finales
  17. C Conjuntos de datos
  18. D Proyectos de grupos y asociaciones
  19. E Hojas de soluciones
  20. F Oraciones, símbolos y fórmulas matemáticas
  21. G Notas para las calculadoras TI-83, 83+, 84 y 84+
  22. H Tablas
  23. Índice

12.1 Ecuaciones lineales

El tipo más básico de asociación es la asociación lineal. Este tipo de relación se puede definir algebraicamente mediante las ecuaciones usadas, numéricamente con los valores de los datos reales o previstos o gráficamente a partir de una curva trazada (las líneas se clasifican como curvas rectas). Algebraicamente, una ecuación lineal suele tener la forma y = mx + b, donde m y b son constantes, x es la variable independiente y es la variable dependiente. En un contexto estadístico, una ecuación lineal se escribe de la forma y = a + bx, donde a y b son las constantes. Esta forma se utiliza para ayudar a los lectores a distinguir el contexto estadístico del contexto algebraico. En la ecuación y = a + bx, la constante b, llamada coeficiente, representa la pendiente. La constante a recibe el nombre de intersección en y.

La pendiente de una línea es un valor que describe la tasa de cambio entre las variables independiente y dependiente. La pendiente nos indica cómo cambia la variable dependiente (y) por cada incremento unitario de la variable independiente (x) , en promedio. La intersección en y se utiliza para describir la variable dependiente cuando la variable independiente es igual a cero.

12.2 Diagramas de dispersión

Los diagramas de dispersión son especialmente útiles cuando queremos ver si existe una relación lineal entre los puntos de datos. Indican tanto la dirección de la relación entre las variables x y las variables y, como la fuerza de la relación. Calculamos la fuerza de la relación entre una variable independiente y una variable dependiente mediante una regresión lineal.

12.3 La ecuación de regresión

Una línea de regresión, o una línea de mejor ajuste, puede trazarse en un diagrama de dispersión y utilizarse para predecir los resultados de las variables x y y en un conjunto de datos dado o datos de muestra. Hay varias formas de hallar una línea de regresión, pero normalmente se utiliza la línea de regresión por mínimos cuadrados porque crea una línea uniforme. Los residuos, también llamados "errores", miden la distancia entre el valor real de y y el valor estimado de y. La suma de errores al cuadrado, cuando se ajusta a su mínimo, calcula los puntos de la línea de mejor ajuste. Las líneas de regresión pueden utilizarse para predecir valores dentro del conjunto de datos dado, pero no deben utilizarse para hacer predicciones de valores fuera del conjunto de datos.

El coeficiente de correlación r mide la fuerza de la asociación lineal entre x y y. La variable r tiene que estar entre -1 y +1. Cuando r es positivo, la x y la y tenderán a aumentar y disminuir juntas. Cuando r es negativo, x aumentará y y disminuirá, o lo contrario, x disminuirá y y aumentará. El coeficiente de determinación r2, es igual al cuadrado del coeficiente de correlación. Cuando se expresa en porcentaje, r2 representa el porcentaje de variación de la variable dependiente y que puede explicarse por la variación de la variable independiente x mediante la línea de regresión.

12.4 Comprobación de la importancia del coeficiente de correlación

La regresión lineal es un procedimiento para ajustar una línea recta de la forma ŷ = a + bx a los datos. Las condiciones para la regresión son:

  • Lineal En la población, existe una relación lineal que modela el valor promedio de la y para distintos valores de la x.
  • Independiente Se supone que los residuales son independientes.
  • Normal Los valores de la y se distribuyen normalmente para cualquier valor de la x.
  • Varianza igual La desviación típica de los valores de la y es igual para cada valor de la x.
  • Aleatoria Los datos proceden de una muestra aleatoria bien diseñada o de un experimento aleatorio.

La pendiente b y la intersección a de la línea de mínimos cuadrados estiman la pendiente β y la intersección α de la línea de regresión de la población (verdadera). Para estimar la desviación típica de la población de y, σ, utilice la desviación típica de los residuales, s. s= SEE n2 s= SEE n2 . La variable ρ (rho) es el coeficiente de correlación de la población. Para comprobar la hipótesis nula H0: ρ = valor hipotetizado, utilice una prueba t de regresión lineal. La hipótesis nula más común es H0: ρ = 0, que indica que no existe una relación lineal entre la x y la y en la población. La función LinRegTTest de las calculadoras TI-83, 83+, 84 u 84+ puede realizar esta prueba (STATS TESTS LinRegTTest).

12.5 Predicción

Después de determinar la presencia de un fuerte coeficiente de correlación y calcular la línea de mejor ajuste, puede utilizar la línea de regresión de mínimos cuadrados para hacer predicciones sobre sus datos.

12.6 Valores atípicos

Para determinar si un punto es un valor atípico, realice una de las siguientes acciones:

  1. Introduzca las siguientes ecuaciones en la TI 83, 83+, 84, 84+:

    y 1 =a+bx y 2 =a+bx+2s y 3 =a+bx2s y 1 =a+bx y 2 =a+bx+2s y 3 =a+bx2s donde s es la desviación típica de los residuales

    Si algún punto está por encima de y2 o por debajo de y3, se considera un valor atípico.

  2. Utilice los residuales y compare sus valores absolutos con 2s, donde s es la desviación típica. Si el valor absoluto de cualquier residual es mayor o igual a 2s, el punto correspondiente es un valor atípico.
  3. Nota: La función de la calculadora LinRegTTest (STATS TESTS LinRegTTest) calcula s.
Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.