Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax

Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Frecuencia, tablas de frecuencia y niveles de medición
    5. 1.4 Diseño experimental y ética
    6. 1.5 Experimento de recopilación de datos
    7. 1.6 Experimento de muestreo
    8. Términos clave
    9. Repaso del capítulo
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Gráficos de tallo y hoja (gráfico de tallo), gráficos de líneas y gráficos de barras
    3. 2.2 Histogramas, polígonos de frecuencia y gráficos de series temporales
    4. 2.3 Medidas de la ubicación de los datos
    5. 2.4 Diagramas de caja
    6. 2.5 Medidas del centro de los datos
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. 2.8 Estadística descriptiva
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia
    6. 3.5 Diagramas de árbol y de Venn
    7. 3.6 Temas de probabilidad
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Uniéndolo todo: Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta
    3. 4.2 Media o valor esperado y desviación típica
    4. 4.3 Distribución binomial
    5. 4.4 Distribución geométrica
    6. 4.5 Distribución hipergeométrica
    7. 4.6 Distribución de Poisson
    8. 4.7 Distribución discreta (experimento con cartas)
    9. 4.8 Distribución discreta (experimento de los dados de la suerte)
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Referencias
    16. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Funciones de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. 5.4 Distribución continua
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Distribución normal (tiempos de vuelta)
    5. 6.4 Distribución normal (longitud del meñique)
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de medias muestrales (promedios)
    3. 7.2 El teorema del límite central para las sumas
    4. 7.3 Uso del teorema del límite central
    5. 7.4 Teorema del límite central (monedas en el bolsillo)
    6. 7.5 Teorema del límite central (recetas de galletas)
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 La media de una población utilizando la distribución normal
    3. 8.2 La media de una población utilizando la distribución t de Student
    4. 8.3 Una proporción de la población
    5. 8.4 Intervalo de confianza (costos de hogares)
    6. 8.5 Intervalo de confianza (lugar de nacimiento)
    7. 8.6 Intervalo de confianza (altura de las mujeres)
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Eventos poco comunes, la muestra, decisión y conclusión
    6. 9.5 Información adicional y ejemplos de pruebas de hipótesis completas
    7. 9.6 Pruebas de hipótesis de una sola media y una sola proporción
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Referencias
    14. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Medias de dos poblaciones con desviaciones típicas desconocidas
    3. 10.2 Dos medias poblacionales con desviaciones típicas conocidas
    4. 10.3 Comparación de dos proporciones de población independientes
    5. 10.4 Muestras coincidentes o emparejadas
    6. 10.5 Prueba de hipótesis para dos medias y dos proporciones
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Resúmalo todo: tarea para la casa
    13. Referencias
    14. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de bondad de ajuste
    4. 11.3 Prueba de independencia
    5. 11.4 Prueba de homogeneidad
    6. 11.5 Comparación de las pruebas chi-cuadrado
    7. 11.6 Prueba de una sola varianza
    8. 11.7 Laboratorio 1: Bondad de ajuste de chi-cuadrado
    9. 11.8 Laboratorio 2: prueba de independencia de chi-cuadrado
    10. Términos clave
    11. Repaso del capítulo
    12. Repaso de fórmulas
    13. Práctica
    14. Tarea para la casa
    15. Resúmalo todo: tarea para la casa
    16. Referencias
    17. Soluciones
  13. 12 Regresión lineal y correlación
    1. Introducción
    2. 12.1 Ecuaciones lineales
    3. 12.2 Diagramas de dispersión
    4. 12.3 La ecuación de regresión
    5. 12.4 Comprobación de la importancia del coeficiente de correlación
    6. 12.5 Predicción
    7. 12.6 Valores atípicos
    8. 12.7 Regresión (distancia desde la escuela)
    9. 12.8 Regresión (costo de los libros de texto)
    10. 12.9 Regresión (eficiencia del combustible)
    11. Términos clave
    12. Repaso del capítulo
    13. Repaso de fórmulas
    14. Práctica
    15. Tarea para la casa
    16. Resúmalo todo: tarea para la casa
    17. Referencias
    18. Soluciones
  14. 13 Distribución F y análisis de varianza anova de una vía
    1. Introducción
    2. 13.1 ANOVA de una vía
    3. 13.2 La distribución F y el cociente F
    4. 13.3 Datos sobre la distribución F
    5. 13.4 Prueba de dos varianzas
    6. 13.5 Laboratorio: ANOVA de una vía
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Tarea para la casa
    12. Referencias
    13. Soluciones
  15. A Ejercicios de repaso (caps. 3-13)
  16. B Pruebas prácticas (de la 1 a la 4) y exámenes finales
  17. C Conjuntos de datos
  18. D Proyectos de grupos y asociaciones
  19. E Hojas de soluciones
  20. F Oraciones, símbolos y fórmulas matemáticas
  21. G Notas para las calculadoras TI-83, 83+, 84 y 84+
  22. H Tablas
  23. Índice

12.1 Ecuaciones lineales

Utilice la siguiente información para responder los próximos tres ejercicios. Un centro vacacional alquila equipos de buceo a buceadores certificados. El complejo cobra una tarifa inicial de 25 dólares y otra de 12,50 dólares por hora.

1.

¿Cuáles son las variables dependientes e independientes?

2.

Halle la ecuación que expresa la tarifa total en función del número de horas de alquiler del equipo.

3.

Grafique la ecuación del Ejercicio 12.2.


Use la siguiente información para responder los próximos dos ejercicios. Una compañía de tarjetas de crédito cobra 10 dólares por cada pago retrasado y 5 dólares por cada día de mora.

4.

Halle la ecuación que expresa la tarifa total en función del número de días de retraso en el pago.

5.

Grafique la ecuación del Ejercicio 12.4.

6.

¿Es lineal la ecuación y = 10 + 5x - 3x2? ¿Por qué sí o por qué no?

7.

¿Cuáles de las siguientes ecuaciones son lineales?

a. y = 6x + 8

b. y + 7 = 3x

c. y - x = 8x2

d. 4y = 8

8.

¿Muestra el gráfico una ecuación lineal? ¿Por qué sí o por qué no?

Este es el gráfico de una ecuación. El eje x está marcado en intervalos de 1 de –5 a 5; el eje y está marcado en intervalos de 1 de 0 a 8. El gráfico de la ecuación es una parábola, una curva en forma de U que tiene un valor mínimo en (0, 0).
Figura 12.25

La Tabla 12.12 contiene datos reales de las dos primeras décadas de presentación de informes sobre la gripe.

Año N.º casos de gripe diagnosticados N.º muertes por gripe
Antes de 1981 91 29
1981 319 121
1982 1.170 453
1983 3.076 1.482
1984 6.240 3.466
1985 11.776 6.878
1986 19.032 11.987
1987 28.564 16.162
1988 35.447 20.868
1989 42.674 27.591
1990 48.634 31.335
1991 59.660 36.560
1992 78.530 41.055
1993 78.834 44.730
1994 71.874 49.095
1995 68.505 49.456
1996 59.347 38.510
1997 47.149 20.736
1998 38.393 19.005
1999 25.174 18.454
2000 25.522 17.347
2001 25.643 17.402
2002 26.464 16.371
Total 802.118 489.093
Tabla 12.12 Solo adultos y adolescentes, Estados Unidos
9.

Utilice las columnas "año" y "N.º casos diagnosticados de gripe". ¿Por qué el "año" es la variable independiente y el "N.º de casos diagnosticados de gripe" la variable dependiente (en lugar de la inversa)?


Use la siguiente información para responder los próximos dos ejercicios. Una compañía de limpieza especializada cobra una tarifa por el equipo y una tarifa por hora de trabajo. Una ecuación lineal que expresa el monto total de la tarifa que la compañía cobra por cada sesión es y = 50 + 100x.

10.

¿Cuáles son las variables independientes y dependientes?

11.

¿Cuál es la intersección en y y cuál es la pendiente? Interprételos utilizando oraciones completas.


Use la siguiente información para responder las próximas tres preguntas. Debido a la erosión, la orilla de un río pierde varios miles de libras de suelo cada año. Una ecuación lineal que expresa la cantidad total de suelo perdido por año es y = 12.000x.

12.

¿Cuáles son las variables independientes y dependientes?

13.

¿Cuántas libras de suelo pierde la costa en un año?

14.

¿Cuál es la intersección en y? Interprete su significado.


Use la siguiente información para responder los próximos dos ejercicios. El precio de una sola emisión de acciones puede fluctuar a lo largo del día. Una ecuación lineal que representa el precio de las acciones de Shipment Express es y = 15 - 1,5x donde x es el número de horas transcurridas en un día de ocho horas de negociación.

15.

¿Cuáles son la pendiente y la intersección en y? Interprete su significado.

16.

Si tuviera esta acción, ¿querría una pendiente positiva o negativa? ¿Por qué?

12.2 Diagramas de dispersión

17.

¿El diagrama de dispersión parece lineal? ¿Fuerte o débil? ¿Positiva o negativa?

Se trata de un diagrama de dispersión con varios puntos trazados en el primer cuadrante. Los puntos forman un patrón claro, al moverse hacia arriba a la derecha. Los puntos no se alinean, pero el patrón general se puede modelar con una línea.
Figura 12.26
18.

¿El diagrama de dispersión parece lineal? ¿Fuerte o débil? ¿Positiva o negativa?

Se trata de un diagrama de dispersión con varios puntos trazados en el primer cuadrante. Los puntos se mueven hacia abajo a la derecha. El patrón general puede modelarse con una línea, pero los puntos están muy dispersos.
Figura 12.27
19.

¿El diagrama de dispersión parece lineal? ¿Fuerte o débil? ¿Positiva o negativa?

Se trata de un diagrama de dispersión con varios puntos trazados en todo el primer cuadrante. No hay ningún patrón.
Figura 12.28

12.3 La ecuación de regresión

Use la siguiente información para responder los siguientes cinco ejercicios. Una muestra aleatoria de 10 deportistas profesionales arrojó los siguientes datos, donde la x es el número de patrocinadores que tiene el jugador, mientras que la y es la cantidad de dinero que gana (en millones de dólares).

x y x y
0 2 5 12
3 8 4 9
2 7 3 9
1 3 0 3
5 13 4 10
Tabla 12.13
20.

Dibuje un diagrama de dispersión de los datos.

21.

Utilice la regresión para hallar la ecuación de la línea de mejor ajuste.

22.

Dibuje la línea de mejor ajuste en el diagrama de dispersión.

23.

¿Cuál es la pendiente de la línea de mejor ajuste? ¿Qué representa?

24.

¿Cuál es la intersección en y de la línea de mejor ajuste? ¿Qué representa?

25.

¿Qué significa un valor r de cero?

26.

Cuando n = 2 y r = 1, ¿son los datos significativos? Explique.

27.

Cuando n = 100 y r = -0,89, ¿existe una correlación significativa? Explique.

12.4 Comprobación de la importancia del coeficiente de correlación

28.

Al comprobar la significación del coeficiente de correlación, ¿cuál es la hipótesis nula?

29.

Al comprobar la significación del coeficiente de correlación, ¿cuál es la hipótesis alternativa?

30.

Si el nivel de significación es 0,05 y el valor p es 0,04, ¿qué conclusión puede sacar?

12.5 Predicción

Utilice la siguiente información para responder los próximos dos ejercicios. Un minorista de productos electrónicos utilizó la regresión para hallar un modelo sencillo que prediga el crecimiento de las ventas en el primer trimestre del nuevo año (de enero a marzo). El modelo es válido para 90 días, donde x es el día. El modelo puede escribirse como sigue:

ŷ = 101,32 + 2,48x donde ŷ está en miles de dólares.

31.

¿Cuál es la previsión de ventas para el día 60?

32.

¿Cuál es la previsión de ventas para el día 90?


Utilice la siguiente información para responder los próximos tres ejercicios. Una compañía de jardinería es contratada para cortar el césped de varios inmuebles grandes. El área total combinado de los inmuebles es de 1.345 acres. El ritmo al que una persona puede cortar el césped es el siguiente:

ŷ = 1350 - 1,2x donde x es el número de horas y ŷ representa el número de acres que quedan por cortarles el césped.

33.

¿Cuántos acres quedarán por cortarles el césped después de 20 horas de trabajo?

34.

¿Cuántos acres quedarán por cortarles el césped después de 100 horas de trabajo?

35.

¿Cuántas horas se necesitan para cortar todo el césped? (¿Cuándo es ŷ = 0?)

La Tabla 12.14 contiene datos reales de las dos primeras décadas de notificación de casos de gripe.

Año N.º casos de gripe diagnosticados N.º muertes por gripe
Antes de 1981 91 29
1981 319 121
1982 1.170 453
1983 3.076 1.482
1984 6.240 3.466
1985 11.776 6.878
1986 19.032 11.987
1987 28.564 16.162
1988 35.447 20.868
1989 42.674 27.591
1990 48.634 31.335
1991 59.660 36.560
1992 78.530 41.055
1993 78.834 44.730
1994 71.874 49.095
1995 68.505 49.456
1996 59.347 38.510
1997 47.149 20.736
1998 38.393 19.005
1999 25.174 18.454
2000 25.522 17.347
2001 25.643 17.402
2002 26.464 16.371
Total 802.118 489.093
Tabla 12.14 Solo adultos y adolescentes, Estados Unidos
36.

Grafique el "año" frente al "N.º de casos diagnosticados de gripe" (trace el diagrama de dispersión). No incluya datos anteriores a 1981.

37.

Realice una regresión lineal. ¿Cuál es la ecuación lineal? Redondee al número natural más cercano.

38.

Halle el coeficiente de correlación.

  1. r = ________
39.

Resuelva.

  1. Cuando x = 1985, ŷ = _____
  2. Cuando x = 1990, ŷ =_____
  3. Cuando x = 1970, ŷ =______ ¿Por qué no tiene sentido esta respuesta?
40.

¿Parece que la línea se ajusta a los datos? ¿Por qué sí o por qué no?

41.

¿Qué implica la correlación sobre la relación entre el tiempo (años) y el número de casos de gripe diagnosticados en EE. UU.?

42.

Trace los dos puntos dados en el siguiente gráfico. Luego, conecte los dos puntos para formar la línea de regresión.

Gráfico en blanco con ejes horizontales y verticales.
Figura 12.29

Obtenga el gráfico en su calculadora o en su computadora.

43.

Escriba la ecuación: ŷ=____________

44.

Dibuje a mano una curva suave en el gráfico que muestre el flujo de los datos.

45.

¿Parece que la línea se ajusta a los datos? ¿Por qué sí o por qué no?

46.

¿Cree que lo mejor es un ajuste lineal? ¿Por qué sí o por qué no?

47.

¿Qué implica la correlación sobre la relación entre el tiempo (años) y el número de casos de gripe diagnosticados en EE. UU.?

48.

Gráfico "año" frente a "N.º casos diagnosticados de gripe" No incluya los anteriores a 1981. Identifique ambos ejes con palabras. Escale ambos ejes.

49.

Introduzca los datos en su calculadora o en su computadora. Los datos anteriores a 1981 no deberían incluirse. ¿Por qué?

Escriba la ecuación lineal, redondeando a cuatro decimales:

50.

Halle el coeficiente de correlación.

  1. correlación = _____

12.6 Valores atípicos

Use la siguiente información para responder los próximos cuatro ejercicios. El diagrama de dispersión muestra la relación entre las horas dedicadas al estudio y los resultados de los exámenes. La línea que se muestra es la línea calculada de mejor ajuste. El coeficiente de correlación es de 0,69.

Figura 12.30
51.

¿Parece haber algún valor atípico?

52.

Se elimina un punto y se vuelve a calcular la línea de mejor ajuste. El nuevo coeficiente de correlación es de 0,98. ¿El punto luce como un valor atípico? ¿Por qué?

53.

¿Qué efecto tuvo el posible valor atípico en la línea de mejor ajuste?

54.

¿Confía más o menos en la capacidad de predicción de la nueva línea de mejor ajuste?

55.

La suma de errores al cuadrado para un conjunto de datos de 18 números es 49. ¿Cuál es la desviación típica?

56.

La desviación típica de la suma de errores al cuadrado de un conjunto de datos es de 9,8. ¿Cuál es el límite de la distancia vertical a la que puede estar un punto de la línea de mejor ajuste para considerarlo un valor atípico?

Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.