Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

8.1 La media de una población utilizando la distribución normal

Introducción a la estadística8.1 La media de una población utilizando la distribución normal

Un intervalo de confianza para una media poblacional con una desviación típica poblacional conocida se basa en la conclusión del teorema del límite central de que la distribución muestral de las medias muestrales sigue una distribución aproximadamente normal. Supongamos que nuestra muestra tiene una media de x ¯  = 10 x ¯  = 10 y hemos construido el intervalo de confianza del 90 % (5, 15) donde EBM = 5.

Cálculo del intervalo de confianza

Para construir un intervalo de confianza para una única media poblacional desconocida μ, cuando se conoce la desviación típica de la población, necesitamos x ¯ x ¯ como una estimación de μ y necesitamos el margen de error. Aquí, el margen de error (EBM) se denomina límite de error para una media poblacional (abreviado EBM). La media muestral x ¯ x ¯ es la estimación puntual de la media poblacional desconocida μ.

La estimación del intervalo de confianza tendrá la forma:

(estimación puntual – límite de error, estimación puntual + límite de error) o, en símbolos, ( x ¯ EBM, x ¯ +EBM x ¯ EBM, x ¯ +EBM )

El margen de error (EBM) depende del nivel de confianza (Confidence Level, CL). El nivel de confianza suele considerarse la probabilidad de que la estimación del intervalo de confianza calculado contenga el verdadero parámetro poblacional. Sin embargo, es más preciso afirmar que el nivel de confianza es el porcentaje de intervalos de confianza que contienen el verdadero parámetro de la población cuando se toman muestras repetidas. La mayoría de las veces, la persona que construye el intervalo de confianza elige un nivel de confianza del 90 % o superior porque quiere estar razonablemente segura de sus conclusiones.

Existe otra probabilidad llamada alfa (α). α está relacionada con el nivel de confianza, CL. α es la probabilidad de que el intervalo no contenga el parámetro poblacional desconocido.
Matemáticamente, α + CL = 1.

Ejemplo 8.1

  • Supongamos que hemos recogido datos de una muestra. Conocemos la media de la muestra, pero no conocemos la media de toda la población.
  • La media de la muestra es 7 y el límite de error de la media es 2,5.

x ¯ x ¯ = 7 y EBM = 2,5

El intervalo de confianza es (7 - 2,5; 7 + 2,5), y el cálculo de los valores da (4,5; 9,5).

Si el nivel de confianza (CL) es del 95 %, entonces decimos que "estimamos con un 95 % de confianza que el verdadero valor de la media poblacional está entre 4,5 y 9,5".

Inténtelo 8.1

Supongamos que tenemos datos de una muestra. La media de la muestra es 15, y el límite de error para la media es 3,2.

¿Cuál es la estimación del intervalo de confianza para la media de la población?

Un intervalo de confianza para una media poblacional con una desviación típica conocida se basa en el hecho de que las medias muestrales siguen una distribución aproximadamente normal. Supongamos que nuestra muestra tiene una media de x ¯ x ¯ = 10, y hemos construido el intervalo de confianza del 90 % (5, 15) donde EBM = 5.

Para obtener un intervalo de confianza del 90 %, debemos incluir el 90 % central de la probabilidad de la distribución normal. Si incluimos el 90 % central, dejamos fuera un total de α = 10 % en ambas colas, o 5 % en cada cola, de la distribución normal.

Se trata de una curva de distribución normal. El pico de la curva coincide con el punto 10 del eje horizontal. Los puntos 5 y 15 están marcados en el eje. Se trazan líneas verticales desde estos puntos hasta la curva y se sombrea la región entre las líneas. La región sombreada tiene un área igual a 0,90.
Figura 8.2

Para captar el 90 % central, debemos salir 1,645 "desviaciones típicas" a cada lado de la media muestral calculada. El valor 1,645 es la puntuación z de una distribución de probabilidad normal estándar que sitúa un área de 0,90 en el centro, un área de 0,05 en la cola extrema izquierda y un área de 0,05 en la cola extrema derecha.

Es importante que la "desviación típica" utilizada sea la adecuada para el parámetro que estamos estimando, por lo que en este apartado debemos utilizar la desviación típica que se aplica a las medias muestrales, que es σ n σ n . La fracción σ n σ n , se denomina comúnmente "error estándar de la media" para distinguir claramente desviación típica de una media de la desviación típica de la población σ.

En resumen, como resultado del teorema del límite central:
  • X ¯ X ¯ se distribuye normalmente, es decir, X ¯ X ¯ ~ N ( μ X , σ n ) ( μ X , σ n ) .
  • Cuando se conoce la desviación típica de la población σ, utilizamos una distribución normal para calcular el límite de error.

Cálculo del intervalo de confianza

Para construir una estimación de intervalo de confianza para una media poblacional desconocida necesitamos datos de una muestra aleatoria. Los pasos para construir e interpretar el intervalo de confianza son:

  • Calcular la media muestral x ¯ x ¯ de los datos de la muestra. Recuerde que en esta sección ya conocemos la desviación típica de la población σ.
  • Calcule la puntuación z que corresponde al nivel de confianza.
  • Calcular el límite de error EBM.
  • Construir el intervalo de confianza.
  • Escriba una oración que interprete la estimación en el contexto de la situación del problema. (Explique lo que significa el intervalo de confianza, en las palabras del problema).

Primero examinaremos cada paso con más detalle y luego ilustraremos el proceso con algunos ejemplos.

Calcular la puntuación z para el nivel de confianza declarado

Cuando conocemos la desviación típica de la población σ, utilizamos una distribución normal estándar para calcular el EBM y construir el intervalo de confianza. Necesitamos hallar el valor de z que pone un área igual al nivel de confianza (en forma decimal) en el centro de la distribución normal estándar Z ~ N(0, 1).

El nivel de confianza, CL, es el área en el medio de la distribución normal estándar. CL = 1 – α, por lo que α es el área que se divide por igual entre las dos colas. Cada una de las colas contiene un área igual a α 2 α 2 .

La puntuación z que tiene un área a la derecha de α 2 α 2 se denota por z α 2 z α 2 .

Por ejemplo, cuando CL = 0,95, α = 0,05 y α 2 α 2 = 0,025; escribimos z α 2 z α 2 = z0,025.

El área a la derecha de z0,025 es 0,025 y el área a la izquierda de z0,025 es 1 – 0,025 = 0,975.

z α 2  =  z 0,025  = 10,96 z α 2  =  z 0,025  = 10,96 , utilizando una calculadora, una computadora o una tabla de probabilidad normal estándar.

Uso de las calculadoras TI-83, 83+, 84, 84+

invNorm(0,975, 0, 1) = 1,96

Nota

Recuerde utilizar el área a la IZQUIERDA de z α 2 z α 2 ; en este capítulo las dos últimas entradas en el comando invNorm son 0, 1, porque se está utilizando una distribución normal estándar Z ~ N(0, 1).

Cálculo del límite de error (EBM)

La fórmula del límite de error para una media poblacional desconocida μ cuando se conoce la desviación típica poblacional σ es

  • EBM = ( z α 2 )( σ n ) ( z α 2 )( σ n )

Construcción del intervalo de confianza

  • La estimación del intervalo de confianza tiene el formato ( x ¯ EBM, x ¯ +EBM) ( x ¯ EBM, x ¯ +EBM) .

El gráfico da una idea de toda la situación.

CL + α 2 α 2 + α 2 α 2 = CL + α = 1.

Se trata de una curva de distribución normal. El pico de la curva coincide con el punto barra de x en el eje horizontal. Los puntos barra de x – EBM y barra de x + EBM están marcados en el eje. Se trazan líneas verticales desde estos puntos hasta la curva y se sombrea la región entre las líneas. La región sombreada tiene un área igual a 1 – a y representa el nivel de confianza. Cada cola sin sombrear tiene un área a/2.
Figura 8.3

Redacción de la interpretación

La interpretación debe indicar claramente el nivel de confianza (CL), explicar qué parámetro de la población se está estimando (en este caso, una media de la población), e indicar el intervalo de confianza (ambos puntos finales). "Estimamos con un ___% de confianza que la verdadera media de la población (incluya el contexto del problema) está entre ___ y ___ (incluya las unidades adecuadas)".

Ejemplo 8.2

Supongamos que las puntuaciones de los exámenes de estadística se distribuyen normalmente con una media poblacional desconocida y una desviación típica de la población de tres puntos. Se toma una muestra aleatoria de 36 puntuaciones y se obtiene una media muestral (puntuación media de la muestra) de 68. Calcule una estimación del intervalo de confianza para la calificación media del examen de la población (la calificación media de todos los exámenes).

Translation missing: es.problem

Calcule un intervalo de confianza del 90 % para la media real (poblacional) de las calificaciones de los exámenes de Estadística.

Inténtelo 8.2

Supongamos que los tiempos promedio de entrega de las pizzas se distribuyen normalmente con una media poblacional desconocida y una desviación típica desviación típica de la población de seis minutos. Se toma una muestra aleatoria de 28 pizzerías y se obtiene una media de tiempo de entrega de 36 minutos.

Calcule una estimación del intervalo de confianza del 90 % para el tiempo medio de entrega de la población.

Ejemplo 8.3

La tasa de absorción específica (Specific Absorption Rate, SAR) de un teléfono móvil mide la cantidad de energía de radiofrecuencia (Radio Frequency, RF) que absorbe el cuerpo del usuario cuando utiliza el teléfono. Todos los teléfonos móviles emiten energía de radiofrecuencia. Los diferentes modelos de teléfono tienen diferentes medidas de SAR. Para recibir la certificación de la Comisión Federal de Comunicaciones (Federal Communications Commission, FCC) para su venta en los Estados Unidos, el nivel de SAR de un teléfono móvil no debe ser superior a 1,6 vatios por kilogramo. La Tabla 8.1 muestra el nivel SAR más alto de una selección aleatoria de modelos de teléfonos móviles según las mediciones de la FCC.

Modelo de teléfono SAR Modelo de teléfono SAR Modelo de teléfono SAR
iPhone 4S de Apple 1,11 LG Ally 1,36 Pantech Laser 0,74
BlackBerry Pearl 8120 1,48 LG AX275 1,34 Samsung Character 0,5
BlackBerry Tour 9630 1,43 LG Cosmos 1,18 Samsung Epic 4G Touch 0,4
Cricket TXTM8 1.3 LG CU515 1.3 Samsung M240 0,867
HP/Palm Centro 1,09 LG Trax CU575 1,26 Samsung Messager III SCH-R750 0,68
HTC One V 0,455 Motorola Q9h 1,29 Samsung Nexus S 0,51
HTC Touch Pro 2 1,41 Motorola Razr2 V8 0,36 Samsung SGH-A227 1,13
Huawei M835 Ideos 0,82 Motorola Razr2 V9 0,52 SGH-a107 GoPhone 0,3
Kyocera DuraPlus 0,78 Motorola V195s 1,6 Sony W350a 1,48
Kyocera K127 Marbl 1,25 Nokia 1680 1,39 T-Mobile Concord 1,38
Tabla 8.1

Translation missing: es.problem

Calcule un intervalo de confianza del 98 % para la media verdadera (de la población) de las tasas de absorción específica (SAR) de los teléfonos celulares. Supongamos que la desviación típica de la población es σ = 0,337.

Inténtelo 8.3

La Tabla 8.2 muestra un muestreo aleatorio de 20 modelos de teléfonos móviles. Utilice estos datos para calcular un intervalo de confianza del 93 % para la verdadera media de SAR de los teléfonos móviles certificados para su uso en Estados Unidos. Como en el caso anterior, supongamos que la desviación típica de la población es σ = 0,337.

Modelo de teléfono SAR Modelo de teléfono SAR
Blackberry Pearl 8120 1,48 Nokia E71x 1,53
HTC Evo Design 4G 0,8 Nokia N75 0,68
HTC Freestyle 1,15 Nokia N79 1,4
LG Ally 1,36 Sagem Puma 1,24
LG Fathom 0,77 Samsung Fascinate 0,57
LG Optimus Vu 0,462 Samsung Infuse 4G 0,2
Motorola Cliq XT 1,36 Samsung Nexus S 0,51
Motorola Droid Pro 1,39 Samsung Replenish 0,3
Motorola Droid Razr M 1.3 Sony W518a Walkman 0,73
Nokia 7705 Twist 0,7 ZTE C79 0,869
Tabla 8.2

Observe la diferencia en los intervalos de confianza calculados en el Ejemplo 8.3 y en el siguiente Ejercicio. Estos intervalos son diferentes por varias razones: se calcularon a partir de muestras diferentes, las muestras eran de distinto tamaño y los intervalos se calcularon para distintos niveles de confianza. Aunque los intervalos son diferentes, no aportan información contradictoria. Los efectos de este tipo de cambios son el tema de la siguiente sección de este capítulo.

Modificación del nivel de confianza o del tamaño de la muestra

Ejemplo 8.4

Translation missing: es.problem

Supongamos que cambiamos el problema original en el Ejemplo 8.2 utilizando un nivel de confianza del 95 %. Calcule un intervalo de confianza del 95 % para la calificación media real (poblacional) del examen estadístico.

Estimamos con un 95 % de confianza que la verdadera media poblacional de todas las puntuaciones de los exámenes de estadística está entre 67,02 y 68,98.

Explicación del nivel de confianza del 95 %: El 95 % de todos los intervalos de confianza construidos de este modo contienen el verdadero valor de la puntuación media del examen estadístico de la población.

Comparar los resultados: El intervalo de confianza del 90 % es (67,18; 68,82). El intervalo de confianza del 95 % es (67,02; 68,98). El intervalo de confianza del 95 % es más amplio. Si observa los gráficos, como el área 0,95 es mayor que el área 0,90, tiene sentido que el intervalo de confianza del 95 % sea más amplio. Para estar más seguro de que el intervalo de confianza contiene realmente el verdadero valor de la media de la población para todas las calificaciones de los exámenes de estadística, el intervalo de confianza tiene que ser necesariamente más amplio.

La parte (a) muestra una curva de distribución normal. Una región central con un área igual a 0,90 está sombreada. Cada cola no sombreada de la curva tiene un área igual a 0,05. La parte (b) muestra una curva de distribución normal. Una región central con un área igual a 0,95 está sombreada. Cada cola no sombreada de la curva tiene un área igual a 0,025.
Figura 8.5

Resumen: efecto de la modificación del nivel de confianza

  • Al aumentar el nivel de confianza se incrementa el límite de error, lo que hace que el intervalo de confianza sea más amplio.
  • La disminución del nivel de confianza reduce el límite de error, lo que hace que el intervalo de confianza sea más estrecho.

Inténtelo 8.4

Vuelva a consultar el Ejercicio de entrega de pizzas. La desviación típica de la población es de seis minutos y la media de la muestra del tiempo de entrega es de 36 minutos. Utilice un tamaño de muestra de 20. Calcule una estimación del intervalo de confianza del 95 % para la media real del tiempo de entrega de la pizza.

Ejemplo 8.5

Supongamos que cambiamos el problema original en el Ejemplo 8.2 para ver qué ocurre con el límite de error si se cambia el tamaño de la muestra.

Translation missing: es.problem

Deje todo igual excepto el tamaño de la muestra. Utilice el nivel de confianza original del 90 %. ¿Qué ocurre con el límite de error y el intervalo de confianza si aumentamos el tamaño de la muestra y utilizamos n = 100 en lugar de n = 36? ¿Qué ocurre si disminuimos el tamaño de la muestra a n = 25 en vez de n = 36?

  • x ¯ x ¯ = 68
  • EBM = ( z α 2 )( σ n ) ( z α 2 )( σ n )
  • σ = 3; el nivel de confianza es del 90 % (CL=0,90); z α 2 z α 2 = z0,05 = 1,645.

Resumen: efecto de la modificación del tamaño de la muestra

  • El aumento del tamaño de la muestra hace que el límite de error disminuya, haciendo que el intervalo de confianza sea más estrecho.
  • La disminución del tamaño de la muestra hace que el límite de error aumente, haciendo que el intervalo de confianza sea más amplio.

Inténtelo 8.5

Vuelva a consultar el Ejercicio de entrega de pizzas. La media de tiempo de entrega es de 36 minutos y la desviación típica de la población es de seis minutos. Supongamos que el tamaño de la muestra se cambia a 50 restaurantes con la misma media muestral. Calcule una estimación del intervalo de confianza del 90 % para el tiempo medio de entrega de la población.

Hacer el cálculo a la inversa para calcular el límite de error o la media de la muestra

Cuando calculamos un intervalo de confianza, encontramos la media de la muestra, calculamos el límite de error y lo utilizamos para calcular el intervalo de confianza. Sin embargo, a veces, cuando leemos estudios estadísticos, el estudio puede indicar solo el intervalo de confianza. Si conocemos el intervalo de confianza, podemos hacer el cálculo a la inversa para hallar tanto el límite de error como la media de la muestra.

Calcular el límite de error
  • Del valor superior del intervalo, reste la media de la muestra.
  • O, del valor superior del intervalo, reste el valor inferior. A continuación, divida la diferencia entre dos.
Calcular la media de la muestra
  • Reste el límite de error del valor superior del intervalo de confianza.
  • O, promedie los puntos finales superior e inferior del intervalo de confianza.

Observe que hay dos métodos para realizar cada cálculo. Puede elegir el método que sea más fácil de utilizar con la información que conoce.

Ejemplo 8.6

Supongamos que sabemos que un intervalo de confianza es (67,18; 68,82) y queremos calcular el límite de error. Puede que sepamos que la media de la muestra es 68, o puede que nuestra fuente solo haya dado el intervalo de confianza y no nos haya dicho el valor de la media de la muestra.

Calcule el límite de error:

  • Si sabemos que la media de la muestra es de 68 EBM = 68,82 - 68 = 0,82.
  • Si no conocemos la media de la muestra: EBM = (68,8267,18) 2 (68,8267,18) 2 = 0,82.

Calcule la media de la muestra:

  • Si conocemos el límite de error: x ¯ x ¯ = 68,82 – 0,82 = 68
  • Si no conocemos el límite de error: x ¯ x ¯ = (67,18+68,82) 2 (67,18+68,82) 2 = 68.

Inténtelo 8.6

Supongamos que sabemos que un intervalo de confianza es (42,12; 47,88). Encuentra el límite de error y la media muestral.

Cálculo del tamaño de la muestra n

Si los investigadores desean un margen de error específico, pueden utilizar la fórmula del límite de error para calcular el tamaño necesario de la muestra.

La fórmula del límite de error para una media poblacional cuando se conoce la desviación típica de la población es
EBM = ( z α 2 )( σ n ) ( z α 2 )( σ n ) .

La fórmula del tamaño de la muestra es n = z 2 σ 2 EB M 2 z 2 σ 2 EB M 2 , que se encuentra resolviendo la fórmula del límite de error para n.

En esta fórmula, z es z α 2 z α 2 , correspondiente al nivel de confianza deseado. Un investigador que planifique un estudio y desee un nivel de confianza y un límite de error específicos puede utilizar esta fórmula para calcular el tamaño de la muestra necesaria para el estudio.

Ejemplo 8.7

La desviación típica de la población para la edad de los estudiantes de Foothill College es de 15 años. Si queremos tener un 95 % de confianza en que la media de edad de la muestra está dentro de los dos años de la verdadera media de edad de la población de estudiantes de Foothill College, ¿cuántos estudiantes de Foothill College seleccionados al azar deben encuestarse?

  • Por el problema, sabemos que σ = 15 y EBM = 2.
  • z = z0,025 = 1,96, porque el nivel de confianza es del 95 %.
  • n = z 2 σ 2 EB M 2 z 2 σ 2 EB M 2 = ( 1,96 ) 2 ( 15 ) 2 2 2 ( 1,96 ) 2 ( 15 ) 2 2 2 = 216,09 utilizando la ecuación del tamaño de la muestra.
  • Utilice n = 217: Redondee siempre la respuesta al número entero superior para asegurarse de que el tamaño de la muestra es lo suficientemente grande.

Por lo tanto, habría que encuestar a 217 estudiantes de Foothill College para estar seguros en un 95 % de que estamos dentro de los dos años de la verdadera edad media de la población de estudiantes del Foothill College.

Inténtelo 8.7

La desviación típica de la población para la altura de los jugadores de baloncesto de la escuela secundaria es de tres pulgadas. Si queremos tener un 95 % de confianza en que la estatura media de la muestra está dentro de una pulgada de la estatura media real de la población, ¿cuántos estudiantes seleccionados al azar deben ser encuestados?

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.