Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

8.3 Una proporción de la población

Introducción a la estadística8.3 Una proporción de la población

Durante un año electoral vemos artículos en el periódico que indican intervalos de confianza en términos de proporciones o porcentajes. Por ejemplo, un sondeo para un candidato determinado que se presenta a las elecciones presidenciales puede mostrar que el candidato tiene el 40 % de los votos con una diferencia de tres puntos porcentuales (si la muestra es lo suficientemente grande). A menudo, las encuestas electorales se calculan con un 95 % de confianza, por lo que los encuestadores tendrían un 95 % de confianza en que la verdadera proporción de votantes que favorecen al candidato estaría entre el 0,37 y el 0,43: (0,40 – 0,03, 0,40 + 0,03).

Los inversores en bolsa se interesan por la proporción real de acciones que suben y bajan cada semana. Las compañías que venden computadoras personales están interesadas en la proporción de hogares de Estados Unidos que tienen computadoras personales. Se pueden calcular intervalos de confianza para la proporción real de acciones que suben o bajan cada semana y para la proporción real de hogares en Estados Unidos que poseen computadoras personales.

El procedimiento para calcular el intervalo de confianza, el tamaño de la muestra, el límite de error y el nivel de confianza para una proporción es similar al de la media de la población, pero las fórmulas son diferentes.

¿Cómo sabe que está ante un problema de proporción? En primer lugar, la distribución subyacente es una distribución binomial. (No se menciona la media o el promedio). Si X es una variable aleatoria binomial, entonces X ~ B(n, p) donde n es el número de ensayos y p es la probabilidad de acierto Para formar una proporción, tome X, la variable aleatoria para el número de aciertos y divídala por n, el número de ensayos (o el tamaño de la muestra). La variable aleatoria P′ (lea "P primo") es esa proporción,

P = X n P = X n

(a veces, la variable aleatoria se denota como P ^ P ^ , que se lee “estimador de P”).

Cuando n es grande y p no se acerca a cero o a uno, podemos utilizar la distribución normal para aproximar la binomial.

X~N(np, npq ) X~N(np, npq )

Si dividimos la variable aleatoria, la media y la desviación típica por n, obtenemos una distribución normal de proporciones con P′, llamada proporción estimada, como variable aleatoria (recordemos que una proporción es el número de aciertos dividido por n).

X n = P N( np n , npq n ) X n = P N( np n , npq n )

Uso del álgebra para simplificar: npq n = pq n npq n = pq n

P′ sigue una distribución normal para las proporciones: X n = P N( np n , npq n ) X n = P N( np n , npq n )

El intervalo de confianza tiene la forma (p′ - EBP, p′ + EBP). EBP es el límite de error para la proporción.

p′ = x n x n

p′ = la proporción estimada de aciertos (p′ es una estimación puntual de p, la proporción verdadera).

x = el número de aciertos

n = el tamaño de la muestra

El límite de error para una proporción es

EBP=( z α 2 )( p q n ) EBP=( z α 2 )( p q n ) donde q′ = 1 - p′

Esta fórmula es similar a la fórmula del límite de error para una media, excepto que la "desviación típica apropiada" es diferente. Para una media, cuando se conoce la desviación típica de la población, la desviación típica adecuada que utilizamos es σ n σ n . Para una proporción, la desviación típica adecuada es p q n p q n .

Sin embargo, en la fórmula del límite de error, utilizamos p q n p q n como la desviación típica, en lugar de p q n p q n .

En la fórmula del límite de error, las proporciones muestrales p′ y q′ son estimaciones de las proporciones poblacionales desconocidas p y q. Se utilizan las proporciones estimadas p′ y q′ porque p y q no se conocen. Las proporciones muestrales p′ y q′ se calculan a partir de los datos: p′ es la proporción estimada de aciertos, y q′ es la proporción estimada de fallos.

El intervalo de confianza solo puede utilizarse si el número de aciertos np′ y el número de fallos nq′ son ambos superiores a cinco.

Nota

Para la distribución normal de proporciones, la fórmula de la puntuación z es la siguiente

Si P ~N( valor, pq n ) P ~N( valor, pq n ) entonces la fórmula de la puntuación z es z= p p pq n z= p p pq n

Ejemplo 8.10

Translation missing: es.problem

Supongamos que se contrata a una compañía de estudios de mercado para que estime el porcentaje de adultos que viven en una gran ciudad y que tienen teléfonos móviles. Se encuestan quinientos residentes adultos seleccionados al azar en esta ciudad para determinar si tienen teléfonos móviles. De las 500 personas encuestadas, 421 respondieron que sí: tienen teléfonos móviles. Utilizando un nivel de confianza del 95 %, calcule una estimación del intervalo de confianza para la verdadera proporción de residentes adultos de esta ciudad que tienen teléfonos móviles.

Inténtelo 8.10

Supongamos que se encuestan 250 personas seleccionadas al azar para determinar si tienen una tableta. De los 250 encuestados, 98 declararon que tienen una tableta. Utilizando un nivel de confianza del 95 %, calcule una estimación del intervalo de confianza para la verdadera proporción de personas que tienen tabletas.

Ejemplo 8.11

Translation missing: es.problem

Para un proyecto de clase, un estudiante de Ciencias Políticas de una gran universidad quiere calcular el porcentaje de estudiantes que están registrados como votantes. Hace una encuesta entre 500 estudiantes y descubre que 300 están registrados como votantes. Calcule un intervalo de confianza del 90 % para el verdadero porcentaje de estudiantes que están registrados como votantes, e interprete el intervalo de confianza.

Inténtelo 8.11

Un estudiante hace un sondeo en su escuela para ver si los estudiantes del distrito escolar están a favor o en contra de la nueva legislación relativa a los uniformes escolares. Hace una encuesta entre 600 estudiantes y halla que 480 están en contra de la nueva legislación.

a. Calcule un intervalo de confianza del 90 % para el verdadero porcentaje de estudiantes que están en contra de la nueva legislación e interprete el intervalo de confianza.

b. En una muestra de 300 estudiantes, el 68 % dijo que tenían un iPod y un teléfono inteligente. Calcule un intervalo de confianza del 97 % para el verdadero porcentaje de estudiantes que tienen un iPod y un teléfono inteligente.

Intervalo de confianza "más cuatro" para p

En el proceso de cálculo de un intervalo de confianza para una proporción se introduce una cierta cantidad de error. Dado que no conocemos la verdadera proporción de la población, nos vemos obligados a utilizar estimaciones puntuales para calcular la desviación típica adecuada de la distribución muestral. Los estudios han demostrado que la estimación resultante de la desviación típica puede ser errónea.

Afortunadamente, existe un sencillo ajuste que nos permite producir intervalos de confianza más precisos. Simplemente pretendemos que tenemos cuatro observaciones adicionales. Dos de estas observaciones son aciertos y dos son fallos. El nuevo tamaño de la muestra, entonces, es n + 4, y el nuevo recuento de aciertos es x + 2.

Los estudios informáticos han demostrado la eficacia de este método. Debe utilizarse cuando el nivel de confianza deseado es de al menos el 90 % y el tamaño de la muestra es de al menos diez.

Ejemplo 8.12

Translation missing: es.problem

Se preguntó a una muestra aleatoria de 25 estudiantes de estadística: "¿Ha fumado un cigarrillo en la última semana?" Seis estudiantes declararon haber fumado en la última semana. Utilice el método "más cuatro" para calcular un intervalo de confianza del 95 % para la verdadera proporción de estudiantes de estadística que fuman.

Inténtelo 8.12

De una muestra aleatoria de 65 estudiantes de primer año de la Universidad Estatal, 31 estudiantes han declarado una especialidad. Utilice el método "más cuatro" para calcular un intervalo de confianza del 96 % para la verdadera proporción de estudiantes de primer año de la Universidad Estatal que han declarado una especialidad.

Ejemplo 8.13

Translation missing: es.problem

El Berkman Center for Internet & Society de Harvard ha realizado recientemente un estudio en el que se analizan los hábitos de gestión de la privacidad de los usuarios adolescentes de internet. En un grupo de 50 adolescentes, 13 declararon tener más de 500 amigos en Facebook. Utilice el método del "más cuatro" para calcular un intervalo de confianza del 90 % para la verdadera proporción de adolescentes que declararían tener más de 500 amigos en Facebook.

Inténtelo 8.13

El estudio del Centro Berkman al que se hace referencia en el Ejemplo 8.13 habló con adolescentes en grupos de discusión más pequeños, pero también entrevistó a otros adolescentes por teléfono. Al finalizar el estudio, 588 adolescentes habían respondido a la pregunta sobre sus amigos de Facebook, y 159 dijeron que tenían más de 500 amigos. Utilice el método de "más cuatro" para hallar un intervalo de confianza del 90 % para la verdadera proporción de adolescentes que declararían tener más de 500 amigos en Facebook basándose en esta muestra más amplia. Compare los resultados con los del Ejemplo 8.13.

Cálculo del tamaño de la muestra n

Si los investigadores desean un margen de error específico, pueden utilizar la fórmula del límite de error para calcular el tamaño necesario de la muestra.

La fórmula del límite de error para una proporción de población es

  • EBP=( z α 2 )( p q n ) EBP=( z α 2 )( p q n )
  • Al resolver n se obtiene una ecuación para el tamaño de la muestra.
  • n= ( z α 2 ) 2 ( p q ) EB P 2 n= ( z α 2 ) 2 ( p q ) EB P 2

Ejemplo 8.14

Translation missing: es.problem

Supongamos que una compañía de telefonía móvil quiere determinar el porcentaje actual de clientes de más de 50 años que utilizan mensajería de texto en sus teléfonos móviles. ¿Cuántos clientes de más de 50 años debería encuestar la compañía para tener el 90 % de confianza en que la proporción estimada (de la muestra) se encuentra dentro de los tres puntos porcentuales de la verdadera proporción de la población de clientes de más de 50 años que utilizan la mensajería de texto en sus teléfonos móviles?

Inténtelo 8.14

Supongamos que una compañía de mercadeo en internet quiere determinar el porcentaje actual de clientes que hacen clic en los anuncios de sus teléfonos inteligentes. ¿A cuántos clientes debería encuestar la compañía para tener el 90 % de confianza en que la proporción estimada está dentro de los cinco puntos porcentuales de la verdadera proporción de clientes que hacen clic en los anuncios de sus teléfonos inteligentes?

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.