1.1 Definiciones de estadística, probabilidad y términos clave
Para cada uno de los ocho ejercicios siguientes, identifique: a. la población, b. la muestra, c. el parámetro, d. el estadístico, e. la variable y f. los datos. Dé ejemplos cuando sea necesario.
Un centro de acondicionamiento físico está interesado en la cantidad media de tiempo que un cliente hace ejercicio en el centro cada semana.
Las estaciones de esquí se interesan por la edad media a la que los niños toman sus primeras clases de esquí y snowboard. Necesitan esta información para planificar sus clases de esquí de forma óptima.
Una cardióloga está interesada en el periodo medio de recuperación de sus pacientes que han sufrido infartos.
Las compañías de seguros se interesan por los costos sanitarios medios anuales de sus clientes para poder determinar los costos del seguro de enfermedad.
A un político le interesa la proporción de votantes de su distrito que piensan que está haciendo un buen trabajo.
Una consejera matrimonial está interesada en la proporción de clientes a los que asesora que siguen casados.
Los encuestadores políticos pueden estar interesados en la proporción de personas que votarán por una causa particular.
Una compañía de mercadeo está interesada en la proporción de personas que comprarán un determinado producto.
Use la siguiente información para responder los tres próximos ejercicios: Una instructora del Lake Tahoe Community College está interesado en el número medio de días que los estudiantes de Matemáticas del Lake Tahoe Community College se ausentan de clase durante un trimestre.
¿Cuál es la población que le interesa?
- todos los estudiantes del Lake Tahoe Community College
- todos los estudiantes de Inglés del Lake Tahoe Community College
- todos los estudiantes del Lake Tahoe Community College en sus clases
- todos los estudiantes de Matemáticas del Lake Tahoe Community College
Considere lo siguiente:
= número de días de ausencia de un estudiante de Matemáticas del Lake Tahoe Community College
En este caso, X es un ejemplo de a:
- variable.
- población.
- estadístico.
- datos.
La muestra de la instructora arroja una media de días de ausencia de 3,5 días. Este valor es un ejemplo de:
- parámetro.
- datos.
- estadístico.
- variable.
1.2 Datos, muestreo y variación de datos y muestreo
En los siguientes ejercicios identifique el tipo de datos que se utilizaría para describir una respuesta (cuantitativa discreta, cuantitativa continua o cualitativa) y dé un ejemplo de los datos.
porcentaje de grasa corporal
tiempo en la fila para comprar alimentos
programa de televisión más visto
distancia a la sala de cine más cercana
número de paquetes de software de hojas de cálculo de la competencia
Use la siguiente información para responder los dos próximos ejercicios: Se realizó un estudio para determinar la edad de los residentes que utilizan un parque local en San José y el número de veces por semana que van y la duración (cantidad de tiempo). Se seleccionó al azar la primera casa del vecindario que rodea el parque y luego se entrevistó a una de cada 8.ª casa del vecindario que rodea el parque.
“Número de veces por semana”, ¿qué tipo de datos son?
- cualitativo (categórico)
- cuantitativo discreto
- cuantitativo continuo
La “duración (cantidad de tiempo)”, ¿qué tipo de dato es?
- cualitativo (categórico)
- cuantitativo discreto
- cuantitativo continuo
Las compañías aéreas están interesadas en la coherencia del número de bebés en cada vuelo para tener un equipo de seguridad adecuado. Supongamos que una compañía aérea realiza una encuesta. Durante el fin de semana de Acción de Gracias realiza una encuesta en seis vuelos de Boston a Salt Lake City para determinar el número de bebés que hay en los vuelos. Esto determina la cantidad de equipos de seguridad necesarios según el resultado de ese estudio.
- Use oraciones completas y enumere tres cosas que no funcionan en la forma en que se realizó la encuesta.
- Use oraciones completas y enumere tres formas en las que mejoraría la encuesta si se repitiera.
Suponga que quiere determinar el número medio de estudiantes por clase de Estadística en su estado. Describa un posible método de muestreo en tres o cinco oraciones completas. Haga una descripción detallada.
Suponga que quiere determinar el número medio de latas de gaseosas que beben cada mes los estudiantes de veinte años de su escuela. Describa un posible método de muestreo en tres o cinco oraciones completas. Haga una descripción detallada.
Enumere algunas dificultades prácticas para obtener resultados precisos de una encuesta telefónica.
Enumere algunas dificultades prácticas para obtener resultados precisos de una encuesta por correo.
Con sus compañeros de clase haga una lluvia de ideas sobre cómo podría superar estos problemas si tuviera que realizar una encuesta telefónica o por correo.
La instructora toma su muestra recopilando datos de cinco estudiantes seleccionados al azar de cada clase de Matemáticas del colegio comunitario Lake Tahoe. El tipo de muestreo que utilizó es
- muestreo por conglomerados
- muestreo estratificado
- muestreo aleatorio simple
- muestreo de conveniencia
Se realizó un estudio para determinar la edad de los residentes que utilizan un parque local en San José y el número de veces por semana que van y la duración (cantidad de tiempo). Se seleccionó al azar la primera casa del vecindario que rodea el parque y luego se entrevistó a una de cada ocho casas del vecindario que rodea el parque. El método de muestreo fue:
- simple aleatorio
- sistemático
- estratificado
- conglomerado
Nombre el método de muestreo utilizado en cada una de las siguientes situaciones:
- Una mujer en el aeropuerto está repartiendo cuestionarios a los viajeros pidiéndoles que evalúen el servicio del aeropuerto. No les pregunta a los viajeros que se apresuran a pasar por el aeropuerto con las manos llenas de equipaje, sino a todos los que están sentados cerca de las puertas de embarque y no toman una siesta mientras esperan.
- Una maestra quiere saber si sus estudiantes están haciendo sus tareas para la casa, así que selecciona al azar las filas dos y cinco y luego llama a todos los estudiantes de la fila dos y a todos los de la fila cinco para que presenten a la clase las soluciones de los problemas de las tareas para la casa.
- El gerente de mercadeo de una cadena de tiendas de electrónica quiere información sobre la edad de sus clientes. Durante las dos semanas siguientes, en cada establecimiento, se les entregan cuestionarios a 100 clientes seleccionados al azar para que los rellenen; se les pide información sobre la edad, así como sobre otras variables de interés.
- La bibliotecaria de una biblioteca pública quiere determinar qué proporción de sus usuarios son niños. La bibliotecaria tiene una hoja de registro en la que marca si los libros se prestan a adultos o a niños. Registra estos datos para uno de cada cuatro clientes que pide libros prestados.
- Un partido político quiere conocer la reacción de los votantes ante un debate entre los candidatos. El día después del debate, el personal de sondeos del partido llama a 1.200 números de teléfono seleccionados al azar. Si un votante registrado contesta el teléfono o está disponible para tomar la llamada, se le pregunta por quién piensa votar y si el debate ha cambiado su opinión sobre los candidatos.
Se realizó una “encuesta aleatoria” a 3.274 personas de la “generación del microprocesador” (personas nacidas a partir de 1971, año en que se inventó el microprocesador). Se informó que el 48 % de los encuestados declararon que, si tuvieran 2.000 dólares para gastar, los utilizarían para equipos de computación. Además, el 66 % de los encuestados se consideran usuarios relativamente expertos en usar una computadora.
- ¿Considera que el tamaño de la muestra es suficiente para un estudio de este tipo? ¿Por qué sí o por qué no?
- Basándose en su “intuición”, ¿cree que los porcentajes reflejan con exactitud la población estadounidense de las personas que nacieron desde 1971? Si no es así, ¿cree que los porcentajes de la población son realmente mayores o menores que las estadísticas de la muestra? ¿Por qué?
Información adicional: la encuesta, realizada por Intel Corporation, la contestaron personas que visitaron el Centro de Convenciones de Los Ángeles para ver la presentación itinerante del Smithsonian Institute llamada “America’s Smithsonian”. - Con esta información adicional, ¿cree que todos los grupos demográficos y étnicos estuvieron representados por igual en el evento? ¿Por qué sí o por qué no?
- Con la información adicional, comente con qué precisión cree que las estadísticas de la muestra reflejan los parámetros de la población.
El Índice de Bienestar es una encuesta que sigue periódicamente las tendencias de los residentes en EE. UU. La encuesta abarca seis áreas de salud y bienestar: evaluación de la vida, salud emocional, salud física, comportamiento saludable, ambiente laboral y acceso básico. A continuación se enumeran algunas de las preguntas utilizadas para medir el Índice.
Identifique el tipo de datos obtenidos de cada pregunta utilizada en esta encuesta: cualitativos (categóricos), cuantitativos distintos o cuantitativos continuos.
- ¿Tiene algún problema de salud que le impida hacer alguna de las cosas que la gente de su edad puede hacer normalmente?
- Durante los 30 días pasados, ¿cuántos días no pudo hacer sus actividades habituales debido a condiciones de salud deficientes?
- Durante los siete días pasados, ¿cuántos días hizo ejercicio por 30 minutos o más?
- ¿Tiene seguro médico?
Antes de las elecciones presidenciales de 1936, una revista titulada Literary Digest publicó los resultados de un sondeo de opinión que predecía que el candidato republicano Alf Landon ganaría por un amplio margen. La revista envió tarjetas postales a unos 10.000.000 de posibles votantes. Estos posibles votantes se seleccionaron de la lista de suscriptores de la revista y de listas de registro de automóviles, telefónicas y de socios de clubes. Aproximadamente 2.300.000 personas enviaron sus respuestas.
- Piense en la situación de Estados Unidos en 1936. Explique por qué una muestra elegida a partir de listas de suscripción a revistas, de registro de automóviles, de directorios telefónicos y de socios de clubes no era representativa de la población de Estados Unidos en aquella época.
- ¿Qué efecto tiene la baja tasa de respuesta en la fiabilidad de la muestra?
- ¿Estos problemas son ejemplos de error de muestreo o de error ajeno al muestreo?
- Ese mismo año, George Gallup realizó su propio sondeo entre 30.000 posibles votantes. Estos investigadores utilizaron un método que denominaron “muestreo por cuotas” para obtener respuestas a la encuesta de subconjuntos específicos de la población. ¿El muestreo por cuotas es ejemplo de cuál método de muestreo de los que se describen en este módulo?
Las estadísticas demográficas y relacionadas con la delincuencia de 47 estados de EE. UU. en 1960 se recopilaron de organismos gubernamentales, incluido el Informe Uniforme sobre Delincuencia del FBI. Un análisis de estos datos halló una fuerte conexión entre educación y delincuencia e indicó que los niveles más altos de educación en una comunidad se corresponden con índices de delincuencia más altos.
¿Cuál de los posibles problemas con las muestras que se comentan en la 1.2 Datos, muestreo y variación de datos y muestreo podría explicar esta conexión?
YouPolls es un sitio web que permite a cualquiera crear y responder a sondeos. Una pregunta publicada el 15 de abril plantea:
“¿Se siente complacido pagando sus impuestos cuando a miembros de la administración Obama se les permite ignorar sus obligaciones fiscales?” 3.
Hasta el 25 de abril, 11 personas respondieron esta pregunta. Todos los participantes respondieron: “¡NO!”.
¿Cuál de los posibles problemas analizados con las muestras en este módulo podría explicar esta conexión?
Un artículo académico sobre tasas de respuesta comienza con la siguiente cita:
"El descenso de las tasas de contacto y cooperación en las encuestas telefónicas nacionales de marcación aleatoria (Random Digit Dial, RDD) plantea serias dudas sobre la validez de las estimaciones extraídas de dichas investigaciones" 4
El Pew Research Center for People and the Press admite:
“El porcentaje de personas que entrevistamos —de todas las que intentamos entrevistar— ha ido disminuyendo durante la década pasada o más” 5.
- ¿Cuáles son algunos de los motivos de la disminución del índice de respuesta durante la década pasada?
- Explique por qué los investigadores están preocupados por el efecto de la disminución del índice de respuesta en los sondeos de opinión pública.
1.3 Niveles de medición
Se les preguntó a cincuenta estudiantes a tiempo parcial cuántos cursos estaban tomando este trimestre. Los resultados (incompletos) se muestran a continuación:
Número de cursos | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
1 | 30 | 0,6 | |
2 | 15 | ||
3 |
- Llene los espacios en blanco en la Tabla 1.13.
- ¿Qué porcentaje de estudiantes toman exactamente dos cursos?
- ¿Qué porcentaje de estudiantes toman uno o dos cursos?
Antes de emitir el diagnóstico se les preguntó a sesenta adultos con enfermedades de las encías el número de veces por semana que utilizaban el hilo dental. Los resultados (incompletos) se muestran en la Tabla 1.14.
N.º de usos del hilo dental a la semana | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
0 | 27 | 0,4500 | |
1 | 18 | ||
3 | 0,9333 | ||
6 | 3 | 0,0500 | |
7 | 1 | 0,0167 |
- Llene los espacios en blanco en la Tabla 1.14.
- ¿Qué porcentaje de adultos utiliza el hilo dental seis veces por semana?
- ¿Qué porcentaje utiliza el hilo dental como máximo tres veces por semana?
Se les preguntó a diecinueve inmigrantes en EE. UU. cuántos años, con una aproximación de un año, han vivido en EE. UU. Los datos son los siguientes: 2; 5; 7; 2; 2; 10; 20; 15; 0; 7; 0; 20; 5; 12; 15; 12; 4; 5; 10 .
Se produjo la Tabla 1.15.
Datos | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
0 | 2 | 0,1053 | |
2 | 3 | 0,2632 | |
4 | 1 | 0,3158 | |
5 | 3 | 0,4737 | |
7 | 2 | 0,5789 | |
10 | 2 | 0,6842 | |
12 | 2 | 0,7895 | |
15 | 1 | 0,8421 | |
20 | 1 | 1,0000 |
- Corrija los errores en la Tabla 1.15. Además, explique cómo alguien podría haber llegado a los números incorrectos.
- Explique qué está errado en esta afirmación: “El 47 % de los encuestados lleva 5 años viviendo en EE. UU.”.
- Corrija el enunciado en b para que sea correcto.
- ¿Qué fracción de las personas encuestadas ha vivido en EE. UU. cinco o siete años?
- ¿Qué fracción de las personas encuestadas ha vivido como máximo 12 años en EE. UU.?
- ¿Qué fracción de las personas encuestadas ha vivido en EE. UU. menos de 12 años?
- ¿Qué fracción de las personas encuestadas ha vivido en EE. UU. de cinco a 20 años, ambos inclusive?
¿Cuánto tiempo se tarda en ir al trabajo? La Tabla 1.16 muestra el tiempo medio de desplazamiento por estado para los trabajadores de, al menos, 16 años que no trabajan en casa. Calcule el tiempo medio de traslado, y redondee la respuesta correctamente.
24,0 | 24,3 | 25,9 | 18,9 | 27,5 | 17,9 | 21,8 | 20,9 | 16,7 | 27,3 |
18,2 | 24,7 | 20,0 | 22,6 | 23,9 | 18,0 | 31,4 | 22,3 | 24,0 | 25,5 |
24,7 | 24,6 | 28,1 | 24,9 | 22,6 | 23,6 | 23,4 | 25,7 | 24,8 | 25,5 |
21,2 | 25,7 | 23,1 | 23,0 | 23,9 | 26,0 | 16,3 | 23,1 | 21,4 | 21,5 |
27,0 | 27,0 | 18,6 | 31,7 | 23,3 | 30,1 | 22,9 | 23,3 | 21,7 | 18,6 |
La revista Forbes publicó datos sobre las mejores pequeñas compañías en 2012. Se trata de compañías que cotizan en la bolsa desde hace al menos un año, con un precio de las acciones de al menos 5 dólares por acción y con unos ingresos anuales entre 5 millones de dólares y 1 mil millones de dólares. La Tabla 1.17 muestra la edad de los directores generales de las primeras 60 compañías clasificadas.
Edad | Frecuencia | Frecuencia relativa | Frecuencia relativa acumulada |
---|---|---|---|
40-44 | 3 | ||
45-49 | 11 | ||
50-54 | 13 | ||
55-59 | 16 | ||
60-64 | 10 | ||
65-69 | 6 | ||
70-74 | 1 |
- ¿Cuál es la frecuencia para los directores generales entre 54 y 65 años?
- ¿Qué porcentaje de directores generales tienen 65 años o más?
- ¿Cuál es la frecuencia relativa de las edades inferiores a 50 años?
- ¿Cuál es la frecuencia relativa acumulada de los directores generales menores de 55 años?
- ¿Qué gráfico muestra la frecuencia relativa y cuál la frecuencia relativa acumulada?
Use la siguiente información para responder los próximos dos ejercicios: la Tabla 1.18 contiene datos sobre los huracanes que han impactado directamente a EE. UU. entre 1851 y 2004. Un huracán recibe una categoría de fuerza basada en la velocidad mínima del viento generada por la tormenta.
Categoría | Número de impactos directos | Frecuencia relativa | Frecuencia acumulada |
---|---|---|---|
1 | 109 | 0,3993 | 0,3993 |
2 | 72 | 0,2637 | 0,6630 |
3 | 71 | 0,2601 | |
4 | 18 | 0,9890 | |
5 | 3 | 0,0110 | 1,0000 |
Total = 273 |
¿Cuál es la frecuencia relativa de los impactos directos que fueron huracanes de categoría 4?
- 0,0768
- 0,0659
- 0,2601
- No hay suficiente información para calcular
¿Cuál es la frecuencia relativa de los impactos directos que fueron COMO MÁXIMO una tormenta de categoría 3?
- 0,3480
- 0,9231
- 0,2601
- 0,3370
Notas a pie de página
- 3(lastbaldeagle. 2013. On Tax Day, House to Call for Firing Federal Workers Who Owe Back Taxes. Sondeo de opinión publicada en línea en: http://www.youpolls.com/details.aspx?id=12328 (consultada el 1.º de mayo de 2013)
- 4(Scott Keeter et al., "Gauging the Impact of Growing Nonresponse on Estimates from a National RDD Telephone Survey", Public Opinion Quarterly 70 no. 5 (2006), http://poq.oxfordjournals.org/content/70/5/759.full (consultado el 1 de mayo de 2013)
- 5(Frequently Asked Questions, Pew Research Center for the People & the Press, http://www.people-press.org/methodology/frequently-asked-questions/#dont-you-have-trouble-getting-people-to-answer-your-polls (consultado el 1.º de mayo de 2013)