Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax

1.1 Definiciones de estadística, probabilidad y términos clave

Use la siguiente información para responder los siguientes cinco ejercicios. Las compañías farmacéuticas suelen realizar estudios para determinar la eficacia de un programa de tratamiento. Supongamos que se está estudiando un nuevo fármaco contra el sida. Se administra a los pacientes una vez que los síntomas del sida se han manifestado. Resulta interesante la duración promedio (media) de la vida de los pacientes, en meses, una vez iniciado el tratamiento. Dos investigadores siguen cada uno a un conjunto diferente de 40 pacientes con sida desde el inicio del tratamiento hasta su muerte. Se recogen los siguientes datos (en meses).

Investigador A:3; 4; 11; 15; 16; 17; 22; 44; 37; 16; 14; 24; 25; 15; 26; 27; 33; 29; 35; 44; 13; 21; 22; 10; 12; 8; 40; 32; 26; 27; 31; 34; 29; 17; 8; 24; 18; 47; 33; 34

Investigador B:3; 14; 11; 5; 16; 17; 28; 41; 31; 18; 14; 14; 26; 25; 21; 22; 31; 2; 35; 44; 23; 21; 21; 16; 12; 18; 41; 22; 16; 25; 33; 34; 29; 13; 18; 24; 23; 42; 33; 29

Determine a qué se refieren los términos clave en el ejemplo del investigador A.

1.

población

2.

muestra

3.

parámetro

4.

estadística

5.

variable

1.2 Datos, muestreo y variación de datos y muestreo

6.

“Número de veces por semana”, ¿qué tipo de datos son?

a. cualitativo (categórico); b. cuantitativo discreto; c. continuo cuantitativo

Use la siguiente información para responder los próximos cuatro ejercicios: Se realizó un estudio para determinar la edad, el número de veces por semana y la duración (cantidad de tiempo) de los residentes que utilizan un parque local en San Antonio, Texas. Se seleccionó al azar la primera casa del vecindario que rodea el parque y, a continuación, se entrevistó al residente de una de cada ocho casas del vecindario que rodea el parque.

7.

El método de muestreo fue

a. aleatorio simple; b. sistemático; c. estratificado; d. por conglomerado

8.

La “duración (cantidad de tiempo)”, ¿qué tipo de dato es?

a. cualitativo (categórico); b. cuantitativo discreto; c. continuo cuantitativo

9.

Los colores de las casas que rodean el parque, ¿qué tipo de datos son?

a. cualitativo (categórico); b. cuantitativo discreto; c. continuo cuantitativo

10.

La población es ______________________

11.

La Tabla 1.26 contiene el número total de muertes en todo el mundo a causa de los terremotos desde el 2000 hasta el 2012.

AñoNúmero total de muertes
2000 231
2001 21.357
2002 11.685
2003 33.819
2004 228.802
2005 88.003
2006 6.605
2007 712
2008 88.011
2009 1.790
2010 320.120
2011 21.953
2012 768
Total 823.856
Tabla 1.26

Utilice la Tabla 1.26 para responder las siguientes preguntas.

  1. ¿Cuál es la proporción de muertes entre el 2007 y el 2012?
  2. ¿Qué porcentaje de muertes se produjo antes del 2001?
  3. ¿Cuál es el porcentaje de muertes ocurridas en el 2003 o después del 2010?
  4. ¿Cuál es la fracción de muertes ocurridas antes del 2012?
  5. ¿Qué tipo de datos es el número de muertes?
  6. Los terremotos se cuantifican según la cantidad de energía que producen (ejemplos: 2,1, 5,0, 6,7). ¿Qué tipo de datos son?
  7. ¿Qué contribuyó al gran número de muertes en el 2010? ¿En el 2004? Explique.

Para los cuatro ejercicios siguientes, determine el tipo de muestreo utilizado (aleatorio simple, estratificado, sistemático, por conglomerados o de conveniencia).

12.

Un grupo de sujetos de prueba se divide en doce grupos; luego se eligen cuatro de los grupos al azar.

13.

Un investigador de mercado encuesta a una de cada diez personas que entran en una tienda.

14.

Se encuesta a las primeras 50 personas que entran en un evento deportivo sobre sus preferencias televisivas.

15.

Una computadora genera 100 números aleatorios y se eligen 100 personas cuyos nombres se corresponden con los números de la lista.


Use la siguiente información para responder los próximos siete ejercicios: Las compañías farmacéuticas suelen realizar estudios para determinar la eficacia de un programa de tratamiento. Supongamos que se está estudiando un nuevo fármaco contra el sida. Se administra a los pacientes una vez que los síntomas del sida se han manifestado. Resulta interesante la duración promedio (media) de la vida de los pacientes, en meses, una vez iniciado el tratamiento. Dos investigadores siguen cada uno a un grupo diferente de 40 pacientes con SIDA desde el inicio del tratamiento hasta su muerte. Se recopilan los siguientes datos (en meses)

Investigador A: 3; 4; 11; 15; 16; 17; 22; 44; 37; 16; 14; 24; 25; 15; 26; 27; 33; 29; 35; 44; 13; 21; 22; 10; 12; 8; 40; 32; 26; 27; 31; 34; 29; 17; 8; 24; 18; 47; 33; 34

Investigador B: 3; 14; 11; 5; 16; 17; 28; 41; 31; 18; 14; 14; 26; 25; 21; 22; 31; 2; 35; 44; 23; 21; 21; 16; 12; 18; 41; 22; 16; 25; 33; 34; 29; 13; 18; 24; 23; 42; 33; 29

16.

Complete las tablas con los datos proporcionados:

Duración de la supervivencia (en meses) Frecuencia Frecuencia relativa Frecuencia relativa acumulada
0,5–6,5
6,5–12,5
12,5–18,5
18.5–24.5
24,5–30,5
30,5–36,5
36.5–42.5
42.5–48.5
Tabla 1.27 Investigador A
Duración de la supervivencia (en meses) Frecuencia Frecuencia relativa Frecuencia relativa acumulada
0,5–6,5
6,5–12,5
12,5–18,5
18.5–24.5
24,5–30,5
30,5–36,5
36,5-45,5
Tabla 1.28 Investigador B
17.

Determine a qué se refiere el término clave datos en el ejemplo anterior para el investigador A.

18.

Enumere dos razones por las que los datos pueden discrepar.

19.

¿Puede decir si un investigador está en lo correcto y el otro no? ¿Por qué?

20.

¿Espera que los datos sean idénticos? ¿Por qué sí o por qué no?

21.

Proponga al menos dos métodos que los investigadores podrían utilizar para recopilar datos aleatorios.

22.

Supongamos que el primer investigador realiza su encuesta eligiendo al azar un estado de la nación y luego escogiendo al azar 40 pacientes de ese estado. ¿Qué método de muestreo habría utilizado ese investigador?

23.

Supongamos que el segundo investigador realiza su encuesta eligiendo a 40 pacientes que conoce. ¿Qué método de muestreo habría utilizado ese investigador? ¿Qué preocupaciones tendría sobre este conjunto de datos, según el método de recopilación de datos?

Use los siguientes datos para responder los próximos cinco ejercicios: Dos investigadores están recopilando datos sobre las horas de videojuegos que juegan los niños en edad escolar y los adultos jóvenes. Cada uno de ellos toma una muestra aleatoria de diferentes grupos de 150 estudiantes de la misma escuela. Recopilan los siguientes datos.

Horas jugadas por semana Frecuencia Frecuencia relativa Frecuencia relativa acumulada
0–2 26 0,17 0,17
2–4 30 0,20 0,37
4–6 49 0,33 0,70
6–8 25 0,17 0,87
8–10 12 0,08 0,95
10–12 8 0,05 1
Tabla 1.29 Investigador A
Horas jugadas por semana Frecuencia Frecuencia relativa Frecuencia relativa acumulada
0–2 48 0,32 0,32
2–4 51 0,34 0,66
4–6 24 0,16 0,82
6–8 12 0,08 0,90
8–10 11 0,07 0,97
10–12 4 0,03 1
Tabla 1.30 Investigador B
24.

Explique por qué los datos pueden ser diferentes.

25.

¿El tamaño de la muestra sería lo suficientemente grande si los estudiantes de la escuela fueran la población?

26.

¿El tamaño de la muestra sería lo suficientemente grande si los niños en edad escolar y los adultos jóvenes de Estados Unidos fueran la población?

27.

El investigador A concluye que la mayoría de los estudiantes juegan a los videojuegos entre cuatro y seis horas a la semana. El investigador B concluye que la mayoría de los estudiantes juegan a los videojuegos entre dos y cuatro horas a la semana. ¿Quién tiene razón?

28.

Como forma de recompensar a los estudiantes por participar en la encuesta, los investigadores dieron a cada uno de ellos una tarjeta regalo para una tienda de videojuegos. ¿Esto afectaría los datos si los estudiantes conocieran el premio antes del estudio?

Use los siguientes datos para responder los próximos cinco ejercicios: Se han realizado un par de estudios para medir la eficacia de un nuevo software diseñado para ayudar a los pacientes que sufrieron un ictus a recuperar su capacidad de resolución de problemas. Se pidió a los pacientes que utilizaran el software dos veces al día, una por la mañana y otra por la noche. Los estudios observaron a 200 pacientes con ictus que se recuperaban durante un periodo de varias semanas. El primer estudio recopiló los datos en la Tabla 1.31. El segundo estudio recopiló los datos en la Tabla 1.32.

Grupo Ha mostrado una mejora No hay mejora Deterioro
Programa usado 142 43 15
No utilizó programa 72 110 18
Tabla 1.31
Grupo Ha mostrado una mejora No hay mejora Deterioro
Programa usado 105 74 19
No utilizó programa 89 99 12
Tabla 1.32
29.

Teniendo en cuenta lo que sabe, ¿qué estudio es el correcto?

30.

El primer estudio lo realizó la compañía que diseñó el software. El segundo estudio lo realizó la Asociación Médica Americana. ¿Qué estudio es más fiable?

31.

Los dos grupos que realizaron el estudio concluyeron que el software funciona. ¿Es esto correcto?

32.

La compañía considera los dos estudios como prueba de que su software causa una mejora mental en los pacientes con ictus. ¿Esta afirmación es correcta?

33.

Los pacientes que utilizaron el software también formaron parte de un programa de ejercicios, mientras que los que no lo utilizaron no lo hicieron. ¿Cambia esto la validez de las conclusiones del Ejercicio 1.31?

34.

¿Un tamaño de muestra de 1000 es una medida fiable para una población de 5000?

35.

¿Es una muestra de 500 voluntarios una medida fiable para una población de 2500?

36.

Una pregunta de una encuesta dice: "¿Prefiere el delicioso sabor de la marca X o el de la marca Y?" ¿Es una pregunta correcta?

37.

¿Una muestra de dos personas es representativa de una población de cinco?

38.

¿Es posible que dos experimentos bien realizados con tamaños de muestra similares obtengan datos diferentes?

1.3 Frecuencia, tablas de frecuencia y niveles de medición

39.

¿Qué tipo de escala de medición se utiliza? Nominal, ordinal, de intervalo o de cociente.

  1. Los jugadores de fútbol de la escuela secundaria se clasifican por su capacidad atlética: Superior, promedio, por encima del promedio
  2. Las temperaturas de cocción para varios platos principales: 350, 400, 325, 250, 300
  3. Los colores de los lápices de colores en una caja de 24 lápices
  4. Los números de la seguridad social
  5. Los ingresos medidos en dólares
  6. Una encuesta de satisfacción de un sitio web social por número: 1 = muy satisfecho, 2 = algo satisfecho, 3 = no satisfecho
  7. La perspectiva política: extrema izquierda, centro-izquierda, centro-derecha, extrema derecha
  8. La hora del día en un reloj analógico
  9. La distancia en millas a la tienda de comestibles más cercana
  10. Las fechas 1066, 1492, 1644, 1947 y 1944
  11. La altura de las mujeres de 21 a 65 años
  12. Notas con letras comunes: A, B, C, D y F

1.4 Diseño experimental y ética

40.

Diseñe un experimento. Identifique las variables explicativas y de respuesta. Describa la población estudiada y las unidades experimentales. Explique los tratamientos que se utilizarán y cómo se asignarán a las unidades experimentales. Describa cómo se puede utilizar el experimento ciego y los placebos para contrarrestar el poder de la sugestión.

41.

Discuta las posibles violaciones de la norma que exige el consentimiento informado.

  1. A los reclusos de un centro penitenciario se les ofrece un crédito por buen comportamiento a cambio de su participación en un estudio.
  2. Se ha diseñado un estudio de investigación para investigar un nuevo medicamento contra la alergia infantil.
  3. A los participantes en un estudio se les dice que el nuevo medicamento que se está probando es muy prometedor, pero no se les dice que solo una pequeña parte de los participantes recibirá el nuevo medicamento. Otros recibirán tratamientos placebo y tratamientos tradicionales.
Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.