Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

D Proyectos de grupos y asociaciones

Introducción a la estadísticaD Proyectos de grupos y asociaciones

Datos univariantes

Objetivos de aprendizaje de los estudiantes

  • El estudiante diseñará y realizará una encuesta.
  • El estudiante analizará y representará gráficamente los resultados de la encuesta.

Instrucciones

A medida que vaya terminando cada una de las tareas que aparecen a continuación, márquelas. Responda a todas las preguntas de su resumen.
____ Decida qué datos va a considerar.

Aquí hay dos ejemplos, pero NO puede usarlos: número de M&M por bolsa, número de lápices que los estudiantes tienen en sus mochilas.


____ ¿Sus datos son discretos o continuos? ¿Cómo lo sabe?
____ Decida cómo va a recoger los datos (por ejemplo, compre 30 bolsas de M&M; recoja datos de internet).
____ Describa su técnica de muestreo en detalle. Utilice muestreos por conglomerados, estratificado, sistemático o aleatorio simple (mediante un generador de números aleatorio). No use el muestreo de conveniencia. ¿Qué método utilizó? ¿Por qué eligió ese método?
____ Realice su encuesta. El tamaño de sus datos debe ser de al menos 30.
____ Resuma sus datos en un gráfico con columnas que muestren el valor de los datos, la frecuencia, la frecuencia relativa y la frecuencia relativa acumulada.
Conteste lo siguiente (redondeado a dos decimales)

  1. x ¯ x ¯ = _____
  2. s = _____
  3. Primer cuartil = _____
  4. Mediana = _____
  5. Percentil 70 = _____

____ ¿Qué valor está dos desviaciones típicas por encima de la media?

____ ¿Qué valor está 1,5 desviaciones típicas por debajo de la media?
____ Realice un histograma que muestre sus datos.
____ En frases completas, describa la forma de su gráfico.
____ ¿Nota algún valor atípico potencial? Si es así, ¿qué valores son? Muestre su trabajo sobre cómo utilizó la fórmula de valores atípicos potenciales para determinar si los valores podrían ser atípicos o no.
____ Realice un diagrama de caja y bigotes que muestre sus datos.
____ ¿El 50 % medio de los datos parece estar concentrado o disperso? Explique cómo lo determinó.
____ Observe tanto el histograma como el diagrama de caja y bigotes y discuta la distribución de sus datos.

Lista de comprobación de asignaciones

Entregue el siguiente paquete mecanografiado y engrapado, con las páginas en el siguiente orden:

  • Portada: nombre, hora de la clase y nombre de su estudio
  • Página de resumen: Debe contener párrafos escritos con frases completas. Debe incluir las respuestas a todas las preguntas anteriores. También debe incluir afirmaciones que describan la población estudiada, la muestra, el parámetro o los parámetros estudiados y la estadística o las estadísticas producidas.
  • URL de los datos, si sus datos proceden de internet
  • Cuadro de datos, frecuencia, frecuencia relativa y frecuencia relativa acumulada
  • Página(s) de gráficos: histograma y diagrama de caja y bigotes

Distribuciones continuas y teorema del límite central

Objetivos de aprendizaje de los estudiantes

  • El estudiante recogerá una muestra de datos continuos.
  • El estudiante intentará ajustar la muestra de datos a varios modelos de distribución.
  • El estudiante validará el teorema del límite central.

Instrucciones

A medida que vaya terminando cada una de las tareas que aparecen a continuación, márquelas. Responda a todas las preguntas en su resumen.

Parte I: Muestreo

____ Decida qué datos continuos va a estudiar. (He aquí dos ejemplos, pero NO puede utilizarlos: la cantidad de dinero que un estudiante ha gastado en material universitario este trimestre, o la duración de una llamada telefónica a distancia).
____ Describa detalladamente su técnica de muestreo. Utilice muestreos por conglomerados, estratificado, sistemático o aleatorio simple (mediante un generador de números aleatorio). No use el muestreo de conveniencia. ¿Qué método utilizó? ¿Por qué eligió ese método?
____ Realice su encuesta. Reúna al menos 150 datos continuos y cuantitativos.
____ Defina (en palabras) la variable aleatoria de sus datos. X = _______
____ Cree dos listas con sus datos: (1) datos no ordenados, (2) en orden de menor a mayor.
____ Halle la media muestral y la desviación típica de la muestra (redondeada a dos decimales).

  1. x ¯ x ¯ = ______
  2. s = ______

____ Construya un histograma de sus datos que contenga de cinco a diez intervalos de igual anchura. El histograma debe ser una muestra representativa de sus datos. Identifíquelo y escálelo.

Parte II: Distribuciones posibles

____ Supongamos que X sigue las siguientes distribuciones teóricas. Configure cada distribución utilizando la información apropiada de sus datos.
____ Uniforme: X ~ U ____________ Utilice los valores más bajos y más altos como a y b.
____ Normal: X ~ N ____________ Use x ¯ x ¯ para estimar μ y s para estimar σ.
____ ¿Deben sus datos ajustarse a una de las distribuciones anteriores? Explique por qué sí o por qué no.
____ ¿Podrían los datos ajustarse a dos o tres de las distribuciones anteriores (al mismo tiempo)? Explique.
____ Calcule el valor k(un valor X ) que está 1,75 desviaciones típicas por encima de la media muestral. k = _________ (redondeado a dos decimales) Note que: k = x ¯ x ¯ + (1,75)s
____ Determine las frecuencias relativas(RF) redondeadas a cuatro decimales.

Nota

RF= frecuencia número total de encuestados RF= frecuencia número total de encuestados

  1. RF(X < k) = ______
  2. RF(X > k) = ______
  3. RF(X = k) = ______

Nota

Debe tener una página para la distribución uniforme, una para la distribución exponencial y otra para la distribución normal.

____ Indique la distribución: X ~ _________
____ Dibuje un gráfico para cada una de las tres distribuciones teóricas. Rotule los ejes y márquelos adecuadamente.
____ Halle las siguientes probabilidades teóricas (redondeadas a cuatro decimales).

  1. P(X < k) = ______
  2. P(X > k) = ______
  3. P(X = k) = ______

____ Compare las frecuencias relativas con las probabilidades correspondientes. ¿Los valores son cercanos?
____ ¿Parece que los datos se ajustan bien a la distribución? Justifique tu respuesta comparando las probabilidades con las frecuencias relativas y los histogramas con los gráficos teóricos.

Parte III: Experimentos del CLT

______ A partir de sus datos originales (antes de ordenarlos), utilice un generador de números aleatorios para elegir 40 muestras de tamaño cinco. En cada muestra, calcule el promedio.
______ En una página separada, adjunta al resumen, incluya las 40 muestras de tamaño cinco, junto con los 40 promedios de las muestras.
______ Enumere los 40 promedios en orden de menor a mayor.
______ Defina la variable aleatoria, X ¯ X ¯ , en palabras. X ¯ X ¯ = _______________
______ Indique la distribución teórica aproximada de X ¯ X ¯ . X ¯ X ¯ ~ ______________
______ Base esto en la media y la desviación típica de sus datos originales.
______ Construya un histograma que muestre sus datos. Utilice de cinco a seis intervalos de igual anchura. Identifíquelo y escálelo.
Calcule el valor k ¯ k ¯ (un valor X ¯ X ¯ ) que está 1,75 desviaciones típicas por encima de la media muestral. k ¯ k ¯ = _____ (redondeado a dos decimales)
Determine las frecuencias relativas (RF) redondeadas a cuatro decimales.

  1. RF( X ¯ X ¯ < k ¯ k ¯ ) = _______
  2. RF( X ¯ X ¯ > k ¯ k ¯ ) = _______
  3. RF( X ¯ X ¯ = k ¯ k ¯ ) = _______

Halle las siguientes probabilidades teóricas (redondeadas a cuatro decimales).

  1. P( X ¯ X ¯ < k ¯ k ¯ ) = _______
  2. P( X ¯ X ¯ > k ¯ k ¯ ) = _______
  3. P( X ¯ X ¯ = k ¯ k ¯ ) = _______

______ Dibuje el gráfico de la distribución teórica de XX.
______ Compare las frecuencias relativas con las probabilidades. ¿Los valores son cercanos?
______ ¿Parece que los datos de los promedios se ajustan bien a la distribución de X ¯ X ¯ ? Justifique su respuesta comparando las probabilidades con las frecuencias relativas y el histograma con el gráfico teórico.
Responda a las siguientes preguntas en tres o cinco frases completas para cada una. Dé explicaciones detalladas.
______ En resumen, ¿los datos originales parecen ajustarse a las distribuciones uniforme, exponencial o normal? Responda por qué sí o por qué no para cada distribución. Si los datos no se ajustan a ninguna de esas distribuciones, explique por qué.
______ ¿Qué ocurrió con la forma y la distribución cuando promedió sus datos? En teoría, ¿qué pudo haber pasado? En teoría, ¿siempre ocurriría "eso"? ¿Por qué sí o por qué no?
______ ¿Las frecuencias relativas comparadas con las probabilidades teóricas eran más cercanas al comparar las distribuciones XX o X ¯ X ¯ ? Explique su respuesta.

Lista de comprobación de asignaciones

Debe entregar el siguiente paquete mecanografiado y engrapado, con las páginas en el siguiente orden:
____ Portada: nombre, hora de clase y nombre de su estudio.
____ Páginas de resumen: Las páginas contener varios párrafos escritos con frases completas que describan el experimento, incluyendo lo que estudió y su técnica de muestreo, así como las respuestas a todas las preguntas formuladas anteriormente.
____ URL de los datos, si sus datos provienen de internet.
____ Páginas, una por cada distribución teórica, con la distribución indicada, el gráfico y las preguntas de probabilidad respondidas.
____ Páginas de los datos solicitados.
____ Todos los gráficos requeridos

Artículo sobre la prueba de hipótesis

Objetivos de aprendizaje de los estudiantes

  • El estudiante identificará un problema de comprobación de hipótesis en versión impresa.
  • El estudiante realizará una encuesta para verificar o rebatir los resultados de la prueba de hipótesis.
  • El estudiante resumirá el artículo, el análisis y las conclusiones en un informe.

Instrucciones

Marque cada tarea a medida que la complete. Conteste todas las preguntas de su resumen.
____Busque un artículo de periódico, de una revista o en internet que haga una afirmación sobre UNA media poblacional o UNA proporción de la población. La afirmación puede basarse en una encuesta sobre la que el artículo informaba. Decida si esta afirmación es la hipótesis nula o la alternativa.
____Copie o imprima el artículo e incluya una copia en su proyecto, junto con la fuente.
____Indique cómo recogerá sus datos (el muestreo de conveniencia no es aceptable).
____Realice su encuesta. Debe tener más de 50 respuestas en su muestra. Cuando entregue su proyecto final, adjunte la hoja de registro o el paquete de cuestionarios que utilizó para recoger los datos. Sus datos deben ser reales.
____Indique los estadísticos resultado de su recopilación de datos: tamaño de la muestra, media muestral y desviación típica, O BIEN, tamaño de la muestra y número de éxitos.
____Haga dos copias de la hoja de soluciones correspondiente.
____Registre la prueba de hipótesis en la hoja de soluciones, con base en su experimento. Haga primero un BORRADOR de la solución en una de las hojas de solución y revísela cuidadosamente. Pídale a un compañero que verifique su solución. Tome su decisión utilizando un nivel de significación del 5 %. Incluya el intervalo de confianza del 95 % en la hoja de soluciones.
____Realice un gráfico que ilustre sus datos. Puede ser un gráfico circular o de barras, o bien un histograma o un diagrama de caja, según la naturaleza de los datos. Elabore un gráfico que tenga sentido para sus datos y ofrezca información visual útil sobre ellos. Es posible que tenga que ver varios tipos de gráficos antes de decidir cuál es el más apropiado para el tipo de datos de su proyecto.
____Escriba su resumen (en oraciones y párrafos completos, con gramática adecuada y ortografía correcta) que describa el proyecto. El resumen DEBE incluir:

  1. Breve análisis del artículo, incluyendo la fuente.
  2. Enunciado de la afirmación hecha en el artículo (una de las hipótesis).
  3. Descripción detallada de cómo, dónde y cuándo se recogieron los datos, incluida la técnica de muestreo; ¿se utilizó un muestreo por conglomerados, estratificado, sistemático o aleatorio simple (utilizando un generador de números aleatorios)? Como se mencionó anteriormente, no se acepta el muestreo de conveniencia.
  4. Conclusión sobre la afirmación del artículo a la luz de su prueba de hipótesis expuesta en palabras, en el contexto de la situación de su proyecto en forma de oraciones, como si estuviera escribiendo esta conclusión para un no estadístico.
  5. Oración que interprete su intervalo de confianza en el contexto de la situación de su proyecto.

Lista de comprobación de asignaciones

Entregue el siguiente paquete mecanografiado (12 puntos) y engrapado para su proyecto final:
____Portada que contenga su(s) nombre(s), la hora de la clase y el nombre de su estudio
____Resumen, que incluya todos los elementos enumerados en la lista de verificación del resumen
____Hoja de solución organizada y completa. La hoja de soluciones no necesita ser mecanografiada.
____Representación gráfica de sus datos, elaborada siguiendo las directrices ya expuestas; incluya sólo los gráficos que correspondan y sean útiles.
____Datos brutos recogidos Y una tabla que resuma los datos de la muestra (n, x ¯ x ¯ y s; o x, n, y p’, según convenga para sus hipótesis); no es necesario que los datos brutos estén mecanografiados, pero sí el resumen. Entregue los datos tal y como los recogió. (Adjunte su hoja de recuento o un sobre con sus cuestionarios)

Datos bivariantes, regresión lineal y datos univariantes

Objetivos de aprendizaje de los estudiantes

  • Los estudiantes recogerán una muestra de datos bivariantes mediante el uso de técnicas de muestreo adecuadas.
  • El estudiante intentará ajustar los datos a un modelo lineal.
  • El estudiante determinará la idoneidad del ajuste lineal del modelo.
  • El estudiante analizará y graficará datos univariantes.

Instrucciones

  1. A medida que vaya terminando cada una de las tareas que aparecen a continuación, márquelas. Responda a todas las preguntas en su introducción o resumen.
  2. Consulte el calendario del curso para conocer las fechas de entrega intermedias y finales.
  3. Los gráficos pueden elaborarse a mano o por computadora, a menos que su instructor le indique lo contrario. Todos los gráficos deben estar ordenados y ser precisos.
  4. Todas las demás respuestas deben elaborarse en la computadora.
  5. La claridad y calidad de las explicaciones se utilizan para determinar la nota final.

Parte I: Datos bivariantes

Introducción____Indique los datos bivariantes que su grupo estudiará.

Estos son dos ejemplos, pero NO puede utilizarlos: altura frente a peso y edad frente a distancia de carrera.


____Describa detalladamente su técnica de muestreo. Utilice un muestreo por conglomerados, estratificado, sistemático o aleatorio simple (utilizando un generador de números aleatorios). El muestreo de conveniencia NO es aceptable.
____Realice su encuesta. El número de pares debe ser al menos 30.
____Imprima una copia de sus datos.

Análisis ____ En una hoja aparte, elabore un gráfico de dispersión de los datos. Rotule y escale ambos ejes.
____Establezca la línea de mínimos cuadrados y el coeficiente de correlación.
____En su diagrama de dispersión, con un color diferente, construya la línea de mínimos cuadrados.
____¿Es significativo el coeficiente de correlación? Explique y muestre cómo lo determinó.
____Interprete la pendiente de la recta de regresión lineal en el contexto de los datos de su proyecto. Relacione la explicación con sus datos y cuantifique lo que le dice la pendiente.
____¿La línea de regresión parece ajustarse a los datos? ¿Por qué sí o por qué no? Si los datos no parecen ser lineales, explique si algún otro modelo parece ajustarse mejor a los datos.
____¿Hay algún valor atípico? Si es así, ¿cuáles son? Muestre cómo utilizó la fórmula de valores atípicos potenciales en el capítulo de Regresión y correlación lineal (ya que tiene datos bivariantes) para determinar si algún par podría ser atípico o no.

Parte II: Datos univariantes

En esta sección, solo utilizará los datos de UNA variable. Elija la variable más interesante de analizar. Por ejemplo: si su variable independiente son datos secuenciales como años, presentando 30 años y un dato por año, sus valores x podrían ser 1971, 1972, 1973, 1974, ..., 2000. No sería interesante analizar esto. En ese caso, opte por utilizar la variable dependiente para analizar esta parte del proyecto.
_____Resuma sus datos en un gráfico con columnas que muestren el valor de los datos, la frecuencia, la frecuencia relativa y la frecuencia relativa acumulada.
_____Responda a la siguiente pregunta, redondeada a dos decimales:

  1. Media muestral = ______
  2. Desviación típica de la muestra = ______
  3. Primer cuartil = ______
  4. Tercer cuartil = ______
  5. Mediana = ______
  6. Percentil 70 = ______
  7. Valor que está 2 desviaciones típicas por encima de la media = ______
  8. Valor que está 1,5 desviaciones típicas por debajo de la media = ______

_____Elabore un histograma que muestre sus datos. Agrupe los datos en seis o diez intervalos de igual anchura. Elija intervalos regularmente espaciados que tengan sentido en relación con sus datos. Por ejemplo, NO agrupe los datos por edad como 20-26,27-33,34-40,41-47,48-54,55-61 . . . En su lugar, puede utilizar los grupos de edad 19,5-24,5, 24,5-29,5, . . . o 19,5-29,5, 29,5-39,5, 39,5-49,5, . . .
_____Describa en frases completas la forma de su histograma.
_____¿Hay algún valor atípico potencial? ¿Qué valores son? Muestre su trabajo y sus cálculos sobre cómo utilizó la fórmula de valores atípicos potenciales en Estadística descriptiva (ya que ahora está utilizando datos univariantes) para determinar qué valores podrían ser atípicos.
_____Elabore un diagrama de caja y bigotes de sus datos.
_____¿El 50 % central de sus datos parece estar concentrado o disperso? Explique cómo lo determinó.
_____ Observe tanto el histograma como el diagrama de caja y bigotes, y analice la distribución de sus datos. Por ejemplo: ¿cómo se compara la dispersión del 50 % central de los datos con la dispersión del resto de los datos representados en el diagrama de caja y bigotes?, ¿cómo se corresponde eso con su descripción de la forma del histograma?, ¿cómo muestra la representación gráfica los valores atípicos que pudo haber encontrado?, ¿el histograma muestra espacios en los datos que no son visibles en el diagrama de caja y bigotes? ¿hay alguna característica interesante de sus datos que deba señalar?

Fechas de entrega

  • Parte I, Introducción: __________ (guarde una copia para sus archivos).
  • Parte I, Análisis: __________ (guarde una copia para sus archivos).
  • Proyecto completo, mecanografiado y engrapado: __________

    ____ Portada: nombres, hora de la clase y nombre de su estudio

    ____ Parte I: rotule las secciones "Introducción" y "Análisis".

    ____ Parte II:

    ____ Página de resumen que contiene varios párrafos escritos con frases completas que describan el experimento, incluyendo lo que estudió y cómo recogió sus datos. La página de resumen también debe incluir las respuestas a TODAS las preguntas formuladas anteriormente.

    ____ Todos los gráficos solicitados en el proyecto.

    ____ Todos los cálculos solicitados para apoyar las preguntas en los datos-

    ____ Descripción: ¿qué aprendió al realizar este proyecto?, ¿qué retos se le presentaron?, ¿cómo los superó?

Nota

Incluya las respuestas a TODAS las preguntas formuladas, aunque no se repitan explícitamente en los puntos anteriores.

Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.