Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax
Introducción a la estadística

1.1 Definiciones de estadística, probabilidad y términos clave

Introducción a la estadística1.1 Definiciones de estadística, probabilidad y términos clave

La ciencia de la Estadística se ocupa de la recopilación, del análisis, de la interpretación y de la presentación de datos. Vemos y utilizamos datos en nuestra vida cotidiana.

Ejercicio colaborativo

Intente este ejercicio en clase. Pida a sus compañeros de clase que anoten el tiempo promedio (en horas, redondeado a la media hora más cercana) que duermen por noche. Su instructor registrará los datos. A continuación, cree un gráfico sencillo (llamado diagrama de puntos) de los datos. Un diagrama de puntos consiste en una línea numérica y puntos (o pequeños círculos) colocados sobre la línea numérica. Por ejemplo, considere los siguientes datos:

5; 5,5; 6; 6; 6; 6,5; 6,5; 6,5; 6,5; 7; 7; 8; 8; 9

El diagrama de puntos para estos datos sería el siguiente:

Este es un diagrama de puntos que muestra el promedio de horas de sueño. La recta numérica está marcada en intervalos de 1 del 5 al 9. Los puntos por encima de la recta muestran 1 persona que anotó 5 horas, 1 que anotó 5,5, 3 que anotaron 6, 4 que anotaron 6,5, 2 que anotaron 7, 2 que anotaron 8 y 1 que anotó 9 horas.
Figura 1.2

¿Su diagrama de puntos es igual o diferente al del ejemplo? ¿Por qué? Si realizara el mismo ejercicio en una clase de inglés con el mismo número de estudiantes, ¿cree que los resultados serían los mismos? ¿Por qué sí o por qué no?

¿Dónde parecen conglomerarse sus datos? ¿Cómo podría interpretar el conglomerado?

Las preguntas anteriores le piden que analice e interprete sus datos. Con este ejemplo, ha comenzado su estudio de la estadística.

En este curso aprenderá a organizar y resumir datos. La organización y el resumen de los datos se denominan Estadística Descriptiva. Dos formas de resumir los datos son la elaboración de gráficos y el uso de números (por ejemplo, hallar un promedio). Después de haber estudiado la probabilidad y las distribuciones de probabilidad, utilizará métodos formales para sacar conclusiones de los datos “buenos”. Los métodos formales se denominan Estadística Inferencial. La inferencia estadística utiliza la probabilidad para determinar el grado de confianza que podemos tener en que nuestras conclusiones son correctas.

La interpretación eficaz de los datos (inferencia) se basa en buenos procedimientos de producción de datos y en examinarlos de forma reflexiva. Se encontrará con lo que le parecerá un exceso de fórmulas matemáticas para interpretar los datos. La meta de la Estadística no es realizar numerosos cálculos con las fórmulas, sino comprender los datos. Los cálculos se pueden hacer con una calculadora o una computadora. La comprensión debe venir de usted. Si puede comprender a fondo los fundamentos de la Estadística, podrá tener más confianza en las decisiones que tome en la vida.

Probabilidad

La probabilidad es una herramienta matemática utilizada para estudiar el azar. Se trata de la oportunidad (la posibilidad) de que se produzca un evento. Por ejemplo, si se lanza una moneda imparcial cuatro veces, los resultados no pueden ser dos caras y dos cruces. Sin embargo, si se lanza la misma moneda 4.000 veces, los resultados se aproximarán a mitad cara y mitad cruz. La probabilidad teórica esperada de salir cara en cualquier lanzamiento es 1 2 1 2 o 0,5. Aunque los resultados de unas pocas repeticiones son inciertos, existe un patrón regular de resultados cuando hay muchas repeticiones. Tras leer sobre el estadístico inglés Karl Pearson, que lanzó una moneda 24.000 veces con un resultado de 12.012 caras, uno de los autores lanzó una moneda 2.000 veces. Los resultados fueron 996 caras. La fracción 996 2000 996 2000 es igual a 0,498, que está muy cerca de 0,5, la probabilidad esperada.

La teoría de la probabilidad comenzó con el estudio de los juegos de azar, como el póquer. Las predicciones adoptan la forma de probabilidades. Para predecir la probabilidad de que se produzca un terremoto, de que llueva o de que obtenga una A en este curso utilizamos las probabilidades. Los médicos utilizan la probabilidad para determinar la posibilidad de que una vacuna provoque la enfermedad que se supone que debe prevenir. Un agente de bolsa utiliza la probabilidad para determinar la tasa de rendimiento de las inversiones de un cliente. Puede utilizar la probabilidad para decidir si compra un billete de lotería o no. En su estudio de la Estadística, utilizará el poder de las Matemáticas a través de cálculos de probabilidad para analizar e interpretar sus datos.

Términos clave

En estadística, generalmente queremos estudiar una población. Se puede pensar en una población como un conjunto de personas, cosas u objetos en estudio. Para estudiar la población seleccionamos una muestra. La idea del muestreo es seleccionar una porción (o subconjunto) de la población mayor y estudiar esa porción (la muestra) para obtener información sobre la población. Los datos son el resultado de un muestreo de una población.

Como se necesita mucho tiempo y dinero para examinar toda una población, el muestreo es una técnica muy práctica. Si desea calcular el promedio general de calificaciones de su escuela, tendría sentido seleccionar una muestra de estudiantes que asisten a la escuela. Los datos recopilados de la muestra serían los promedios de las calificaciones de los estudiantes. En las elecciones presidenciales se toman muestras de sondeos de opinión de 1.000 a 2.000 personas. Se supone que el sondeo de opinión representa el punto de vista de las personas de todo el país. Los fabricantes de bebidas carbonatadas en lata toman muestras para determinar si una lata de 16 onzas contiene 16 onzas de bebida carbonatada.

A partir de los datos de la muestra podemos calcular un estadístico. Un estadístico es un número que representa una propiedad de la muestra. Por ejemplo, si consideramos que una clase de Matemáticas es una muestra de la población de todas las clases de Matemáticas, el número promedio de puntos obtenidos por los estudiantes de esa clase de Matemáticas al final del trimestre es un ejemplo de un estadístico. El estadístico es una estimación de un parámetro de población. Un parámetro es una característica numérica de toda la población que puede estimarse mediante un estadístico. Dado que consideramos que todas las clases de Matemáticas son la población, el número promedio de puntos obtenidos por estudiante en todas las clases de Matemáticas es un ejemplo de parámetro.

Una de las principales preocupaciones en el campo de la Estadística es la precisión con la que un estadístico estima un parámetro. La precisión depende realmente de lo bien que la muestra represente a la población. La muestra debe contener las características de la población para ser una muestra representativa. En la Estadística Inferencial nos interesa tanto el estadístico de la muestra como el parámetro de la población. En un capítulo posterior utilizaremos el estadístico de la muestra para comprobar la validez del parámetro poblacional establecido.

Una variable, generalmente anotada con letras mayúsculas como X e Y, es una característica o medida que puede determinarse para cada miembro de una población. Las variables pueden ser numéricas o categóricas. Las variables numéricas toman valores con unidades iguales, como el peso en libras y el tiempo en horas. Las variables categóricas sitúan a la persona o cosa en una categoría. Si suponemos que X equivale al número de puntos obtenidos por un estudiante de Matemáticas al final de un trimestre, entonces X es una variable numérica. Si suponemos que Y es la afiliación de una persona a un partido, entonces algunos ejemplos de Y incluyen republicano, demócrata e independiente. Y es una variable categórica. Podríamos hacer algunos cálculos con valores de X (calcular el promedio de puntos obtenidos, por ejemplo), pero no tiene sentido hacer cálculos con valores de Y (calcular un promedio de afiliación a un partido no tiene sentido).

Los datos son los valores reales de la variable. Pueden ser números o palabras. El dato es un valor único.

Dos palabras que aparecen a menudo en estadística son media y proporción. Si presenta tres exámenes de sus clases de Matemáticas y obtiene calificaciones de 86, 75 y 92, calcularía su calificación media sumando las tres calificaciones de los exámenes y dividiéndolas entre tres (su calificación media sería 84,3 con un decimal). Si en su clase de Matemáticas hay 40 estudiantes y 22 son hombres y 18 son mujeres, entonces la proporción de estudiantes hombres es 22402240 y la proporción de estudiantes mujeres es 18401840. La media y la proporción se tratan con más detalle en capítulos posteriores.

NOTA

Las palabras “media” y “promedio” suelen utilizarse indistintamente. La sustitución de una palabra por otra es una práctica habitual. El término técnico es “media aritmética” y “promedio” es técnicamente un lugar central. Sin embargo, en la práctica, entre los no estadísticos, se suele aceptar “promedio” por “media aritmética”.

Ejemplo 1.1

Translation missing: es.problem

Determine a qué se refieren los términos clave en el siguiente estudio. Queremos saber la cantidad promedio (media) de dinero que gastan los estudiantes de primer año del ABC College en material escolar que no incluya libros. Encuestamos al azar a 100 estudiantes de primer año del ABC College. Tres de esos estudiantes gastaron 150, 200 y 225 dólares, respectivamente.

Inténtelo 1.1

Determine a qué se refieren los términos clave en el siguiente estudio. Queremos saber la cantidad promedio de dinero que gastan cada año en uniformes escolares las familias con hijos en Knoll Academy. Encuestamos al azar a 100 familias con hijos en la escuela. Tres de las familias gastaron 65, 75 y 95 dólares, respectivamente.

Ejemplo 1.2

Translation missing: es.problem

Determine a qué se refieren los términos clave en el siguiente estudio.

Se ha realizado un estudio en un instituto universitario local para analizar el promedio de calificaciones (Grade Point Average, GPA) acumulado de los estudiantes que se graduaron el año pasado. Marque la letra de la oración que mejor describa cada uno de los elementos siguientes.

1. Población_____ 2. Estadística _____ 3. Parámetro _____ 4. Muestra _____ 5. Variable _____ 6. Datos _____

  1. todos los estudiantes que cursaron educación superior el año pasado
  2. el GPA acumulado de un estudiante que se graduó de la educación superior el año pasado
  3. 3,65, 2,80, 1,50, 3,90
  4. un grupo de estudiantes que se graduaron de la educación superior el año pasado seleccionados al azar
  5. el GPA acumulado de los estudiantes que se graduaron de la educación superior el año pasado
  6. todos los estudiantes que se graduaron de la educación superior el año pasado
  7. el GPA acumulado de los estudiantes del estudio que se graduaron de la educación superior el año pasado

Ejemplo 1.3

Translation missing: es.problem

Determine a qué se refieren los términos clave en el siguiente estudio.

Como parte de un estudio diseñado para probar la seguridad de los automóviles, la Junta Nacional de Seguridad del Transporte recopiló y revisó datos sobre los efectos de un choque de automóviles en maniquíes de prueba. Este es el criterio que utilizaron:

Velocidad a la que chocan los autos Ubicación de los "conductores" (es decir, los maniquíes)
35 millas/hora Asiento delantero
Tabla 1.1

Los automóviles con maniquíes en los asientos delanteros se estrellaron contra un muro a una velocidad de 35 millas por hora. Queremos saber la proporción de maniquíes en el asiento del conductor que habrían tenido lesiones en la cabeza, si hubieran sido conductores reales. Empezamos con una muestra aleatoria simple de 75 automóviles.

Ejemplo 1.4

Translation missing: es.problem

Determine a qué se refieren los términos clave en el siguiente estudio.

Una compañía de seguros desea determinar la proporción de todos los médicos que se han visto implicados en una o más demandas por negligencia. La compañía selecciona 500 médicos al azar de un directorio profesional y determina el número de la muestra que se ha visto envuelto en una demanda por negligencia.

Ejercicio colaborativo

Realice el siguiente ejercicio en colaboración con un máximo de cuatro personas por grupo. Halle una población, una muestra, el parámetro, la estadística, una variable y los datos para el siguiente estudio: Se quiere determinar el número promedio de vasos de leche que beben los estudiantes universitarios al día. Supongamos que ayer, en su clase de Inglés, les preguntó a cinco estudiantes cuántos vasos de leche bebieron el día anterior. Las respuestas fueron 1, 0, 1, 3 y 4 vasos de leche.

Cita/Atribución

Este libro no puede ser utilizado en la formación de grandes modelos de lenguaje ni incorporado de otra manera en grandes modelos de lenguaje u ofertas de IA generativa sin el permiso de OpenStax.

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.