Omitir e ir al contenidoIr a la página de accesibilidadMenú de atajos de teclado
Logo de OpenStax

Índice
  1. Prefacio
  2. 1 Muestreo y datos
    1. Introducción
    2. 1.1 Definiciones de estadística, probabilidad y términos clave
    3. 1.2 Datos, muestreo y variación de datos y muestreo
    4. 1.3 Niveles de medición
    5. 1.4 Diseño experimental y ética
    6. Términos clave
    7. Repaso del capítulo
    8. Tarea para la casa
    9. Referencias
    10. Soluciones
  3. 2 Estadística descriptiva
    1. Introducción
    2. 2.1 Datos mostrados
    3. 2.2 Medidas de la ubicación de los datos
    4. 2.3 Medidas del centro de los datos
    5. 2.4 Notación sigma y cálculo de la media aritmética
    6. 2.5 Media geométrica
    7. 2.6 Distorsión y media, mediana y moda
    8. 2.7 Medidas de la dispersión de los datos
    9. Términos clave
    10. Repaso del capítulo
    11. Repaso de fórmulas
    12. Práctica
    13. Tarea para la casa
    14. Resúmalo todo: tarea para la casa
    15. Referencias
    16. Soluciones
  4. 3 Temas de probabilidad
    1. Introducción
    2. 3.1 Terminología
    3. 3.2 Eventos mutuamente excluyentes e independientes
    4. 3.3 Dos reglas básicas de la probabilidad
    5. 3.4 Tablas de contingencia y árboles de probabilidad
    6. 3.5 Diagramas de Venn
    7. Términos clave
    8. Repaso del capítulo
    9. Repaso de fórmulas
    10. Práctica
    11. Uniéndolo todo: Práctica
    12. Tarea para la casa
    13. Resúmalo todo: tarea para la casa
    14. Referencias
    15. Soluciones
  5. 4 Variables aleatorias discretas
    1. Introducción
    2. 4.1 Distribución hipergeométrica
    3. 4.2 Distribución binomial
    4. 4.3 Distribución geométrica
    5. 4.4 Distribución de Poisson
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  6. 5 Variables aleatorias continuas
    1. Introducción
    2. 5.1 Propiedades de las funciones de densidad de probabilidad continuas
    3. 5.2 La distribución uniforme
    4. 5.3 La distribución exponencial
    5. Términos clave
    6. Repaso del capítulo
    7. Repaso de fórmulas
    8. Práctica
    9. Tarea para la casa
    10. Referencias
    11. Soluciones
  7. 6 La distribución normal
    1. Introducción
    2. 6.1 La distribución normal estándar
    3. 6.2 Uso de la distribución normal
    4. 6.3 Estimación de la binomial con la distribución normal
    5. Términos clave
    6. Repaso del capítulo
    7. Repaso de fórmulas
    8. Práctica
    9. Tarea para la casa
    10. Referencias
    11. Soluciones
  8. 7 El teorema del límite central
    1. Introducción
    2. 7.1 Teorema del límite central de las medias muestrales
    3. 7.2 Uso del teorema del límite central
    4. 7.3 Teorema del límite central de las proporciones
    5. 7.4 Factor de corrección de población finita
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  9. 8 Intervalos de confianza
    1. Introducción
    2. 8.1 Un intervalo de confianza para una desviación típica de la población, con un tamaño de muestra conocido o grande
    3. 8.2 Un intervalo de confianza para una desviación típica de población desconocida, caso de una muestra pequeña
    4. 8.3 Un intervalo de confianza para una proporción de población
    5. 8.4 Cálculo del tamaño de la muestra n: variables aleatorias continuas y binarias
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  10. 9 Pruebas de hipótesis con una muestra
    1. Introducción
    2. 9.1 Hipótesis nula y alternativa
    3. 9.2 Resultados y errores de tipo I y II
    4. 9.3 Distribución necesaria para la comprobación de la hipótesis
    5. 9.4 Ejemplos de pruebas de hipótesis completas
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  11. 10 Pruebas de hipótesis con dos muestras
    1. Introducción
    2. 10.1 Comparación de las medias de dos poblaciones independientes
    3. 10.2 Criterios de Cohen para efectos de tamaño pequeño, mediano y grande
    4. 10.3 Prueba de diferencias de medias: suponer varianzas de población iguales
    5. 10.4 Comparación de dos proporciones de población independientes
    6. 10.5 Dos medias poblacionales con desviaciones típicas conocidas
    7. 10.6 Muestras coincidentes o emparejadas
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Resúmalo todo: tarea para la casa
    14. Referencias
    15. Soluciones
  12. 11 La distribución chi-cuadrado
    1. Introducción
    2. 11.1 Datos sobre la distribución chi-cuadrado
    3. 11.2 Prueba de una sola varianza
    4. 11.3 Prueba de bondad de ajuste
    5. 11.4 Prueba de independencia
    6. 11.5 Prueba de homogeneidad
    7. 11.6 Comparación de las pruebas chi-cuadrado
    8. Términos clave
    9. Repaso del capítulo
    10. Repaso de fórmulas
    11. Práctica
    12. Tarea para la casa
    13. Resúmalo todo: tarea para la casa
    14. Referencias
    15. Soluciones
  13. 12 La distribución F y el anova de una vía
    1. Introducción
    2. 12.1 Prueba de dos varianzas
    3. 12.2 ANOVA de una vía
    4. 12.3 La distribución F y el cociente F
    5. 12.4 Datos sobre la distribución F
    6. Términos clave
    7. Repaso del capítulo
    8. Repaso de fórmulas
    9. Práctica
    10. Tarea para la casa
    11. Referencias
    12. Soluciones
  14. 13 Regresión lineal y correlación
    1. Introducción
    2. 13.1 El coeficiente de correlación r
    3. 13.2 Comprobación de la importancia del coeficiente de correlación
    4. 13.3 Ecuaciones lineales
    5. 13.4 La ecuación de regresión
    6. 13.5 Interpretación de los coeficientes de regresión: elasticidad y transformación logarítmica
    7. 13.6 Predicción con una ecuación de regresión
    8. 13.7 Cómo utilizar Microsoft Excel® para el análisis de regresión
    9. Términos clave
    10. Repaso del capítulo
    11. Práctica
    12. Soluciones
  15. A Cuadros estadísticos
  16. B Oraciones, símbolos y fórmulas matemáticas
  17. Índice
Esta foto muestra un rayo que sale de una nube oscura y llega al suelo.
Figura 4.1 Puede utilizar probabilidad y variables aleatorias discretas para calcular la probabilidad de que un rayo llegue al suelo cinco veces durante una tormenta de media hora (créditos: Leszek Leszczynski).

Un estudiante responde un cuestionario de diez preguntas de verdadero-falso. Como el estudiante tenía una agenda tan apretada, no podía estudiar y estimaba al azar cada respuesta. ¿Cuál es la probabilidad de que el estudiante apruebe el examen con, al menos, el 70 %?

Hay pequeñas compañías que pueden estar interesadas en el número de llamadas telefónicas de larga distancia que hacen sus empleados en las horas pico del día. Supongamos que el promedio histórico es de 20 llamadas. ¿Cuál es la probabilidad de que los empleados hagan más de 20 llamadas de larga distancia durante las horas pico?

Estos dos ejemplos ilustran dos tipos diferentes de problemas de probabilidad que implican variables aleatorias discretas. Recordemos que los datos discretos son datos que se pueden contar, es decir, la variable aleatoria solo puede tomar valores de números enteros. Una variable aleatoria describe con palabras los resultados de un experimento estadístico. Los valores de una variable aleatoria pueden variar con cada repetición de un experimento, a menudo llamado ensayo.

Notación de la variable aleatoria

La letra mayúscula X denota una variable aleatoria. Las letras minúsculas como x o y denotan el valor de una variable aleatoria. Si X es una variable aleatoria, entonces X se escribe con palabras y x se da como un número.

Por ejemplo, supongamos que X = el número de caras que se obtiene al lanzar tres monedas imparciales. El espacio muestral para el lanzamiento de tres monedas imparciales es TTT; THH; HTH; HHT; HTT; THT; TTH; HHH. Entonces, x = 0, 1, 2, 3. X está en palabras y x es un número. Observe que para este ejemplo los valores de x son resultados contables. Como se pueden contar los posibles valores como números enteros que puede tomar X y los resultados son aleatorios (los valores de x 0, 1, 2, 3), X es una variable aleatoria discreta.

Funciones de densidad de probabilidad (pdf) para una variable aleatoria

Una función de densidad de probabilidad o función de distribución de probabilidad tiene dos características:

  1. Cada probabilidad está entre cero y uno, ambos inclusive.
  2. La suma de las probabilidades es uno.

Una función de densidad de probabilidad es una fórmula matemática que calcula las probabilidades de determinados tipos de eventos, lo que hemos llamado experimentos. La función de densidad de probabilidad (probability density function, pdf) es como una receta mágica, en parte porque la misma fórmula suele describir tipos de eventos muy diferentes. Por ejemplo, la pdf binomial calculará las probabilidades de lanzar monedas, de las preguntas de respuesta afirmativa o negativa en un examen, de las opiniones de los votantes en una encuesta de opinión a favor o en contra, en definitiva, de cualquier evento binario. Otras funciones de densidad de probabilidad proporcionarán probabilidades para el tiempo que falta para que una pieza falle, cuándo llegará un cliente a la cabina de peaje de la autopista, el número de llamadas que llegan a una central telefónica, la tasa de crecimiento de una bacteria, etc. Existen familias enteras de funciones de densidad de probabilidad que se utilizan en una gran variedad de aplicaciones, como la medicina, los negocios y las finanzas, la física y la ingeniería, entre otras.

Para nuestro propósito aquí nos concentraremos en solo algunas funciones de densidad de probabilidad mientras desarrollamos las herramientas de la estadística inferencial.

Fórmulas de recuento y fórmula combinatoria

Recordemos que la probabilidad del evento A, P(A), es simplemente el número de formas en que el experimento dará como resultado A, en relación con el número total de resultados posibles del experimento.

Como ecuación esto es:

P(A) =número de formas de obtener ANúmero total de resultados posiblesP(A)=número de formas de obtener ANúmero total de resultados posibles

Cuando observamos el espacio muestral para lanzar 3 monedas, podemos escribir fácilmente el espacio muestral completo y, por lo tanto, podemos contar fácilmente el número de eventos que cumplen nuestro resultado deseado, por ejemplo, x = 1 , donde X es la variable aleatoria definida como el número de caras.

A medida que tenemos un mayor número de elementos en el espacio muestral, como una baraja completa de 52 cartas, la posibilidad de escribir el espacio muestral se vuelve imposible.

Vemos que las probabilidades no son más que contar los eventos de cada grupo que nos interesa y dividirlos por el número de elementos del universo, o espacio muestral. Esto es bastante fácil si contamos los estudiantes de segundo año de una clase de Estadística, pero en casos más complicados enumerar todos los posibles resultados puede llevarnos toda la vida. Hay, por ejemplo, 36 resultados posibles al lanzar solo dos dados de seis caras en los que la variable aleatoria es la suma del número de puntos de las caras que miran hacia arriba. Si hubiera cuatro dados, el número total de resultados posibles sería de 1.296. Hay más de 2,5 MILLONES de posibles manos de póker de 5 cartas en una baraja estándar de 52 cartas. Evidentemente, llevar la cuenta de todas estas posibilidades y contarlas para llegar a una única probabilidad sería, en el mejor de los casos, tedioso.

Una alternativa a la enumeración del espacio muestral completo y al recuento del número de elementos que nos interesan, es saltarse el paso de enumerar el espacio muestral, y simplemente calcular el número de elementos que contiene y hacer la división correspondiente. Si buscamos una probabilidad, realmente no necesitamos ver todos y cada uno de los elementos del espacio muestral, solo necesitamos saber cuántos elementos hay. Las fórmulas de recuento se inventaron precisamente para eso. Nos indican el número de subconjuntos desordenados de un determinado tamaño que se pueden crear a partir de un conjunto de elementos únicos. Por desordenado se entiende que, por ejemplo, al repartir las cartas, no importa si tienes {as, as, as, as, rey} o {rey, as, as, as, as} o {as, rey, as, as, as} y así sucesivamente. Cada uno de estos subconjuntos es el mismo porque cada uno tiene 4 ases y un rey.

Fórmula combinatoria

nx = nCx =n!x!(nx)!nx =nCx=n!x!(nx)!
4.1

Es la fórmula que indica el número de subconjuntos desordenados únicos de tamaño x que se pueden crear a partir de n elementos únicos. La fórmula se lee "n combinatoria x". A veces se lee como "n elegir x". El signo de exclamación "!" se llama factorial y nos dice que hay que tomar todos los números desde el 1 hasta el número que precede al ! y multiplicarlos juntos, por lo que 4! es 1-2-3-4=24. Por definición 0! = 1. La fórmula se denomina fórmula combinatoria. También se llama coeficiente binomial, por razones que se aclararán en breve. Aunque este concepto matemático se comprendió mucho antes de 1653, se atribuye a Blaise Pascal el mayor mérito por la demostración que publicó en ese año. Además, desarrolló un método generalizado de cálculo de los valores de las combinatorias que conocemos como el Triángulo de Pascal. Pascal fue uno de los genios de una época de extraordinarios avances intelectuales que incluyó la obra de Galileo, René Descartes, Isaac Newton, William Shakespeare y el perfeccionamiento del método científico, la propia razón de ser del tema de este texto.

Vamos a encontrar por las malas el número total de combinaciones de los cuatro ases de una baraja de cartas si las tomamos de dos en dos. El espacio muestral sería:

S={Picas, Corazón),(Picas, Diamante),(Picas, Tréboles), (Diamante, Tréboles),(Corazón, Diamante),(Corazón, Tréboles)}

Hay 6 combinaciones; formalmente, seis subconjuntos desordenados únicos de tamaño 2 que se pueden crear a partir de 4 elementos únicos. Para utilizar la fórmula combinatoria resolveríamos la fórmula de la siguiente manera:

42 =4!(42)!2!=4·3·2·12·1·2·1 =642=4!(42)!2!=4·3·2·12·1·2·1=6

Si quisiéramos saber el número de manos únicas de póquer de 5 cartas que se pueden crear a partir de un mazo de 52 cartas, simplemente calcularíamos:

525 525

donde 52 es el número total de elementos únicos de los que estamos sacando y 5 es el grupo de tamaño en el que los estamos poniendo.

Con la fórmula combinatoria podemos contar el número de elementos de un espacio muestral sin tener que escribir cada uno de ellos, lo que realmente es el trabajo de toda una vida para solo el número de 5 manos de cartas de una baraja de 52. Ahora podemos aplicar esta herramienta a una función de densidad de probabilidad muy importante, la distribución hipergeométrica.

Recuerde que una función de densidad de probabilidad calcula las probabilidades por nosotros. Simplemente ponemos los números adecuados en la fórmula y obtenemos la probabilidad de eventos específicos. Sin embargo, para que estas fórmulas funcionen deben aplicarse solo a los casos para los que fueron diseñadas.

Solicitar una copia impresa

As an Amazon Associate we earn from qualifying purchases.

Cita/Atribución

¿Desea citar, compartir o modificar este libro? Este libro utiliza la Creative Commons Attribution License y debe atribuir a OpenStax.

Información de atribución
  • Si redistribuye todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:
    Acceso gratis en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/1-introduccion
  • Si redistribuye todo o parte de este libro en formato digital, debe incluir en cada vista de la página digital la siguiente atribución:
    Acceso gratuito en https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/1-introduccion
Información sobre citas

© 28 ene. 2022 OpenStax. El contenido de los libros de texto que produce OpenStax tiene una licencia de Creative Commons Attribution License . El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia de Creative Commons y no se pueden reproducir sin el previo y expreso consentimiento por escrito de Rice University.