- Desviación típica
- un número que es igual a la raíz cuadrada de la varianza y que mide lo lejos que están los valores de los datos de su media; notación: s para la desviación típica de la muestra y σ para la desviación típica de la población.
- Distribución binomial
- una variable aleatoria (RV) discreta que surge de ensayos de Bernoulli. Hay un número fijo, n, de ensayos independientes. “Independiente” significa que el resultado de cualquier ensayo (por ejemplo, el ensayo 1) no afecta los resultados de los ensayos siguientes, y que todos los ensayos se llevan a cabo en las mismas condiciones. En estas circunstancias, la RV binomial Χ se define como el número de aciertos en n ensayos. La notación es: X ~ B(n, p) μ = np y la desviación típica es . La probabilidad de obtener exactamente x aciertos en n ensayos es .
- Distribución normal
- una variable aleatoria (RV) continua con pdf , donde μ es la media de la distribución y σ es la desviación típica, notación: X ~ N(μ, σ). Si μ = 0 y σ = 1, la RV se denomina distribución normal estándar.
- Distribución t de Student
- investigado y presentado por William S. Gossett en 1908 y publicado bajo el seudónimo de Student. Las principales características de la variable aleatoria (RV) son
- Es continuo y asume cualquier valor real.
- La pdf es simétrica respecto a su media de cero. Sin embargo, tiene más dispersión y es más plana en el vértice que la distribución normal.
- Se aproxima a la distribución normal estándar a medida que n es mayor.
- Existe una "familia" de distribuciones t: cada representante de la familia está completamente definido por el número de grados de libertad, que es uno menos que el número de datos.
- Error de tipo I
- la decisión es rechazar la hipótesis nula cuando, de hecho, es verdadera.
- Error de tipo II
- la decisión es no rechazar la hipótesis nula cuando, de hecho, es falsa.
- Estadístico de prueba
- la fórmula que cuenta el número de desviaciones típicas en la distribución relevante en que el parámetro estimado se aleja del valor hipotético.
- Hipótesis
- una afirmación sobre el valor de un parámetro de la población, en caso de dos hipótesis, la afirmación que se supone verdadera se llama hipótesis nula (notación H0) y la afirmación contradictoria se llama hipótesis alternativa (notación Ha).
- Intervalo de confianza (IC)
- una estimación de intervalo para un parámetro poblacional desconocido. Esto depende de
- El nivel de confianza deseado.
- Información que se conoce sobre la distribución (por ejemplo, desviación típica conocida).
- La muestra y su tamaño.
- Prueba de hipótesis
- a partir de las pruebas de la muestra, un procedimiento para determinar si la hipótesis planteada es una afirmación razonable y no se debe rechazar, o es irrazonable y se debe rechazar.
- Teorema del límite central
- Dada una variable aleatoria (RV) con media conocida y la desviación típica conocida σ. Estamos muestreando con un tamaño n y nos interesan dos nuevas RV: la media muestral, . Si el tamaño n de la muestra es suficientemente grande, entonces . Si el tamaño n de la muestra es suficientemente grande, la distribución de las medias muestrales se aproximará a una distribución normal, independientemente de la forma de la población. El valor esperado de la media de las medias muestrales será igual a la media poblacional. La desviación típica de la distribución de las medias muestrales, , se denomina error estándar de la media.
- Valor crítico
- el valor t o Z fijado por el investigador que mide la probabilidad de un error de tipo I, α.