- Desviación típica
- un número que es igual a la raíz cuadrada de la varianza y que mide lo lejos que están los valores de los datos de su media; notación: s para la desviación típica de la muestra y σ para la desviación típica de la población.
- Distribución binomial
- una variable aleatoria (RV) discreta que surge de ensayos de Bernoulli. Hay un número fijo, n, de ensayos independientes. “Independiente” significa que el resultado de cualquier ensayo (por ejemplo, el ensayo 1) no afecta los resultados de los ensayos siguientes, y que todos los ensayos se llevan a cabo en las mismas condiciones. En estas circunstancias, la RV binomial Χ se define como el número de aciertos en n ensayos. La notación es: X ~ B(n, p) μ = np y la desviación típica es . La probabilidad de obtener exactamente x aciertos en n ensayos es .
- Distribución normal
- una variable aleatoria (RV) continua con pdf , donde μ es la media de la distribución y σ es la desviación típica, notación: X ~ N(μ, σ). Si μ = 0 y σ = 1, la RV se denomina distribución normal estándar.
- Distribución t de Student
- investigado y presentado por William S. Gossett en 1908 y publicado bajo el seudónimo de Student. Las principales características de la variable aleatoria (RV) son
- Es continuo y asume cualquier valor real.
- La pdf es simétrica respecto a su media de cero. Sin embargo, tiene más dispersión y es más plana en el vértice que la distribución normal.
- Se aproxima a la distribución normal estándar a medida que n es mayor.
- Existe una "familia" de distribuciones t: cada representante de la familia está completamente definido por el número de grados de libertad que es uno menos que el número de elementos de datos.
- Error de tipo 1
- la decisión es rechazar la hipótesis nula cuando, de hecho, es verdadera.
- Error de tipo 2
- la decisión es no rechazar la hipótesis nula cuando, de hecho, es falsa.
- Hipótesis
- una afirmación sobre el valor de un parámetro de la población, en caso de dos hipótesis, la afirmación que se supone verdadera se llama hipótesis nula (notación H0) y la afirmación contradictoria se llama hipótesis alternativa (notación Ha).
- Intervalo de confianza (IC)
- una estimación de intervalo para un parámetro poblacional desconocido. Esto depende de
- El nivel de confianza deseado.
- Información que se conoce sobre la distribución (por ejemplo, desviación típica conocida).
- La muestra y su tamaño.
- Nivel de significación de la prueba
- probabilidad de un error tipo I (rechazar la hipótesis nula cuando es verdadera). Notación: α. En las pruebas de hipótesis, el nivel de significación se denomina α preconcebido o α preestablecido.
- Prueba de hipótesis
- a partir de las pruebas de la muestra, un procedimiento para determinar si la hipótesis planteada es una afirmación razonable y no se debe rechazar, o es irrazonable y se debe rechazar.
- Teorema del límite central
- Dada una variable aleatoria (RV) con media conocida y la desviación típica conocida σ. Estamos muestreando con un tamaño n y nos interesan dos nuevas RV: la media muestral, , y la suma de la muestra, . Si el tamaño n de la muestra es suficientemente grande, entonces y . Si el tamaño n de la muestra es suficientemente grande, la distribución de las medias muestrales y la distribución de las sumas muestrales se aproximarán a una distribución normal, independientemente de la forma de la población. La media de las medias muestrales será igual a la media de la población, y la media de las sumas muestrales será igual a n veces la media de la población. La desviación típica de la distribución de las medias muestrales, , se denomina error estándar de la media.
- valor p
- la probabilidad de que un evento ocurra por pura casualidad, suponiendo que la hipótesis nula sea cierta. Cuanto menor sea el valor p, más fuerte es la evidencia contra la hipótesis nula.