Conceptos Clave
Las Variables son características medibles que pueden tomar diferentes valores en una población o muestra. Las variables se clasifican en cuantitativas y cualitativas.
- Cuantitativas discretas: generalmente provienen de un conteo, son númerosenteros. (número de unidades producidas, cantidad de reclamos…)
- Cuantitativas continuas: pueden tomar valor dentro de un intervalo de númerosinfinitos reales, contiene cifras decimales. (peso, humedad, ph, distancia…).
Valores representativos que describen el centro de un conjunto de datos: media, mediana y moda.
Media o promedio aritmético

Es un conjunto de observaciones por medio de un valor individual que representa el “centro de gravedad” de los datos y es la suma de todas las observaciones divididas entre el número de observaciones. Fórmula:


Mediana (Me), percentil 50 o cuartil 2 Q2


El conjunto de observaciones se ordena de manera creciente, la mitad de las observaciones es menor o igual al valor de la mediana y la otra mitad es mayor o igual a la mediana.Si el conjunto de datos contiene un número impar de valores, la mediana es simplemente el valor que se encuentra en el medio del conjunto de datos ordenados.
Moda

La Moda, es el valor que ocurre con mayor frecuencia en el conjunto de datos. La moda se puede utilizar en conjunto con la media y mediana para ofrecer una caracterización general de la distribución de sus datos.La moda tiene poca aplicación para variables continuas, su uso apropiado es con variables cualitativas o atributos.
Media Geométrica

Se ocupa para calcular porcentajes a lo largo del tiempo.
La media geométrica es una medida de tendencia central que se utiliza principalmente cuando los datos representan tasas de crecimiento, rendimientos, proporciones o porcentajes acumulados a lo largo del tiempo. Es especialmente adecuada cuando los valores están relacionados de forma multiplicativa y no aditiva.
A diferencia de la media aritmética, la media geométrica considera el efecto compuesto de los cambios porcentuales, por lo que proporciona una medida más precisa del crecimiento promedio cuando existe variación en las tasas.
Se utiliza cuando una distribución puede tener n resultados.
Extensión de la binomial. Se utiliza cuando un ensayo individual puede tener más de dos (múltiples) resultados posibles.
Características principales:
- El número de ensayos es fijo (n).
- Cada ensayo es independiente.
- En cada ensayo sólo puede ocurrir una categoría.
- La suma de las probabilidades de todas las categorías es igual a 1.
Secuencia de n ensayos de Bernoulli independientes. Mide el número de éxitos en n repeticiones constantes.
Se ocupa cuando los ensayos son constantes e independientes entre sí.
Es una de las distribuciones discretas más utilizadas en estadística inferencial y teoría de probabilidad.
Características principal
- El número de ensayos (n) es fijo.
- Cada ensayo tiene únicamente dos posibles resultados: éxito o fracaso.
- La probabilidad de éxito (p) es constante en todos los ensayos.
- Los ensayos son independientes entre sí.
- La variable aleatoria cuenta el número total de éxitos obtenidos.
Se utiliza cuando sólo existen dos posibles resultados mutuamente excluyentes (éxito o fracaso) en un solo ensayo. Es la base teórica de la distribución binomial.
Representa el modelo probabilístico más simple dentro de las distribuciones discretas.
Características principales:
- Se realiza un solo ensayo.
- Existen dos resultados posibles.
- Se asigna una probabilidad p al éxito y (1 − p) al fracaso.
Es la diferencia entre el dato mayor y el dato menor de un conjunto de datos.Indica la amplitud total de los valores observados y proporciona una medida básica de dispersión.


Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Es la diferencia que hay entre cada uno de los datos y la media del conjunto de datos.
Permite observar cuánto se aleja cada valor individual respecto al promedio.
Es un índice que muestra cuánto se diferencia una puntuación común y la media de un grupo de puntuaciones. Mide el grado promedio en que los datos se dispersan respecto a la media.
Es una de las medidas de dispersión más utilizadas en estadística


Es la media del cuadrado de las desviaciones de la distribución de datos.
Representa una medida de dispersión que cuantifica la variabilidad del conjunto de datos elevando al cuadrado las diferencias respecto a la media.


Sirve para comparar conjuntos de datos respecto de la media en poblaciones o muestras.
Es una medida relativa de dispersión que expresa la desviación estándar como proporción de la media, lo que permite comparar la variabilidad entre diferentes conjuntos de datos, aun cuando estén expresados en distintas unidades.


Permite identificar si la distribución de los datos es simétrica o si presenta sesgo hacia valores mayores (asimetría positiva) o hacia valores menores (asimetría negativa).


Ayuda a observar qué tanto varía la curva respecto de la distribución de los datos que se acercan a la media. Mide el grado de concentración o apuntamiento de los datos alrededor de la media, indicando si la distribución es más plana o más puntiaguda en comparación con una distribución normal.


- La desviación es el punto de partida.
- La varianza es el promedio de las desviaciones al cuadrado.
- La desviación estándar es la raíz cuadrada de la varianza.
- El rango mide la amplitud total, pero no describe la dispersión interna.
- El coeficiente de variación mide dispersión relativa.
- La asimetría mide la dirección del sesgo.
- La curtosis mide la forma y concentración de la distribución.
