Conceptos Clave

Fundamentos estadísticos aplicados en este análisis

A través de distribuciones de frecuencia, medidas de tendencia central y visualizaciones gráficas, buscamos comprender los patrones y características de la población estudiada, aplicando conceptos fundamentales de la estadística descriptiva.

Las Variables son características medibles que pueden tomar diferentes valores en una población o muestra. Las variables se clasifican en cuantitativas y cualitativas.

Variables cuantitativas

Se traducen en cifras numéricas concretas que corresponde a la medición, su característica principal es que se pueden cuantificar.
Las variables cuantitativas se dividen en discretas y continuas:

Cuantitativas discretas: generalmente provienen de un conteo, son númerosenteros. (número de unidades producidas, cantidad de reclamos…)

Cuantitativas continuas: pueden tomar valor dentro de un intervalo de númerosinfinitos reales, contiene cifras decimales. (peso, humedad, ph, distancia…).

Variables cualitativas

Hechos o datos que no pueden ser cuantificados o contados con un instrumento de medición, son evaluados a través de los sentidos como la visión, el tacto, describen una característica calificable. Las unidades de muestra se clasifican en categorías y queda unidad pertenece a una sola categoría de esa variable, (color, sabor, textura).

Frecuencia absoluta (f):

Es el número de datos que caen dentro de un intervalo

Frecuencia relativa (fr)

Es la proporción de datos de cada intervalo respecto al total, se calcula de la siguiente manera.
𝑓𝑟 = 𝑓 / 𝑁
Donde N es el número de observaciones.

Valores representativos que describen el centro de un conjunto de datos: media, mediana y moda.

Media o promedio aritmético

Es un conjunto de observaciones por medio de un valor individual que representa el “centro de gravedad” de los datos y es la suma de todas las observaciones divididas entre el número de observaciones. Fórmula:

Mediana (Me), percentil 50 o cuartil 2 Q2

El conjunto de observaciones se ordena de manera creciente, la mitad de las observaciones es menor o igual al valor de la mediana y la otra mitad es mayor o igual a la mediana.Si el conjunto de datos contiene un número impar de valores, la mediana es simplemente el valor que se encuentra en el medio del conjunto de datos ordenados.

Moda

La Moda, es el valor que ocurre con mayor frecuencia en el conjunto de datos. La moda se puede utilizar en conjunto con la media y mediana para ofrecer una caracterización general de la distribución de sus datos.La moda tiene poca aplicación para variables continuas, su uso apropiado es con variables cualitativas o atributos.

Media Geométrica

Se ocupa para calcular porcentajes a lo largo del tiempo.

La media geométrica es una medida de tendencia central que se utiliza principalmente cuando los datos representan tasas de crecimiento, rendimientos, proporciones o porcentajes acumulados a lo largo del tiempo. Es especialmente adecuada cuando los valores están relacionados de forma multiplicativa y no aditiva.

A diferencia de la media aritmética, la media geométrica considera el efecto compuesto de los cambios porcentuales, por lo que proporciona una medida más precisa del crecimiento promedio cuando existe variación en las tasas.

Distribución de una Variable Aleatoria Discreta

Modelos matemáticos que utilizamos cuando las variables solo pueden tomar valores específicos para predecir el comportamiento de un sistema.

Se utiliza cuando una distribución puede tener n resultados.

Extensión de la binomial. Se utiliza cuando un ensayo individual puede tener más de dos (múltiples) resultados posibles.

Características principales:

El número de ensayos es fijo (n).
Cada ensayo es independiente.
En cada ensayo sólo puede ocurrir una categoría.
La suma de las probabilidades de todas las categorías es igual a 1.

Secuencia de n ensayos de Bernoulli independientes. Mide el número de éxitos en n repeticiones constantes.

Se ocupa cuando los ensayos son constantes e independientes entre sí.

Es una de las distribuciones discretas más utilizadas en estadística inferencial y teoría de probabilidad.

Características principal

El número de ensayos (n) es fijo.
Cada ensayo tiene únicamente dos posibles resultados: éxito o fracaso.
La probabilidad de éxito (p) es constante en todos los ensayos.
Los ensayos son independientes entre sí.
La variable aleatoria cuenta el número total de éxitos obtenidos.

Se utiliza cuando sólo existen dos posibles resultados mutuamente excluyentes (éxito o fracaso) en un solo ensayo. Es la base teórica de la distribución binomial.

Representa el modelo probabilístico más simple dentro de las distribuciones discretas.

Características principales:

Se realiza un solo ensayo.
Existen dos resultados posibles.
Se asigna una probabilidad p al éxito y (1 − p) al fracaso.

Medidas de Variabilidad o de Dispersión

Las medidas de variabilidad o dispersión permiten conocer qué tan dispersos o alejados están los datos respecto a un valor central dentro de un conjunto de datos.

Es la diferencia entre el dato mayor y el dato menor de un conjunto de datos.Indica la amplitud total de los valores observados y proporciona una medida básica de dispersión.

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Es la diferencia que hay entre cada uno de los datos y la media del conjunto de datos.

Permite observar cuánto se aleja cada valor individual respecto al promedio.

Es un índice que muestra cuánto se diferencia una puntuación común y la media de un grupo de puntuaciones. Mide el grado promedio en que los datos se dispersan respecto a la media.

Es una de las medidas de dispersión más utilizadas en estadística

Es la media del cuadrado de las desviaciones de la distribución de datos.

Representa una medida de dispersión que cuantifica la variabilidad del conjunto de datos elevando al cuadrado las diferencias respecto a la media.

Sirve para comparar conjuntos de datos respecto de la media en poblaciones o muestras.

Es una medida relativa de dispersión que expresa la desviación estándar como proporción de la media, lo que permite comparar la variabilidad entre diferentes conjuntos de datos, aun cuando estén expresados en distintas unidades.

Permite identificar si la distribución de los datos es simétrica o si presenta sesgo hacia valores mayores (asimetría positiva) o hacia valores menores (asimetría negativa).

Ayuda a observar qué tanto varía la curva respecto de la distribución de los datos que se acercan a la media. Mide el grado de concentración o apuntamiento de los datos alrededor de la media, indicando si la distribución es más plana o más puntiaguda en comparación con una distribución normal.

Relación Conceptual

La desviación es el punto de partida.
La varianza es el promedio de las desviaciones al cuadrado.
La desviación estándar es la raíz cuadrada de la varianza.
El rango mide la amplitud total, pero no describe la dispersión interna.
El coeficiente de variación mide dispersión relativa.
La asimetría mide la dirección del sesgo.
La curtosis mide la forma y concentración de la distribución.

Inicio

Análisis