Fundamentos Esenciales de Estadística: Variables, Gráficos y Distribuciones de Probabilidad
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 6,48 KB
Este documento presenta un resumen conciso de los conceptos fundamentales en estadística, abarcando desde la clasificación de variables y la representación gráfica de datos, hasta las medidas descriptivas clave y las distribuciones de probabilidad más comunes. Es una referencia esencial para comprender los pilares de la estadística.
Tipos de Variables Estadísticas
Las variables estadísticas se clasifican según la naturaleza de los datos que representan:
Variables Cualitativas o Atributos
- Nominal: No se pueden ordenar (ej. color de ojos, estado civil).
- Ordinal: Se pueden ordenar, pero las diferencias entre valores no son significativas (ej. nivel de estudios: primaria, secundaria, universidad).
Variables Cuantitativas
Representan cantidades numéricas y se dividen en:
- Discretas: Entre dos valores próximos, puede tomar solo un número finito de valores (ej. número de hijos, cantidad de coches).
- Continuas: Puede tomar infinitos valores en un intervalo dado (ej. altura, peso, temperatura).
Representaciones Gráficas de Datos
La visualización de datos es crucial para entender su distribución. Los gráficos varían según el tipo de variable:
Gráficos para Variables Cualitativas
- Diagrama de Rectángulos: Las alturas son proporcionales a las frecuencias.
- Diagrama de Sectores: El área de cada sector es proporcional a su frecuencia, ideal para mostrar proporciones de un todo.
Gráficos para Variables Cuantitativas
- Variables no agrupadas en intervalos: Se utiliza el Diagrama de Barras.
- Variables agrupadas en intervalos: Se utiliza el Histograma, donde el área de cada rectángulo corresponde a su frecuencia y la altura a la densidad de frecuencia.
Medidas Descriptivas en Estadística
Las medidas descriptivas resumen y caracterizan un conjunto de datos:
Medidas de Posición
Dan una idea general de dónde se sitúa la distribución de frecuencias sobre la recta real:
- Media Aritmética: El promedio de los datos.
- Media Geométrica: Útil para tasas de crecimiento o promedios de ratios.
- Mediana: El valor central de un conjunto de datos ordenado.
- Moda: El valor que aparece con mayor frecuencia.
- Cuantiles: Valores que dividen la distribución en partes iguales (ej. cuartiles, deciles, percentiles).
Medidas de Dispersión
Miden el grado de separación o variabilidad que existe entre los datos:
- Recorrido: La diferencia entre el valor máximo y mínimo.
- Varianza: El promedio de las desviaciones al cuadrado respecto a la media.
- Desviación Típica: La raíz cuadrada de la varianza, en las mismas unidades que los datos.
- Coeficiente de Variación: Mide la dispersión relativa, útil para comparar la variabilidad entre conjuntos de datos con diferentes medias.
Medidas de Concentración
Ponen de relieve el mayor o menor grado de igualdad en el reparto del total de los recursos:
- Índice de Gini (IG): Mide la desigualdad en la distribución de ingresos o riqueza.
- Curva de Lorenz: Representación gráfica de la distribución de la riqueza o ingresos.
Distribución de Bernoulli
Esta distribución se basa en experimentos aleatorios de Bernoulli, que son aquellos que dan lugar únicamente a dos posibles resultados: éxito (con probabilidad P) o fracaso (con probabilidad 1-P).
Su fórmula es:
P(X=k) = p^k * (1-p)^(1-k) para k ∈ {0, 1}
Características
- Función generatriz de momentos.
- Media E(X) = p
- Varianza = pq (donde q = 1-p)
Distribución Binomial
La distribución Binomial surge al repetir n veces un experimento de Bernoulli con probabilidad de éxito p, donde las repeticiones son independientes.
Variable aleatoria Binomial (X): Representa el número de éxitos que tienen lugar cuando se realizan n repeticiones independientes de un experimento de Bernoulli.
Su fórmula es:
P(X=k) = C(n, k) * p^k * (1-p)^(n-k)
Características
- La distribución de Bernoulli b(p) es un caso particular de la Binomial B(n,p), concretamente cuando n=1.
- Toda B(n,p) puede verse como un sumatorio donde X1, X2, ..., Xn son n variables aleatorias independientes, todas ellas b(p).
- Función generatriz de momentos.
- Media E(X) = np
- Varianza = npq (donde q = 1-p)
- Propiedad reproductiva.
Distribución de Poisson
La distribución de Poisson modela el número de acontecimientos independientes que ocurren a un ritmo constante sobre un intervalo de tiempo o espacio determinado.
Fórmula:
P(X=k) = (λ^k * e^(-λ)) / k!
Características
- Función generatriz de momentos.
- Media E(X) = λ (lambda)
- Varianza = λ (lambda)
- Propiedad reproductiva.
- Relación Binomial y Poisson: La distribución Binomial B(n,p) se aproxima a la distribución de Poisson P(λ=np) cuando n es grande y p es pequeña.
Distribución Uniforme
La distribución Uniforme describe una variable aleatoria continua donde todos los valores dentro de un intervalo dado [a, b] tienen la misma probabilidad de ocurrir.
Fórmula:
f(x) = 1 / (b-a) para a ≤ x ≤ b, y 0 en otro caso.
Características
- Función de distribución.
- Función generatriz de momentos.
- Media = (a+b)/2
- Varianza = (b-a)² / 12
Distribución Normal
La distribución Normal, también conocida como distribución Gaussiana, es una de las distribuciones más importantes en estadística debido a su frecuencia en fenómenos naturales y su papel central en el Teorema del Límite Central.
Fórmula:
f(x) = (1 / (σ * √(2π))) * e^(-(x-μ)² / (2σ²))
Características
- Función generatriz de momentos.
- Media = μ (mu)
- Varianza = σ² (sigma al cuadrado)
- Es simétrica respecto a su media.
- Propiedad reproductiva.