Resumen de Fórmulas y Conceptos Clave en Estadística Descriptiva e Inferencial
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
español con un tamaño de 146,48 KB
Resumen de Conceptos Fundamentales en Estadística
Medidas de Tendencia Central y Dispersión
- Media ($\bar{x}$): Suma todos los datos dividida por la cantidad de datos ($n$).
- Varianza ($\sigma^2$): Se calcula como $\frac{\sum (x_i - \bar{x})^2}{n}$.
- Desviación Estándar ($\sigma$): Es la raíz cuadrada de la varianza.
- Coeficiente de Variación (CV): Se define como $\left( \frac{\text{Desviación}}{\text{Media}} \right) \times 100\%$. Se utiliza para comparar la dispersión entre conjuntos de datos con medias muy diferentes. Un CV menor indica mayor homogeneidad.
Tablas de Contingencia y Relación entre Variables
Cálculos Básicos
- Totales: Suma de filas y columnas.
Prueba de Independencia
Se verifica si la frecuencia observada en una celda es igual a la frecuencia esperada bajo el supuesto de independencia:
$$\frac{\text{Frecuencia Celda}}{\text{Total General}} = \frac{\text{Total Fila}}{\text{Total General}} \times \frac{\text{Total Columna}}{\text{Total General}}$$
Si no son iguales, se concluye que $\rightarrow$ HAY RELACIÓN entre las variables.
Transformación Lineal ($Y = a + bX$)
Si una variable $X$ se transforma linealmente a $Y$:
- Media de $Y$: $E[Y] = a + b \times E[X]$.
- Desviación Estándar de $Y$: $\sigma_Y = |b| \times \sigma_X$.
- Comparar dispersión: Se recomienda usar el Coeficiente de Variación (CV). Un menor CV implica que el conjunto de datos es más homogéneo.
Probabilidad: Unión, Intersección y Condicional
Sean $A$ y $B$ dos eventos:
- Unión: $P(A \cup B) = P(A) + P(B) - P(A \cap B)$.
- Intersección: $P(A \cap B) = P(A) + P(B) - P(A \cup B)$.
- Condicional: $P(A|B) = \frac{P(A \cap B)}{P(B)}$, asumiendo $P(B) > 0$.
- Independencia: Son independientes si $P(A \cap B) = P(A) \times P(B)$.
Diagrama de Caja (Box Plot) - Interpretación Rápida
Elementos Clave
- Línea central: Representa la Mediana ($Q_2$).
- Extremos de la caja: $Q_1$ (Percentil 25%) y $Q_3$ (Percentil 75%).
- Bigotes: Se extienden hasta $1.5 \times \text{IQR}$, donde $\text{IQR} = Q_3 - Q_1$.
- Puntos fuera: Indican valores atípicos (outliers).
Ejemplo de Interpretación de Asimetría
El diagrama muestra asimetría a la derecha (sesgo positivo) si:
- La mediana está más cerca de $Q_1$.
- El bigote derecho es más largo que el izquierdo.
- Hay puntos atípicos solo por encima del bigote superior.
$\rightarrow$ Esto significa que hay pocos valores muy altos que 'estiran' la distribución hacia la derecha.
Distribución de Poisson
Se utiliza para modelar el número de ocurrencias de un evento en un intervalo fijo de tiempo o espacio, dado un promedio conocido ($\lambda$).
Ejemplo Práctico
Si pasan en promedio 480 coches/hora $\rightarrow$ $\lambda = \frac{480}{60} = 8$ coches/minuto. ¿Cuál es la probabilidad de colapso si pasan $>5$ coches/minuto?
- Identificar $\lambda$ (tasa promedio por intervalo): $\lambda = 8$ coches/minuto.
- Formular la pregunta probabilística: Queremos $P(X > 5)$ donde $X \sim \text{Poisson}(\lambda=8)$.
- Usar complemento: $P(X > 5) = 1 - P(X \le 5)$.
- Calcular $P(X \le 5)$ usando la tabla de Poisson ($\lambda=8$): En tabla, $P(X \le 5) = 0.1912$ (valor acumulado hasta 5).
- Resultado: $P(X > 5) = 1 - 0.1912 = \mathbf{0.8088}$ (80.88% de probabilidad de colapso).
Distribución Normal
Uso y Características
- Cuándo se usa: Para modelar datos continuos que presentan una forma de campana (ej. alturas, pesos, tiempos de reacción).
- Parámetros: Media ($\mu$) y Desviación Estándar ($\sigma$).
Ejemplo y Estandarización
Ejemplo: "Tiempo de reparación $\sim N(\mu=3h, \sigma=2h)$. ¿$P(X < 1h)$?"
Pasos:
1. Estandarizar (Calcular la puntuación $Z$):
Donde $Z = \frac{X - \mu}{\sigma}$.
Teorema Central del Límite (TCL)
Aplicación
- Cuándo se usa: Cuando se trabaja con la suma o el promedio de muchas variables aleatorias independientes, incluso si la distribución original de las variables no es normal.
Ejemplo de Suma
Ejemplo: "70 personas juegan en promedio 6h/semana con $\sigma=1.5h$. ¿Probabilidad de que en total jueguen $>400h$?"
Pasos:
- Definir la suma: $S = T_1 + T_2 + \dots + T_{70}$.
- Calcular media y varianza de la suma:
Luego, se aplica la aproximación Normal a la suma $S \sim N(\mu_S, \sigma_S^2)$.
Clasificación de Variables - Ejemplos Prácticos
Ejercicio típico: Clasifica estas variables para coches aparcados:
- Fabricante y modelo: $\rightarrow$ Cualitativa Nominal (categorías sin orden intrínseco).
- Etiqueta medioambiental (B, C, ECO): $\rightarrow$ Cualitativa Ordinal (categorías con orden jerárquico).
- Nº máximo de ocupantes: $\rightarrow$ Cuantitativa Discreta (solo valores enteros contables: 2, 5, 7...).
- Peso del vehículo: $\rightarrow$ Cuantitativa Continua (puede tomar cualquier valor dentro de un rango: 1450.5 kg, 1890.3 kg...).