Resumen de Fórmulas y Conceptos Clave en Estadística Descriptiva e Inferencial

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 146,48 KB

Resumen de Conceptos Fundamentales en Estadística

Medidas de Tendencia Central y Dispersión

  • Media ($\bar{x}$): Suma todos los datos dividida por la cantidad de datos ($n$).
  • Varianza ($\sigma^2$): Se calcula como $\frac{\sum (x_i - \bar{x})^2}{n}$.
  • Desviación Estándar ($\sigma$): Es la raíz cuadrada de la varianza.
  • Coeficiente de Variación (CV): Se define como $\left( \frac{\text{Desviación}}{\text{Media}} \right) \times 100\%$. Se utiliza para comparar la dispersión entre conjuntos de datos con medias muy diferentes. Un CV menor indica mayor homogeneidad.

Tablas de Contingencia y Relación entre Variables

Cálculos Básicos

  • Totales: Suma de filas y columnas.

Prueba de Independencia

Se verifica si la frecuencia observada en una celda es igual a la frecuencia esperada bajo el supuesto de independencia:

$$\frac{\text{Frecuencia Celda}}{\text{Total General}} = \frac{\text{Total Fila}}{\text{Total General}} \times \frac{\text{Total Columna}}{\text{Total General}}$$

Si no son iguales, se concluye que $\rightarrow$ HAY RELACIÓN entre las variables.

Transformación Lineal ($Y = a + bX$)

Si una variable $X$ se transforma linealmente a $Y$:

  • Media de $Y$: $E[Y] = a + b \times E[X]$.
  • Desviación Estándar de $Y$: $\sigma_Y = |b| \times \sigma_X$.
  • Comparar dispersión: Se recomienda usar el Coeficiente de Variación (CV). Un menor CV implica que el conjunto de datos es más homogéneo.

Probabilidad: Unión, Intersección y Condicional

Sean $A$ y $B$ dos eventos:

  • Unión: $P(A \cup B) = P(A) + P(B) - P(A \cap B)$.
  • Intersección: $P(A \cap B) = P(A) + P(B) - P(A \cup B)$.
  • Condicional: $P(A|B) = \frac{P(A \cap B)}{P(B)}$, asumiendo $P(B) > 0$.
  • Independencia: Son independientes si $P(A \cap B) = P(A) \times P(B)$.

Diagrama de Caja (Box Plot) - Interpretación Rápida

Elementos Clave

  • Línea central: Representa la Mediana ($Q_2$).
  • Extremos de la caja: $Q_1$ (Percentil 25%) y $Q_3$ (Percentil 75%).
  • Bigotes: Se extienden hasta $1.5 \times \text{IQR}$, donde $\text{IQR} = Q_3 - Q_1$.
  • Puntos fuera: Indican valores atípicos (outliers).

Ejemplo de Interpretación de Asimetría

El diagrama muestra asimetría a la derecha (sesgo positivo) si:

  1. La mediana está más cerca de $Q_1$.
  2. El bigote derecho es más largo que el izquierdo.
  3. Hay puntos atípicos solo por encima del bigote superior.

$\rightarrow$ Esto significa que hay pocos valores muy altos que 'estiran' la distribución hacia la derecha.

Distribución de Poisson

Se utiliza para modelar el número de ocurrencias de un evento en un intervalo fijo de tiempo o espacio, dado un promedio conocido ($\lambda$).

Ejemplo Práctico

Si pasan en promedio 480 coches/hora $\rightarrow$ $\lambda = \frac{480}{60} = 8$ coches/minuto. ¿Cuál es la probabilidad de colapso si pasan $>5$ coches/minuto?

  1. Identificar $\lambda$ (tasa promedio por intervalo): $\lambda = 8$ coches/minuto.
  2. Formular la pregunta probabilística: Queremos $P(X > 5)$ donde $X \sim \text{Poisson}(\lambda=8)$.
  3. Usar complemento: $P(X > 5) = 1 - P(X \le 5)$.
  4. Calcular $P(X \le 5)$ usando la tabla de Poisson ($\lambda=8$): En tabla, $P(X \le 5) = 0.1912$ (valor acumulado hasta 5).
  5. Resultado: $P(X > 5) = 1 - 0.1912 = \mathbf{0.8088}$ (80.88% de probabilidad de colapso).

Distribución Normal

Uso y Características

  • Cuándo se usa: Para modelar datos continuos que presentan una forma de campana (ej. alturas, pesos, tiempos de reacción).
  • Parámetros: Media ($\mu$) y Desviación Estándar ($\sigma$).

Ejemplo y Estandarización

Ejemplo: "Tiempo de reparación $\sim N(\mu=3h, \sigma=2h)$. ¿$P(X < 1h)$?"

Pasos:

1. Estandarizar (Calcular la puntuación $Z$):

3vvOKaREqsxAAAAAElFTkSuQmCC

Donde $Z = \frac{X - \mu}{\sigma}$.

Teorema Central del Límite (TCL)

Aplicación

  • Cuándo se usa: Cuando se trabaja con la suma o el promedio de muchas variables aleatorias independientes, incluso si la distribución original de las variables no es normal.

Ejemplo de Suma

Ejemplo: "70 personas juegan en promedio 6h/semana con $\sigma=1.5h$. ¿Probabilidad de que en total jueguen $>400h$?"

Pasos:

  1. Definir la suma: $S = T_1 + T_2 + \dots + T_{70}$.
  2. Calcular media y varianza de la suma:

nFMAAAAASUVORK5CYII=

Luego, se aplica la aproximación Normal a la suma $S \sim N(\mu_S, \sigma_S^2)$.

Clasificación de Variables - Ejemplos Prácticos

Ejercicio típico: Clasifica estas variables para coches aparcados:

  • Fabricante y modelo: $\rightarrow$ Cualitativa Nominal (categorías sin orden intrínseco).
  • Etiqueta medioambiental (B, C, ECO): $\rightarrow$ Cualitativa Ordinal (categorías con orden jerárquico).
  • Nº máximo de ocupantes: $\rightarrow$ Cuantitativa Discreta (solo valores enteros contables: 2, 5, 7...).
  • Peso del vehículo: $\rightarrow$ Cuantitativa Continua (puede tomar cualquier valor dentro de un rango: 1450.5 kg, 1890.3 kg...).

Entradas relacionadas: