Conceptos Fundamentales de Estadística Descriptiva e Inferencia

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 8,16 KB

Conceptos Fundamentales de Estadística

Variables Estadísticas

Existen dos tipos principales de variables:

  • Variables Cuantitativas: Se miden numéricamente.
    • Discretas: Toman valores contables (ej. número de hijos).
    • Continuas: Pueden tomar cualquier valor dentro de un intervalo (ej. altura, peso).
  • Variables Cualitativas: Describen atributos o categorías (ej. color de ojos).

Medidas de Centralización y Dispersión

Estas medidas resumen la información de un conjunto de datos:

  • Media ($\bar{x}$ o $\mu$): Promedio aritmético.
  • Moda: El valor que más se repite.
  • Mediana (Med): El valor que ocupa la posición central al ordenar los datos.
  • Rango Intercuartílico (RIC): Mide la dispersión del 50% central de los datos.
  • Desviación Típica ($\sigma$ o $s$): Mide la dispersión promedio de los datos respecto a la media.
  • Varianza ($\sigma^2$ o $s^2$): El cuadrado de la desviación típica.
  • Valor Atípico (Outlier): Dato que se encuentra muy alejado del resto de la distribución.

Técnicas de Muestreo

  • Población: Conjunto total de elementos a estudiar (todos los habitantes, por ejemplo).
  • Muestra: Subconjunto representativo de la población (individuos seleccionados).
  • Muestreo Aleatorio: Todos los individuos tienen la misma probabilidad de ser seleccionados (ej. muestreo aleatorio simple, muestreo sistemático).
  • Muestreo por Conveniencia: Se seleccionan los individuos que son más fáciles de acceder para el investigador.

Nota sobre Valores Atípicos: Son valores que se dispersan demasiado del resultado obtenido y pueden "falsear los resultados" si no se manejan adecuadamente.

Representaciones Gráficas

  • Histograma: Gráfico de barras donde los valores se agrupan en intervalos en el eje X y la frecuencia en el eje Y.
  • Diagrama de Caja y Bigotes (Box Plot): Muestra visualmente el primer cuartil ($Q_1$), la mediana ($Q_2$), el tercer cuartil ($Q_3$) y el rango de los datos (bigotes).
  • Frecuencia Acumulada: Gráfico creciente de línea que muestra la suma de las frecuencias hasta un punto dado.

Relación entre Variables

Nube de Puntos (Diagrama de Dispersión)

Permite visualizar la correlación:

  • Fuerte: Puntos muy juntos.
  • Débil: Puntos dispersos.
  • Positiva: Relación creciente.
  • Negativa: Relación decreciente.
  • Incorrelada: Dispersión sin patrón claro.
  • Puede ser Lineal o Curva.

Recta de Regresión

Se utiliza para estimar el valor de una variable conociendo la otra (ej. $\hat{Y}$ sobre $X$, $\hat{X}$ sobre $Y$).

Fundamentos de Probabilidad

Se relaciona con la Experiencia Aleatoria y sus Resultados.

  • Espacio Muestral ($E$ o $\Omega$): Conjunto de todos los sucesos muestrales que pueden darse en una experiencia aleatoria (ej. para lanzar un dado, $E = \{1, 2, 3, 4, 5, 6\}$).
  • Suceso: Un resultado específico (ej. lanzar un dado: 6 sucesos posibles).

Tipos de Sucesos

  • Suceso Independiente: La ocurrencia de uno no afecta la probabilidad del otro (ej. lanzar una moneda dos veces).
  • Suceso Dependiente: La ocurrencia de uno afecta la probabilidad del otro (ej. sacar bolas de una bolsa sin reemplazo: 4 rojas, 2 amarillas).
  • Suceso Contrario ($\bar{A}$ o $A^c$): Aquel que cubre todos los resultados opuestos al suceso original $A$.
    • Ejemplo al lanzar un dado: Si $A$ es "Número Par", $\bar{A}$ es "Número Impar".

Leyes y Fórmulas Básicas

Reglas de Probabilidad

  • Suma de Probabilidad (Unión): $P(A \cup B) = P(A) + P(B) - P(A \cap B)$.
  • Suceso Contrario: $P(\bar{A}) = 1 - P(A)$.
  • Probabilidad Condicional: $P(A|B) = \frac{P(A \cap B)}{P(B)}$.
  • Independencia: $P(A \cap B) = P(A) \cdot P(B)$.

Medidas de Dispersión (Resumen)

Incluyen: Rango, Rango Intercuartil (RIC), Varianza ($s^2$) y Desviación Típica ($s$). Se cumple que: $\text{Varianza} = (\text{Desviación Típica})^2$.

Fórmulas de Muestra

  • Media de una muestra: $\bar{x} = \frac{\sum x_i}{n}$.
  • Varianza muestral (sin sesgo): $s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$.
  • Desviación Típica: $s = \sqrt{s^2}$.
  • Mediana: El valor central (o promedio de los dos centrales) al ordenar los datos.
  • Moda: Valor más frecuente.

Regla de Bayes

Probabilidad Condicional Inversa: $P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}$.

Distribución Binomial

Se usa para $n$ ensayos independientes con dos resultados posibles ($p$ éxito, $1-p$ fracaso).

  • Fórmula de probabilidad puntual: $P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}$ para $k$ éxitos.
  • Media: $E[X] = np$.
  • Varianza: $Var(X) = np(1-p)$.

Valor Esperado (Esperanza Matemática)

Promedio ponderado de los valores posibles según su probabilidad. Para variables discretas: $E[X] = \sum x_i P(X=x_i)$.

Ejemplos Aplicados

Ejemplo 2 — Distribución Binomial (Probabilidad Puntual)

Situación: Lanzar 10 veces una moneda con $P(\text{Cara}) = 0.5$. ¿Cuál es la probabilidad de obtener exactamente 6 caras?

Se usa la fórmula binomial con $n=10$, $k=6$, $p=0.5$.

Recuerda: Media $E[X] = np = 5$; Varianza $Var(X) = np(1-p) = 2.5$.

Ejemplo 3 — Distribución Normal (Probabilidad Acumulada)

Supongamos $X \sim N(\mu=100, \sigma=15)$. ¿Cuál es la probabilidad de $P(X < 110)$?

  1. Convierte a puntuación Z: $Z = \frac{X - \mu}{\sigma} = \frac{110 - 100}{15} \approx 0.67$.
  2. Consulta Tabla Z o Calculadora: $P(Z < 0.67) \approx 0.7486$. Entonces $P(X < 110) \approx 74.86\%$. (En instituciones educativas se usan medios tecnológicos para estas consultas).

Ejemplo 4 — Probabilidad Condicional y Bayes (Clásico)

Contexto: Prueba médica. Prevalencia de enfermedad $P(E) = 0.01$. Sensibilidad (prueba positiva si enfermo) $P(+|E) = 0.95$. Falso positivo $P(+|\bar{E}) = 0.05$. ¿Probabilidad de estar enfermo si la prueba es positiva $P(E|+)$?

Se usa la Regla de Bayes:

$P(E|+) = \frac{P(+|E) \cdot P(E)}{P(+)}$

Calculamos el denominador (Probabilidad Total): $P(+) = P(+|E)P(E) + P(+|\bar{E})P(\bar{E})$

NUMERADOR = $0.95 \cdot 0.01 = 0.0095$.

DENOMINADOR = $0.0095 + (0.05 \cdot 0.99) = 0.0095 + 0.0495 = 0.059$.

RESULTADO: $P(E|+) = \frac{0.0095}{0.059} \approx 0.161 \rightarrow \sim 16.1\%$. Interpretación: A pesar de la buena prueba, con baja prevalencia la probabilidad posterior es relativamente baja.

Probabilidad de un Suceso

  • $P(A) = \frac{\text{Número de casos favorables (A)}}{\text{Número total de casos posibles}}$.

Complementario

$P(\bar{A}) = 1 - P(A)$.

Sucesos Compuestos

Si son Mutuamente Excluyentes (no ocurren a la vez): $P(A \cup B) = P(A) + P(B)$.

Probabilidad Condicional

$P(A|B) = \frac{P(A \cap B)}{P(B)}$.

Independencia

Si $A$ y $B$ son independientes: $P(A \cap B) = P(A) \cdot P(B)$.

Valor Esperado (Esperanza Matemática)

Promedio ponderado de los valores posibles según su probabilidad.

Ejemplo 5 — Valor Esperado

Juego: Ganas $3 si sale cara ($P=0.5$), pierdes $2 si sale cruz ($P=0.5$).

$E[X] = (3 \cdot 0.5) + (-2 \cdot 0.5) = 1.5 - 1.0 = 0.5$.

Significa que en promedio ganas $0.50 por partida.

Entradas relacionadas: