Conceptos Fundamentales de Estadística Descriptiva e Inferencia
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
español con un tamaño de 8,16 KB
Conceptos Fundamentales de Estadística
Variables Estadísticas
Existen dos tipos principales de variables:
- Variables Cuantitativas: Se miden numéricamente.
- Discretas: Toman valores contables (ej. número de hijos).
- Continuas: Pueden tomar cualquier valor dentro de un intervalo (ej. altura, peso).
- Variables Cualitativas: Describen atributos o categorías (ej. color de ojos).
Medidas de Centralización y Dispersión
Estas medidas resumen la información de un conjunto de datos:
- Media ($\bar{x}$ o $\mu$): Promedio aritmético.
- Moda: El valor que más se repite.
- Mediana (Med): El valor que ocupa la posición central al ordenar los datos.
- Rango Intercuartílico (RIC): Mide la dispersión del 50% central de los datos.
- Desviación Típica ($\sigma$ o $s$): Mide la dispersión promedio de los datos respecto a la media.
- Varianza ($\sigma^2$ o $s^2$): El cuadrado de la desviación típica.
- Valor Atípico (Outlier): Dato que se encuentra muy alejado del resto de la distribución.
Técnicas de Muestreo
- Población: Conjunto total de elementos a estudiar (todos los habitantes, por ejemplo).
- Muestra: Subconjunto representativo de la población (individuos seleccionados).
- Muestreo Aleatorio: Todos los individuos tienen la misma probabilidad de ser seleccionados (ej. muestreo aleatorio simple, muestreo sistemático).
- Muestreo por Conveniencia: Se seleccionan los individuos que son más fáciles de acceder para el investigador.
Nota sobre Valores Atípicos: Son valores que se dispersan demasiado del resultado obtenido y pueden "falsear los resultados" si no se manejan adecuadamente.
Representaciones Gráficas
- Histograma: Gráfico de barras donde los valores se agrupan en intervalos en el eje X y la frecuencia en el eje Y.
- Diagrama de Caja y Bigotes (Box Plot): Muestra visualmente el primer cuartil ($Q_1$), la mediana ($Q_2$), el tercer cuartil ($Q_3$) y el rango de los datos (bigotes).
- Frecuencia Acumulada: Gráfico creciente de línea que muestra la suma de las frecuencias hasta un punto dado.
Relación entre Variables
Nube de Puntos (Diagrama de Dispersión)
Permite visualizar la correlación:
- Fuerte: Puntos muy juntos.
- Débil: Puntos dispersos.
- Positiva: Relación creciente.
- Negativa: Relación decreciente.
- Incorrelada: Dispersión sin patrón claro.
- Puede ser Lineal o Curva.
Recta de Regresión
Se utiliza para estimar el valor de una variable conociendo la otra (ej. $\hat{Y}$ sobre $X$, $\hat{X}$ sobre $Y$).
Fundamentos de Probabilidad
Se relaciona con la Experiencia Aleatoria y sus Resultados.
- Espacio Muestral ($E$ o $\Omega$): Conjunto de todos los sucesos muestrales que pueden darse en una experiencia aleatoria (ej. para lanzar un dado, $E = \{1, 2, 3, 4, 5, 6\}$).
- Suceso: Un resultado específico (ej. lanzar un dado: 6 sucesos posibles).
Tipos de Sucesos
- Suceso Independiente: La ocurrencia de uno no afecta la probabilidad del otro (ej. lanzar una moneda dos veces).
- Suceso Dependiente: La ocurrencia de uno afecta la probabilidad del otro (ej. sacar bolas de una bolsa sin reemplazo: 4 rojas, 2 amarillas).
- Suceso Contrario ($\bar{A}$ o $A^c$): Aquel que cubre todos los resultados opuestos al suceso original $A$.
- Ejemplo al lanzar un dado: Si $A$ es "Número Par", $\bar{A}$ es "Número Impar".
Leyes y Fórmulas Básicas
Reglas de Probabilidad
- Suma de Probabilidad (Unión): $P(A \cup B) = P(A) + P(B) - P(A \cap B)$.
- Suceso Contrario: $P(\bar{A}) = 1 - P(A)$.
- Probabilidad Condicional: $P(A|B) = \frac{P(A \cap B)}{P(B)}$.
- Independencia: $P(A \cap B) = P(A) \cdot P(B)$.
Medidas de Dispersión (Resumen)
Incluyen: Rango, Rango Intercuartil (RIC), Varianza ($s^2$) y Desviación Típica ($s$). Se cumple que: $\text{Varianza} = (\text{Desviación Típica})^2$.
Fórmulas de Muestra
- Media de una muestra: $\bar{x} = \frac{\sum x_i}{n}$.
- Varianza muestral (sin sesgo): $s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$.
- Desviación Típica: $s = \sqrt{s^2}$.
- Mediana: El valor central (o promedio de los dos centrales) al ordenar los datos.
- Moda: Valor más frecuente.
Regla de Bayes
Probabilidad Condicional Inversa: $P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}$.
Distribución Binomial
Se usa para $n$ ensayos independientes con dos resultados posibles ($p$ éxito, $1-p$ fracaso).
- Fórmula de probabilidad puntual: $P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}$ para $k$ éxitos.
- Media: $E[X] = np$.
- Varianza: $Var(X) = np(1-p)$.
Valor Esperado (Esperanza Matemática)
Promedio ponderado de los valores posibles según su probabilidad. Para variables discretas: $E[X] = \sum x_i P(X=x_i)$.
Ejemplos Aplicados
Ejemplo 2 — Distribución Binomial (Probabilidad Puntual)
Situación: Lanzar 10 veces una moneda con $P(\text{Cara}) = 0.5$. ¿Cuál es la probabilidad de obtener exactamente 6 caras?
Se usa la fórmula binomial con $n=10$, $k=6$, $p=0.5$.
Recuerda: Media $E[X] = np = 5$; Varianza $Var(X) = np(1-p) = 2.5$.
Ejemplo 3 — Distribución Normal (Probabilidad Acumulada)
Supongamos $X \sim N(\mu=100, \sigma=15)$. ¿Cuál es la probabilidad de $P(X < 110)$?
- Convierte a puntuación Z: $Z = \frac{X - \mu}{\sigma} = \frac{110 - 100}{15} \approx 0.67$.
- Consulta Tabla Z o Calculadora: $P(Z < 0.67) \approx 0.7486$. Entonces $P(X < 110) \approx 74.86\%$. (En instituciones educativas se usan medios tecnológicos para estas consultas).
Ejemplo 4 — Probabilidad Condicional y Bayes (Clásico)
Contexto: Prueba médica. Prevalencia de enfermedad $P(E) = 0.01$. Sensibilidad (prueba positiva si enfermo) $P(+|E) = 0.95$. Falso positivo $P(+|\bar{E}) = 0.05$. ¿Probabilidad de estar enfermo si la prueba es positiva $P(E|+)$?
Se usa la Regla de Bayes:
$P(E|+) = \frac{P(+|E) \cdot P(E)}{P(+)}$
Calculamos el denominador (Probabilidad Total): $P(+) = P(+|E)P(E) + P(+|\bar{E})P(\bar{E})$
NUMERADOR = $0.95 \cdot 0.01 = 0.0095$.
DENOMINADOR = $0.0095 + (0.05 \cdot 0.99) = 0.0095 + 0.0495 = 0.059$.
RESULTADO: $P(E|+) = \frac{0.0095}{0.059} \approx 0.161 \rightarrow \sim 16.1\%$. Interpretación: A pesar de la buena prueba, con baja prevalencia la probabilidad posterior es relativamente baja.
Probabilidad de un Suceso
- $P(A) = \frac{\text{Número de casos favorables (A)}}{\text{Número total de casos posibles}}$.
Complementario
$P(\bar{A}) = 1 - P(A)$.
Sucesos Compuestos
Si son Mutuamente Excluyentes (no ocurren a la vez): $P(A \cup B) = P(A) + P(B)$.
Probabilidad Condicional
$P(A|B) = \frac{P(A \cap B)}{P(B)}$.
Independencia
Si $A$ y $B$ son independientes: $P(A \cap B) = P(A) \cdot P(B)$.
Valor Esperado (Esperanza Matemática)
Promedio ponderado de los valores posibles según su probabilidad.
Ejemplo 5 — Valor Esperado
Juego: Ganas $3 si sale cara ($P=0.5$), pierdes $2 si sale cruz ($P=0.5$).
$E[X] = (3 \cdot 0.5) + (-2 \cdot 0.5) = 1.5 - 1.0 = 0.5$.
Significa que en promedio ganas $0.50 por partida.