Fundamentos Esenciales de Estadística: Variables, Frecuencias y Medidas de Centralización
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en
español con un tamaño de 3,98 KB
Conceptos Fundamentales de Estadística Descriptiva
A continuación, se definen los elementos básicos utilizados en cualquier estudio estadístico:
- Población: Todos los elementos que son objeto de estudio.
- Muestra: Parte de la población que se selecciona para el estudio.
- Individuo: Cada elemento de la población o de la muestra.
- Tamaño: Número de elementos que tiene la población o la muestra.
Variables Estadísticas
Las variables estadísticas son las características o cualidades que poseen los individuos de una población.
| Tipos | Propiedades | Ejemplos |
|---|---|---|
| Cualitativas | Los valores de la variable no son números, sino cualidades o atributos. |
|
| Cuantitativas | Los valores que toma la variable son números. |
|
| Discretas | En cada tramo, la variable solo puede tomar un número finito de valores. Ejemplo: Número de amigos. Entre 2 y 5 solo puedo tener 3 o 4 amigos, pero no 3,5 o 3,6. | |
| Continuas | La variable puede tomar tantos valores como queramos, por pequeño que sea el tramo. Ejemplo: Altura. Entre 1,70 m y 1,80 m de altura tenemos 1,71 m; 1,715 m; 1,767 m, etc. | |
Frecuencias Absoluta y Relativa
Frecuencia Absoluta ($f_i$)
La frecuencia absoluta de un dato, $x_i$, es el número de veces que aparece. Se representa por $f_i$. La suma de las frecuencias absolutas es igual al número total de datos, $N$.
Frecuencia Relativa ($h_i$)
La frecuencia relativa de un dato es el cociente entre su frecuencia absoluta, $f_i$, y el número total de datos, $N$. Se representa por $h_i$.
$$h_i = \frac{f_i}{N}$$
La suma de las frecuencias relativas es igual a la unidad (1).
Medidas de Centralización
Las medidas de centralización buscan un valor que represente el centro de la distribución de los datos.
Media Aritmética ($\bar{x}$)
Es el cociente de la suma de todos los valores multiplicados por su frecuencia, entre la suma de todas las frecuencias (el número total de datos, $N$).
$$\bar{x} = \frac{f_1 \cdot x_1 + f_2 \cdot x_2 + f_3 \cdot x_3 + \dots + f_n \cdot x_n}{N}$$
Si la variable es continua, $x_i$ es la marca de clase del intervalo.
Moda ($M_o$)
Es el valor de la variable (o la marca de clase para datos en intervalos) que tiene la mayor frecuencia absoluta.
Mediana ($M_e$)
Es el valor que ocupa la posición central de los datos después de ordenarlos. Si el número de datos es par, la mediana es la media de los dos valores centrales.
Medidas de Posición
Cuartiles ($Q_1, Q_2, Q_3$)
Los cuartiles son medidas que separan los datos en 4 partes iguales. Esto significa que en cada tramo se encuentra el 25% de los datos recogidos en el estudio.