Glosario de Estadística Descriptiva: Frecuencias, Resúmenes Numéricos y Asociación de Variables
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 4,64 KB
Glosario de Estadística Descriptiva
Frecuencias
- Frecuencia absoluta de la categoría: Número de individuos o datos de la muestra con la característica o valor Ai.
- Frecuencia relativa de la categoría: Frecuencia absoluta dividida por el número total de observaciones (se puede expresar en porcentaje).
- Frecuencia absoluta acumulada de la categoría: Número de individuos que hay hasta la característica o valor Ai (inclusive).
- Frecuencia relativa acumulada de la característica o valor Ai: Frecuencia absoluta acumulada dividida entre el número total de observaciones (se puede expresar en porcentaje).
Soporte e Intervalos de Clase
- Soporte de la variable: (a,b), a = a0 < a1 < ··· < ak = b
- Intervalo de clase: Rango utilizado para dividir el conjunto de posibles valores numéricos. Cada clase tiene un extremo superior y uno inferior. Se suele incluir el extremo inferior, pero se excluye el superior (convención típica): [ai−1,ai)
- Extremos de clase: ai−1,ai
- Marca de clase: mi = ai−1+ai / 2
- Amplitud de clase: A = ai−ai−1
Resúmenes Numéricos
- Posición de la distribución: Media, Mediana, Moda, Cuartiles, Percentiles
- Dispersión de la distribución: Rango, Varianza, Desviación típica, Coeficiente de variación
- Forma de la distribución: Simetría y Kurtosis
Propiedades de la Media
- Es única.
- No tiene por qué ser un valor observado de la variable.
- En su cálculo intervienen todos los datos.
- Cambios de origen y escala en los datos yi = a+bxi, i = 1,2,...,n conllevan los mismos cambios en la media.
- La media de una suma es la suma de las medias. Sea (x1,x2,...,xn) −→X e (y1,y2,...,yn) −→Y (x1 +y1,x2 +y2,...,xn +yn) −→X+Y. Si la muestra está dividida en dos grupos, la media de la muestra es la media ponderada (por los tamaños de los grupos) de las medias.
- La suma de las desviaciones con respecto a la media es cero.
Propiedades de la Mediana
- Es única.
- En su cálculo no intervienen todos los datos.
- Siempre es un valor observado de la variable.
- Sea X con media X entonces...
Propiedades de la Moda
- No es única. Hay distribuciones con varias modas locales (bimodales o multimodales).
- Siempre es un valor observado de la variable.
- En su cálculo no intervienen todos los datos.
- Para variables continuas con datos agrupados, hablaremos de intervalo modal.
- Sea X con media X entonces...
Medidas de Posición No Centrales (Cuantiles)
Permiten dividir la distribución en un número definido de segmentos (cuantiles), facilitando la ubicación de orden de un sujeto o caso sobre un conjunto de los datos. Estas medidas requieren que exista un orden en las categorías de la variable, por lo que solo se pueden determinar a partir de la escala ordinal. Los cuantiles más comunes en el ámbito de la Estadística Aplicada a las Ciencias Sociales son: cuartiles, deciles y percentiles.
Cuartiles
Son los valores de la variable que dividen la distribución en cuatro partes iguales. Son, por tanto, tres puntos y se denotan como Q1, Q2 y Q3.
Deciles
Son las nueve marcas que fraccionan la distribución en diez partes iguales, conteniendo cada una de ellas la décima parte de las observaciones y se nombran como D1,D2,...,D8,D9.
Percentiles
Segmentan el conjunto de las observaciones en cien partes iguales y su notación se expresa como C1,...,C20,...,C99 ó P1,...,P20,...,P99.
Otras Medidas
- Rango: Diferencia entre el valor máximo y mínimo.
- Desigualdad de Chebychev: Relación media-desviación típica (X−k·SX, X+k·SX) contiene al menos el 100(1− 1 / k2)% de las observaciones.
Asociación entre Variables
- Asociación entre variables cualitativas o atributos: En este caso se utilizan tablas de contingencia o comparación de grupos respecto a una variable cualitativa.
- Asociación entre una variable numérica y una cualitativa: En este caso se realizan comparaciones entre grupos o subpoblaciones respecto a la variable numérica.
- Asociación entre variables cuantitativas: Se utiliza el análisis de regresión y de correlación.