Glosario de Estadística Descriptiva: Frecuencias, Resúmenes Numéricos y Asociación de Variables

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 4,64 KB

Glosario de Estadística Descriptiva

Frecuencias

  • Frecuencia absoluta de la categoría: Número de individuos o datos de la muestra con la característica o valor Ai.
  • Frecuencia relativa de la categoría: Frecuencia absoluta dividida por el número total de observaciones (se puede expresar en porcentaje).
  • Frecuencia absoluta acumulada de la categoría: Número de individuos que hay hasta la característica o valor Ai (inclusive).
  • Frecuencia relativa acumulada de la característica o valor Ai: Frecuencia absoluta acumulada dividida entre el número total de observaciones (se puede expresar en porcentaje).

Soporte e Intervalos de Clase

  • Soporte de la variable: (a,b), a = a0 < a1 < ··· < ak = b
  • Intervalo de clase: Rango utilizado para dividir el conjunto de posibles valores numéricos. Cada clase tiene un extremo superior y uno inferior. Se suele incluir el extremo inferior, pero se excluye el superior (convención típica): [ai−1,ai)
  • Extremos de clase: ai−1,ai
  • Marca de clase: mi = ai−1+ai / 2
  • Amplitud de clase: A = ai−ai−1

Resúmenes Numéricos

  • Posición de la distribución: Media, Mediana, Moda, Cuartiles, Percentiles
  • Dispersión de la distribución: Rango, Varianza, Desviación típica, Coeficiente de variación
  • Forma de la distribución: Simetría y Kurtosis

Propiedades de la Media

  • Es única.
  • No tiene por qué ser un valor observado de la variable.
  • En su cálculo intervienen todos los datos.
  • Cambios de origen y escala en los datos yi = a+bxi, i = 1,2,...,n conllevan los mismos cambios en la media.
  • La media de una suma es la suma de las medias. Sea (x1,x2,...,xn) −→X e (y1,y2,...,yn) −→Y (x1 +y1,x2 +y2,...,xn +yn) −→X+Y. Si la muestra está dividida en dos grupos, la media de la muestra es la media ponderada (por los tamaños de los grupos) de las medias.
  • La suma de las desviaciones con respecto a la media es cero.

Propiedades de la Mediana

  • Es única.
  • En su cálculo no intervienen todos los datos.
  • Siempre es un valor observado de la variable.
  • Sea X con media X entonces...

Propiedades de la Moda

  • No es única. Hay distribuciones con varias modas locales (bimodales o multimodales).
  • Siempre es un valor observado de la variable.
  • En su cálculo no intervienen todos los datos.
  • Para variables continuas con datos agrupados, hablaremos de intervalo modal.
  • Sea X con media X entonces...

Medidas de Posición No Centrales (Cuantiles)

Permiten dividir la distribución en un número definido de segmentos (cuantiles), facilitando la ubicación de orden de un sujeto o caso sobre un conjunto de los datos. Estas medidas requieren que exista un orden en las categorías de la variable, por lo que solo se pueden determinar a partir de la escala ordinal. Los cuantiles más comunes en el ámbito de la Estadística Aplicada a las Ciencias Sociales son: cuartiles, deciles y percentiles.

Cuartiles

Son los valores de la variable que dividen la distribución en cuatro partes iguales. Son, por tanto, tres puntos y se denotan como Q1, Q2 y Q3.

Deciles

Son las nueve marcas que fraccionan la distribución en diez partes iguales, conteniendo cada una de ellas la décima parte de las observaciones y se nombran como D1,D2,...,D8,D9.

Percentiles

Segmentan el conjunto de las observaciones en cien partes iguales y su notación se expresa como C1,...,C20,...,C99 ó P1,...,P20,...,P99.

Otras Medidas

  • Rango: Diferencia entre el valor máximo y mínimo.
  • Desigualdad de Chebychev: Relación media-desviación típica (X−k·SX, X+k·SX) contiene al menos el 100(1− 1 / k2)% de las observaciones.

Asociación entre Variables

  • Asociación entre variables cualitativas o atributos: En este caso se utilizan tablas de contingencia o comparación de grupos respecto a una variable cualitativa.
  • Asociación entre una variable numérica y una cualitativa: En este caso se realizan comparaciones entre grupos o subpoblaciones respecto a la variable numérica.
  • Asociación entre variables cuantitativas: Se utiliza el análisis de regresión y de correlación.

Entradas relacionadas: