Conceptos Fundamentales de Estadística Descriptiva: Visualización y Medidas
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 4,9 KB
Histogramas
Los histogramas se utilizan para representar variables continuas. Se dibujan rectángulos pegados, donde la base es el intervalo y la altura, la densidad. De esta forma, tenemos la siguiente propiedad:
Propiedad de Proporcionalidad
El área de todo el histograma es 1 (o 100%), y el área por encima de un intervalo indica el porcentaje aproximado de individuos en la población/muestra que toman valores dentro de ese intervalo.
Cuando los intervalos son de igual longitud, también se utiliza la frecuencia en lugar de la densidad.
Polígono de Frecuencias
Es una versión suavizada del histograma. Se dibuja un punto por cada intervalo. El eje horizontal indica la marca de clase y el eje vertical, la densidad. Se deben añadir dos intervalos de densidad cero en cada extremo de la tabla de frecuencias. La amplitud debe ser la misma para todos los intervalos. (Nota: en el dibujo solo aparece la línea del borde)
Área de Frecuencias
Representa el área que delimita el polígono de frecuencias. Su elaboración e interpretación son idénticas a las del polígono de frecuencias. (Nota: el dibujo está todo cubierto de pintura)
Series Temporales
Las series temporales representan cantidades que varían a lo largo del tiempo.
Gráficos de Líneas y Puntos
En un eje de coordenadas, en el eje horizontal representamos el tiempo y en el eje vertical, los valores de la serie. En los gráficos de líneas y puntos es habitual representar varias series temporales.
Medidas de Posición, Dispersión y Forma
Estas medidas nos ayudan a entender:
- Posición: ¿Dónde están los datos?
- Dispersión: ¿Cuál es la variabilidad de los datos?
- Forma: ¿Cómo se comportan los datos fuera del centro?
Conceptos Clave en Estadística
Parámetro: Cantidad numérica que se obtiene a partir de los datos de la población. Por ejemplo, el porcentaje de fumadores en una población.
Estadístico: Cantidad numérica que se obtiene a partir de los datos de una muestra. Por ejemplo, el porcentaje de fumadores en una muestra.
Estimador: Estadístico que se usa para estimar un parámetro.
Coeficiente de Variación (CV)
El coeficiente de variación (CV) se calcula como la desviación típica / media. Sus propiedades son:
- Es independiente de cambios de escala.
- No tiene unidades (se expresa en tanto por ciento).
- Solo puede utilizarse en variables de escala de razón.
- Sirve para comparar la dispersión de distintas variables.
- Puede utilizarse el siguiente criterio:
- CV entre 0% y 30%: Poca dispersión. La media es representativa.
- CV entre 30% y 100%: Bastante dispersión. La media es poco representativa.
- CV mayor del 100%: Mucha dispersión. La media no es representativa.
Coeficiente de Asimetría de Fisher (g1)
El coeficiente de asimetría de Fisher (g1) se calcula a partir del promedio de las desviaciones al cubo con respecto a la media.
Propiedades de los Coeficientes de Asimetría: Pearson, Bowley y g1
- P y B pueden no existir.
- Solo tienen sentido cuando la representación gráfica de la variable tiene forma de campana.
- No tienen unidades (se expresan en tanto por ciento).
- Si la variable es asimétrica positiva, son positivos.
- Si la variable es asimétrica negativa, son negativos.
- Si la variable es simétrica, son cero.
- Pueden ser cero aunque la variable no sea simétrica.
Curtosis
La curtosis indica el comportamiento de los elementos más alejados del promedio. Si dos variables cuantitativas tienen parecida media, desviación típica, asimetría y curtosis, entonces la mayoría de las veces serán muy parecidas en el resto de propiedades, sin necesidad de calcular más medidas.
- Leptocúrtica: > 0 (mayor concentración en el centro y colas más pesadas)
- Mesocúrtica: = 0 (distribución normal)
- Platicúrtica: < 0 (menor concentración en el centro y colas más ligeras)