Visualización de Datos Estadísticos: Métodos para Variables Cualitativas y Cuantitativas
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 6,56 KB
Representación de Datos Estadísticos: Tablas y Gráficos
Este documento detalla las metodologías para la representación tabular y gráfica de diferentes tipos de variables estadísticas, optimizando la visualización y comprensión de los datos.
Variables Cualitativas con Pocos Valores
Para variables cualitativas con un número limitado de categorías, la organización de los datos se realiza mediante tablas de frecuencias y diversas representaciones gráficas.
Tablas de Frecuencias
Las tablas de frecuencias para variables cualitativas se construyen ordenando las categorías de mayor a menor frecuencia. En sus columnas se presenta la frecuencia absoluta (número de veces que aparece un valor) y/o la frecuencia relativa (proporción de cada valor respecto al total).
- Valores: Representados como xi
- Frecuencia (absoluta): Denotada como ni
- Tamaño muestral: n = n1 + ... + nk = Σni
- Tamaño poblacional: N (utilizado en lugar de n para poblaciones)
- Frecuencia relativa: fi = ni / n (o fi = ni / N)
Representaciones Gráficas Habituales
Las representaciones gráficas más comunes para este tipo de variables son:
- Gráfico de Círculos (o de Sectores): Se utiliza para representar la frecuencia relativa de cada modalidad. Cada sector circular representa una categoría, y su tamaño es proporcional a la frecuencia relativa. El significado de cada sector debe aclararse mediante etiquetas o una leyenda.
- Gráfico de Columnas: Los valores de la variable se sitúan en el eje horizontal y las frecuencias (ya sean absolutas o relativas) en el eje vertical. Las columnas suelen ordenarse de mayor a menor frecuencia, disminuyendo de izquierda a derecha.
- Gráfico de Barras: Similar al de columnas, pero con los ejes invertidos. El eje horizontal representa las frecuencias (absolutas o relativas) y en el eje vertical se sitúan los valores de la variable, aumentando de abajo hacia arriba.
- Pictogramas: Se emplean cuando los valores pueden representarse con dibujos descriptivos. Es crucial que el área del dibujo, y no solo su altura, sea proporcional a la frecuencia. Debido a la posible imprecisión del dibujo, en un pictograma siempre se debe indicar explícitamente la frecuencia.
Variables Cualitativas con Muchos Valores
Cuando una variable cualitativa presenta un gran número de categorías, se recomienda agrupar todos los valores de menor frecuencia en una única clase denominada "otros casos" para simplificar la representación y mejorar la claridad.
Variables Ordinales y Cuantitativas Discretas con Pocos Valores
Para variables ordinales y cuantitativas discretas con un número reducido de valores, se aplican métodos similares a las cualitativas, con algunas adiciones en las tablas de frecuencias.
Tablas de Frecuencias
Además de las frecuencias absolutas y relativas, se pueden añadir las frecuencias acumuladas:
- Frecuencia (absoluta) acumulada: Ni = n1 + ... + ni (suma de las frecuencias absolutas hasta el valor i)
- Frecuencia relativa acumulada: Fi = f1 + ... + fi = Ni / n (suma de las frecuencias relativas hasta el valor i)
Representaciones Gráficas
Las representaciones gráficas más adecuadas son los gráficos de barras o de columnas. En el caso específico de las variables cuantitativas discretas, si existe un valor con frecuencia cero entre otros con frecuencia mayor que cero, se debe dejar su espacio vacío en el gráfico. Si la variable discreta tiene muchos valores distintos, es preferible agruparlos en intervalos, como si fuera una variable continua.
Variables Ordinales con Muchos Valores
Como paso previo a su representación, se agrupan los valores en clases razonables. Posteriormente, se procede como si la variable tuviera pocos valores. Es fundamental que las clases agrupadas respeten el orden implícito de la variable ordinal.
Variables Cuantitativas Discretas con Muchos Valores
Para variables cuantitativas discretas con un elevado número de valores distintos, el primer paso es agrupar estos valores en intervalos. Una vez agrupados, se procede con su representación como si se tratase de una variable continua.
Variables Cuantitativas Continuas
Las variables cuantitativas continuas requieren que sus valores sean agrupados en intervalos para su correcta representación. Se sugieren las siguientes recomendaciones para la creación de estos intervalos:
- Todos los intervalos deben tener la misma amplitud (anchura).
- Como referencia, se recomienda crear aproximadamente √n intervalos, donde n es el tamaño muestral.
- Si se pretende realizar inferencia estadística, es aconsejable tener al menos 5 observaciones en el 80% de los intervalos.
A partir de estos intervalos, se definen los siguientes conceptos:
- Intervalos: Representados como [li–1, li)
- Extremos de clase: li
- Amplitud (o anchura del intervalo): ai = li – li-1
- Marca de clase (punto medio del intervalo): xi = (li–1 + li) / 2
- Densidad o altura (cociente entre la frecuencia relativa y la amplitud del intervalo): hi = fi / ai (o también hi = ni / ai)
Representaciones Gráficas para Variables Continuas
Para variables continuas, se utiliza un eje de coordenadas. En el eje horizontal se representan los valores de la variable (agrupados en intervalos) y en el eje vertical se representa la densidad. El gráfico resultante es un histograma.