Estadística Descriptiva: Comprendiendo Variables, Escalas de Medición y Distribuciones de Frecuencias

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 159,31 KB

Estadística Descriptiva

La estadística descriptiva busca visualizar el comportamiento de las variables a través de:

  • Tablas
  • Gráficos
  • Medidas de resumen

¿Qué es una Variable?

Una variable es toda característica o atributo susceptible de ser medido o categorizado en los elementos de un estudio. Su medición puede realizarse en números (variables cuantitativas) o en categorías (variables cualitativas).

Se denomina variable porque, aunque se puedan prever los valores posibles que puede tomar (conformando el espacio muestral), el valor observado en un momento dado para un individuo, grupo, comunidad o población específica es cambiante o puede variar.

Clasificación de las Variables

Las variables se pueden clasificar según diversos criterios:

1. Según su naturaleza:

Variables Cualitativas

Expresan una cualidad o atributo no numérico del individuo de estudio. Sus valores son categorías.

  • Nominales: Categorías que no implican un orden.
    • Dicotómicas (o binarias): Presentan solo dos categorías (ej: género: masculino/femenino; resultado: éxito/fracaso).
    • Politómicas: Presentan más de dos categorías (ej: grupo sanguíneo: A, B, AB, O; estado civil: soltero, casado, divorciado, viudo).
  • Ordinales: Categorías que pueden ser ordenadas o jerarquizadas, pero la diferencia entre ellas no es necesariamente uniforme (ej: nivel socioeconómico: bajo, medio, alto; grado de satisfacción: muy insatisfecho, insatisfecho, neutral, satisfecho, muy satisfecho).

wEm7ajohzc88QAAAABJRU5ErkJggg==

Variables Cuantitativas

Se expresan mediante cantidades numéricas, permitiendo operaciones aritméticas.

  • Discretas: Toman valores enteros y finitos, generalmente resultado de un conteo (ej: número de hijos, cantidad de errores, número de pétalos). No admiten valores intermedios entre dos valores consecutivos.
  • Continuas: Pueden tomar cualquier valor dentro de un rango o intervalo, generalmente resultado de una medición (ej: peso, altura, temperatura, tiempo, rendimiento de un cultivo). Teóricamente, entre dos valores, siempre puede existir un valor intermedio.

KCNQGAkAACAABIAAEfo4AvAH5OX5wNRAAAkAACAABIFBFAKoK8AUgAASAABAAAkCgaQhAVdE0HKEVIAAEgAAQAAJAAKoK8AEgAASAABAAAkCgaQj8H7p9gEcGyXZ4AAAAAElFTkSuQmCC

2. Según su papel en la pregunta de investigación:

  • Variable Dependiente (o variable respuesta, de resultado, o efecto): Es la característica que se mide o se observa para determinar el efecto o la influencia de la variable independiente. Sus valores "dependen" de los valores que tome la variable independiente.
  • Variable Independiente (o variable explicativa, predictora, o causa): Es aquella característica que el investigador manipula o que se considera que influye o explica los cambios en la variable dependiente.

3. Según su escala de medición:

(Esta clasificación está muy ligada a la naturaleza de la variable, especialmente cualitativa vs. cuantitativa, pero se detalla aquí por su importancia en la elección de las herramientas estadísticas).

Las escalas de medición, ordenadas en orden creciente de información que contienen, son:

  • Escala Nominal: Es la más básica. Clasifica los objetos o sujetos en categorías mutuamente excluyentes y exhaustivas, sin ningún orden ni jerarquía. Solo permite establecer relaciones de igualdad o desigualdad (ej: tipo de enfermedad, nacionalidad). Las variables cualitativas nominales usan esta escala.
  • Escala Ordinal: Además de clasificar, establece un orden o jerarquía entre las categorías. Indica si una categoría es mayor o menor que otra, pero no la magnitud de la diferencia (ej: nivel de estudios: primario, secundario, universitario; severidad de una enfermedad: leve, moderada, grave). Las variables cualitativas ordinales usan esta escala.
  • Escala de Intervalos: Posee las propiedades de las escalas nominal y ordinal, y además, los intervalos entre sus categorías o valores son iguales y medibles. Permite cuantificar la diferencia entre dos valores. El cero en esta escala es arbitrario y no indica ausencia del atributo (ej: temperatura en grados Celsius o Fahrenheit, coeficiente intelectual, fechas del calendario).
  • Escala de Razón: Es la escala más completa. Posee todas las propiedades de las escalas anteriores (nominal, ordinal, de intervalo) y, adicionalmente, tiene un cero absoluto que indica la ausencia total del atributo medido. Permite realizar todas las operaciones aritméticas, incluyendo la formación de razones o cocientes (ej: peso, altura, edad, ingresos, número de clientes). Las variables cuantitativas (discretas o continuas) suelen medirse en escalas de intervalo o de razón.

La escala de medición se determina por la naturaleza de la variable y los métodos disponibles para medirla. Es crucial porque de ella dependerá el tipo de análisis estadístico posterior y la forma de presentación de los resultados (tablas, gráficos, medidas de resumen).

Tablas de Distribuciones de Frecuencias

Las tablas de distribuciones de frecuencias permiten organizar y resumir los datos de manera sistemática. En una columna de la tabla aparecen los valores o categorías de la variable (según su tipo), y en sucesivas columnas se muestran los diferentes tipos de frecuencias asociadas a esos valores.

Componentes Clave de una Tabla de Frecuencias:

  • Categorías o Clases (xi o Intervalos): Son los distintos valores, categorías o intervalos de clase que toma la variable en estudio. Deben estar ordenados si la variable lo permite (ordinales, cuantitativas).
  • Frecuencia Absoluta (fi): Es el número de veces que aparece cada valor, categoría o clase en el conjunto de datos. La suma de todas las frecuencias absolutas es igual al número total de observaciones (N).
  • Frecuencia Absoluta Acumulada (Fi): Es la suma de las frecuencias absolutas de todos los valores, categorías o clases anteriores o iguales a la actual. Solo tiene sentido para variables ordinales o cuantitativas.
  • Frecuencia Relativa (hi): Es el cociente entre la frecuencia absoluta (fi) de cada valor/categoría/clase y el número total de datos (N). Se expresa como una proporción (hi = fi/N) o un porcentaje (hi% = (fi/N) * 100). La suma de todas las frecuencias relativas es igual a 1 (o 100%).
  • Frecuencia Relativa Acumulada (Hi): Es la suma de las frecuencias relativas de todos los valores, categorías o clases anteriores o iguales a la actual. Se expresa como una proporción o un porcentaje. Solo tiene sentido para variables ordinales o cuantitativas.
  • Marca de Clase (xi) (para datos agrupados en intervalos): Es el punto medio de cada intervalo de clase. Se calcula como el promedio de los límites inferior y superior del intervalo. Representa al intervalo para cálculos posteriores.
  • Amplitud del Intervalo (Ai) (para datos agrupados en intervalos): Es la diferencia entre el límite superior y el límite inferior de un intervalo de clase.

Construcción de Tablas de Frecuencias según el Tipo de Variable:

Para Variables Cualitativas Nominales

Con un único criterio de clasificación: Las tablas estadísticas (o tablas de contingencia de una única vía) muestran las diferentes categorías de la variable, su frecuencia absoluta (cuántas veces aparece cada categoría) y su frecuencia relativa (qué fracción del total representa cada categoría).

Con dos criterios de clasificación (Tablas de Contingencia o de Doble Entrada): Cuando se estudian dos variables cualitativas nominales simultáneamente para explorar su posible asociación, se utilizan tablas de contingencia. Estas tablas muestran las frecuencias conjuntas para cada combinación de categorías de las dos variables, así como las frecuencias marginales (totales por fila y columna).

Para Variables Cualitativas Ordinales

Similar a las nominales, pero las categorías se presentan en su orden natural. Además de las frecuencias absolutas y relativas, es útil y significativo calcular las frecuencias acumuladas (absolutas y relativas), ya que reflejan la acumulación hasta una cierta categoría ordenada.

Para Variables Cuantitativas Discretas

Si la variable toma pocos valores distintos, la tabla de frecuencias se construye de manera similar a las variables cualitativas ordinales, listando cada valor distinto con sus respectivas frecuencias (absolutas, relativas y acumuladas).

Si la variable toma muchos valores distintos, puede ser conveniente agrupar los datos en intervalos de clase, tratándola de forma similar a una variable continua.

Para Variables Cuantitativas Continuas (y Discretas con muchos valores)

Dado que pueden tomar muchos valores diferentes o cualquier valor dentro de un rango, es esencial agrupar los datos en intervalos de clase para construir una tabla de frecuencias. Para cada intervalo, se calcula su frecuencia absoluta, relativa, y las correspondientes acumuladas. También se determina la marca de clase y la amplitud de cada intervalo.

Entradas relacionadas: