Método de Correspondencias: Visualización y Reducción Dimensional de Datos Categóricos

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 2,95 KB

Introducción al Método de Correspondencias

El método de correspondencias es una técnica relativamente nueva. Su formulación y desarrollo matemático se debe a Jean-Paul Benzecri.

Definición y Propósito

El método de correspondencias es un intento de extender el análisis factorial al tratamiento de variables categóricas.

Se trata de reducir el volumen de datos, con la menor pérdida posible de información (al igual que en el análisis factorial).

También, el método de correspondencias es una técnica de interdependencia, ya que no existen variables explicativas y variables a explicar.

Al igual que en el análisis factorial, se trata de analizar el sistema de interrelaciones entre las categorías de las variables.

En el método de correspondencias, se busca representar ese sistema de interrelaciones en un espacio perceptual. El objetivo es pasar de un número de categorías de las variables a un número menor de dimensiones, normalmente solo 2 o 3.

Reducción Dimensional

Para proceder a esa reducción, son necesarias las frecuencias de las categorías de las variables (número de casos que pertenecen a cada categoría).

El objetivo del método de correspondencias es tomar la tabla de frecuencias y representar las diferencias de frecuencias entre las categorías.

El método de correspondencias permite representar la posición relativa de cada una de las categorías de una variable en un espacio de k-1 dimensiones.

Asimismo, permite representar en un espacio común la posición relativa de las categorías de varias variables.

Tipos de Correspondencias

  • Correspondencias simples: solo se representan dos variables.
  • Correspondencias múltiples: en un mismo espacio, se representan más de dos variables.

Tablas de Contingencia: Punto de Partida

La tabla de contingencia es el punto de partida para representar la asociación entre categorías de diferentes variables. Contiene las frecuencias cruzadas entre las categorías de dos o más variables.

A partir de las frecuencias cruzadas, pueden definirse tantas dimensiones como categorías tenga la variable con menos categorías, menos una.

Para definir la posición relativa de cada categoría en el espacio común, se toma alguna medida de su asociación. La medida más habitual de la asociación entre variables categóricas es la prueba de Χ2, que se basa en el análisis de tablas de contingencia.

El análisis de tablas de contingencia es una técnica para resumir la relación entre variables nominales u ordinales. Una tabla de contingencia es una representación en filas y columnas del número de casos que se halla en el cruce de las categorías (o grupos) de dos o más variables.

El objetivo es estudiar la relación entre dos o más variables cualitativas.

Entradas relacionadas: