Fundamentos Esenciales del Modelo de Correspondencias: Distancia, Inercia y Normalización
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 3,24 KB
Distancia en el Modelo de Correspondencias
- Los perfiles de fila y columna se convierten en las coordenadas que permiten ubicar las categorías de las variables. Según estas posiciones, se calcula la distancia entre ellas.
- Para calcular la distancia, se debe, en primer lugar, calcular el centroide de la nube de puntos generada a partir de la ubicación de las categorías de las variables según las tablas de frecuencias relativas. El centroide puede ser entendido como la media de la nube de puntos.
Inercia en Modelos Estadísticos
- En el análisis de correspondencias, la dispersión de los puntos se denomina inercia.
- La inercia total corresponde a la dispersión del conjunto de puntos con respecto a su centroide.
- Los ejes que constituirán las coordenadas se obtienen de forma jerárquica en función de la inercia del modelo. El primero explica más inercia que el segundo, y el segundo más que el tercero, y así sucesivamente. Cada uno se calcula procurando explicar la inercia no explicada por los demás ejes.
- Los ejes así calculados son ortogonales, es decir, independientes entre sí.
- El mejor sistema de referencia será aquel que mantiene en mayor medida la dispersión entre los puntos, alterándola lo menos posible.
Normalización de Datos en Estadística Multivariante
- Es un procedimiento complementario que permite optimizar la solución. Consiste en distribuir la inercia del modelo.
- Esta puede distribuirse a través de las filas, las columnas o ambas a la vez. La decisión de cuál privilegiar dependerá de la importancia que las variables tengan para el estudio.
- La normalización no varía los resultados obtenidos respecto de la inercia asociada a cada eje ni la inercia total. Afecta, sin embargo, las puntuaciones de fila y/o columna según la selección realizada.
- Hay cuatro tipos de normalización:
- Canónica: Reparte la inercia de la tabla según filas y columnas simultáneamente, permitiendo observar tanto las similitudes como las diferencias entre las variables en estudio.
- Según filas (Rows Principal): Maximiza la distancia entre las categorías de la variable fila, dando cuenta de sus diferencias.
- Según columnas (Column Principal): Maximiza la distancia entre las categorías de la variable columna, dando cuenta de sus diferencias.
- Principal: Permite ver las diferencias entre las categorías de las filas y las categorías de las columnas, pero por separado.
- El método de normalización más utilizado es la normalización canónica (simétrica).
Condiciones de Aplicación para Modelos de Correspondencias
- Para poder representar la relación entre dos variables, es necesario que esta sea significativa; es decir, que ambas variables estén estadísticamente asociadas.
- Para verificar esta condición de aplicación, se debe utilizar la prueba Chi-cuadrado, cuyos resultados figuran en la tabla de resumen del modelo.
- Otra alternativa es solicitar esta prueba estadística previamente a la aplicación del modelo mediante una tabla de contingencia.