Conceptos Esenciales y Métodos de Agrupamiento de Datos

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 5,01 KB

Conceptos Fundamentales y Métodos de Conglomeración

Centroide

El centroide representa los valores medios de las entidades de un conglomerado en cada una de las variables utilizadas.

Dendrograma

El dendrograma es una representación gráfica de los resultados de un procedimiento jerárquico, donde el eje vertical representa las entidades y el eje horizontal, el número de conglomerados formados en cada etapa del procedimiento.

Diagrama de Témpanos Vertical

El diagrama de témpanos vertical es una representación gráfica que muestra las entidades en las columnas y el número de conglomerados en las filas, utilizada para determinar el número apropiado de conglomerados en la solución.

Diagrama de Perfiles

El diagrama de perfiles es una representación gráfica de las puntuaciones de las entidades en las variables seleccionadas, utilizada para detectar casos extremos o outliers.

Distancia de Mahalanobis

La distancia de Mahalanobis es una medida del impacto de una entidad, calculada a partir de la diferencia entre su valor y la media del resto de entidades para todas las variables independientes.

Distancia Euclídea

La distancia euclídea es la medida que corresponde al valor de la hipotenusa de un triángulo rectángulo entre dos puntos, o la línea recta que une a dos puntos en un espacio bidimensional.

Método de Aglomeración

El método de aglomeración es un procedimiento jerárquico que comienza con cada entidad como un conglomerado separado y, en pasos sucesivos, las entidades más próximas se combinan hasta formar un solo conglomerado con todas las entidades.

Método de Umbral Paralelo

El método de umbral paralelo es un procedimiento de conglomeración no jerárquico que selecciona diversas semillas de conglomerado simultáneamente desde el principio.

Método de Umbral Secuencial

El método de umbral secuencial es un procedimiento no jerárquico que comienza seleccionando una semilla de conglomerado y, después, otra hasta que todas las entidades están agrupadas.

Método de Ward

El método de Ward es un procedimiento jerárquico en el que la similitud utilizada para unir conglomerados se calcula sobre la suma de cuadrados entre los dos conglomerados, sumados para todas las variables.

Método del Centroide

El método del centroide es un procedimiento de conglomeración en el que la distancia entre dos conglomerados es la distancia entre los centroides de cada conglomerado.

Método Divisivo

El método divisivo es un procedimiento que comienza con todas las entidades en un único conglomerado, el cual se divide en otros separados a partir de las entidades más disimilares.

Procedimientos Jerárquicos

Los procedimientos jerárquicos son métodos de conglomeración por etapas que implican una combinación (o división) de las entidades. El resultado es la construcción de una jerarquía o estructura arbórea compuesta de conglomerados separados.

Procedimientos No Jerárquicos

Los procedimientos no jerárquicos, en lugar de usar un proceso de construcción arbórea, utilizan semillas de conglomerado para agrupar entidades en una distancia predeterminada.

Procedimiento de Optimización

El procedimiento de optimización es un método no jerárquico que permite la reasignación de entidades a un conglomerado diferente al original, basándose en algún criterio de optimización.

Re-especificación del Modelo

La re-especificación del modelo es la modificación de un modelo existente con parámetros estimados, con el fin de corregir parámetros inapropiados o para crear un modelo rival con el que comparar.

Semilla de Conglomerados

La semilla de conglomerados se refiere a los centros iniciales o puntos de partida para los conglomerados, que son valores individuales seleccionados para iniciar los procedimientos no jerárquicos.

Similitud entre Entidades

La similitud entre entidades se basa en sus puntuaciones en las variables consideradas y se puede medir en términos de «proximidad» o de «distancia».

Unión Completa

La unión completa es un procedimiento de conglomeración en el que el criterio de conglomeración se basa en la distancia máxima entre las entidades de dos conglomerados.

Unión Promedio

La unión promedio es un procedimiento que utiliza la distancia promedio de las entidades de un conglomerado con todas las del otro.

Unión Simple

La unión simple es un procedimiento jerárquico basado en la distancia mínima entre entidades de un conglomerado y las de otro.

Entradas relacionadas: