Conceptos Fundamentales de Minería de Datos: Tareas y Enfoques Algorítmicos

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 2,58 KB

Predicción

Consiste en estimar el valor futuro de una variable sujeta a cambios aleatorios a lo largo del tiempo. Se aplica estrictamente a series de tiempo, que son conjuntos de datos cuyo dominio es el tiempo.

Regresión

La regresión es una generalización de la clasificación (cuando el dominio de las clases es continuo) y la predicción. Dependiendo del significado de las variables dependientes e independientes, el modelo resultante puede ser de clasificación o de predicción. Su objetivo es encontrar un modelo matemático o estadístico que relacione adecuadamente la variable dependiente con las variables independientes. Geométricamente, la regresión consiste en encontrar una función que pase lo más cerca posible (en promedio) de los puntos (individuos) que forman parte de la muestra.

Asociación

La asociación resuelve problemas del tipo “Análisis de la Canasta de Mercado”, con el fin de obtener las tendencias de compra de los clientes. Busca la posible relación entre dos sucesos aparentemente independientes.

Enfoques Algorítmicos y Tareas de Minería de Datos

Estimación

Consiste en estimar parámetros poblacionales a partir de la muestra (matriz de datos, X) disponible. Estos parámetros representan una información de gran utilidad, especialmente en estudios de mercado. Ejemplo de parámetro: el nivel de demanda de computadoras portátiles en la ciudad de Mérida para el año 2010.

Agrupamiento (Clustering)

Consiste en dividir una muestra en dos o más grupos, buscando que la varianza dentro de los grupos sea mínima y que la varianza entre los grupos sea máxima. Esto significa que los individuos que forman parte de un mismo grupo deben ser lo más parecidos posible. Geométricamente, los individuos (puntos en el espacio p-dimensional) deben estar lo más cerca posible. A su vez, los individuos de distintos grupos deben estar lo más alejados posible. Cada grupo pasa a ser una clase. En este tipo de tareas no se utilizan ni se construyen modelos.

Clasificación

Consiste en desarrollar o construir un modelo que sirva para asignar una clase a un individuo, de acuerdo con su posición en el espacio (según sus valores en cada variable). La variable dependiente de este modelo es la clase del individuo, mientras que las variables independientes corresponden a las características del individuo. Los parámetros de dicho modelo dependen de la muestra utilizada. La muestra a utilizar contiene un conjunto de 'n' individuos, cada uno de los cuales pertenece a alguna de las 'C' clases existentes.

Entradas relacionadas: