Minería de Datos: Conceptos, Técnicas y Aplicaciones Prácticas

Enviado por Programa Chuletas y clasificado en Magisterio

Escrito el en español con un tamaño de 2,89 KB

Introducción a la Minería de Datos

La minería de datos trata de la exploración y el estudio de grandes cantidades de información con el objeto de encontrar patrones y reglas significativas.

Procesos y Tareas en la Minería de Datos

En un proceso de minería de datos se realizan diferentes tareas:

  • Descriptivas: Para identificar patrones que explican o resumen los datos.
  • Predictivas: Permiten estimar valores futuros o desconocidos de variables de interés a partir de otras variables presentes en la base de datos.

Técnicas Principales

Para conseguir estos objetivos, el profesional puede utilizar diferentes técnicas:

  • Sistemas de agrupamiento (Clustering): Consiste en obtener grupos naturales a partir de los datos. También se conoce como segmentación.
  • Clasificación: Cada objeto pertenece a una clase, indicada por el valor de un atributo. El objetivo es predecir la clase a la que pertenecen nuevos objetos a partir de las variables restantes.
  • Correlaciones: Proporcionan información sobre el grado de similitud entre variables cuantitativas.
  • Reglas de asociación: Su objetivo es identificar relaciones no explícitas entre variables categóricas.
  • Reglas de asociación secuenciales: Caso particular de las reglas de asociación, en el que se buscan relaciones temporales en los datos.
  • Regresión: Su objetivo es predecir el valor que toma una variable cuantitativa en nuevos objetos a partir de la información proporcionada por las restantes variables.

Técnicas Descriptivas: El Clustering

Dentro de las técnicas descriptivas, destaca el clustering, que es una técnica de clasificación de información automática. Su finalidad es revelar concentraciones en los datos para su agrupamiento eficiente según su homogeneidad, haciendo uso de diferentes medidas y coeficientes para clasificar la información.

Técnicas Predictivas: Árboles de Decisión

Dentro de las técnicas predictivas, encontramos los árboles de decisión o clasificación, que son particiones secuenciales del conjunto de datos. Su objetivo es maximizar las diferencias de la variable dependiente o criterio base, dividiendo las observaciones en grupos que difieren según este criterio para obtener las probabilidades de cumplimiento de los mismos.

Los árboles de decisión proveen una herramienta de clasificación muy potente, ya que son fáciles de comprender y modificar, y el modelo desarrollado se puede expresar como un conjunto de normas de decisión. En comparación con otros métodos, los árboles de decisión se pueden crear de una forma relativamente rápida.

Entradas relacionadas: