Sistemas de Recomendación y Reglas de Asociación: Conceptos Clave

Enviado por Chuletator online y clasificado en Francés

Escrito el en español con un tamaño de 6,69 KB

Reglas de Asociación: Fundamentos y Aplicaciones

Las reglas de asociación buscan expresar un conjunto de sucesos que ocurren en una secuencia, los cuales mediremos en probabilidades. Es fundamental trabajar con variables categóricas, ya que el uso de variables continuas tiende a generar reglas muy pequeñas y poco significativas. Por lo tanto, se deben establecer cortes (entregados por el experto o el contexto de negocio), lo que nos permite clasificar y obtener una mayor representatividad de los datos.

Manejo de Variables Continuas

En el caso de tener variables continuas, se deben seguir los siguientes pasos:

  1. Describir la variable: Comprender su distribución y características.
  2. Aplicar estadística: Utilizar métodos estadísticos para identificar patrones.
  3. Establecer cortes: Definir rangos o umbrales para transformar la variable.
  4. Transformar variables continuas a categóricas (cont->cat): Convertir los datos para su uso en reglas de asociación.

Sistemas de Recomendación: Personalización y Predicción

Los sistemas de recomendación buscan sugerir a los clientes productos y/o servicios relevantes. Para su implementación exitosa, es necesario disponer de información histórica y un profundo conocimiento de nuestros usuarios. Necesitamos saber cómo actúan en nuestro sistema para hacer predicciones lo más exactas posibles.

Componentes Clave de un Sistema de Recomendación

InformaciónInteracción
  • Hechos: Todo lo que se puede obtener del pasado (datos transaccionales, demográficos, etc.).
  • Predicción: Basada en los datos históricos y patrones identificados.
  • El sistema comienza a aprender detectando comportamientos para predecir.
  • No siempre se predice con exactitud, lo cual también permite al sistema aprender y mejorar.
  • Necesidad de recibir feedback a través de calificaciones, uso o frecuencia de interacción.

Consideraciones en el Sector Retail

Las empresas de retail, por ejemplo, no suelen basarse únicamente en las frecuencias de compra. Esto se debe a que un producto, aunque sea de baja calidad o poco deseable, puede ser necesario y, por lo tanto, adquirido con alta frecuencia. Esto implicaría que se lleva mucho sin ser necesariamente bueno. Por ello, utilizan las calificaciones de los usuarios, ya que estas relacionan el producto con su calidad percibida y evaluada en colaboración con el cliente.

Modelos de Recomendación Específicos

Modelo de Recomendación basado en Co-ocurrencia

Para realizar este análisis, se construye una tabla que cruza todos los productos, permitiendo así visualizar la relación existente entre la compra de un producto "A" y un producto "F". Por ejemplo:

PañalesToallitasChupetesSonajeros
Pañales3015205
Toallitas1512102
Chupetes2010111
Sonajeros5213

Con esta matriz, podemos observar que las personas que compran pañales tienden a comprar chupetes. Si analizamos esto desde una perspectiva de layout en tienda: si el objetivo es que los clientes recorran toda la sala de ventas, se podrían colocar los pañales y los chupetes en ubicaciones distantes. Sin embargo, si la venta de chupetes disminuye, se podría crear un pack promocional con ambos productos para impulsar su venta conjunta.

Desafíos del Modelo de Co-ocurrencia

Cuando un producto es muy popular y se relaciona con la mayoría de los demás, comienza a alterar las recomendaciones. Por lo tanto, es crucial normalizar la matriz para evitar sesgos. El principal problema de este modelo es que no considera el historial de compras del usuario y se enfoca excesivamente en la frecuencia, lo que limita sus recomendaciones al no incluir otros factores relevantes como las preferencias individuales o el contexto de compra.

Modelo de Recomendación basado en el Vector de Características

Aquí es donde entra en juego la interacción, ya que se requieren más datos para establecer relaciones correctas y generar mejores recomendaciones. El sistema predice basándose en estos datos, y las predicciones son recalibradas por el feedback del usuario, generando así el TOPN (una calibración de ambas partes para producir las recomendaciones más exactas).

Finalmente, estos modelos comienzan a recomendar basándose en el comportamiento de otros usuarios y sus características (lo que se conoce como "las vecindades"), un enfoque también denominado KNN (K-Nearest Neighbors).

Entradas relacionadas: