Fundamentos de Data Warehouse y Business Intelligence: Conceptos Clave

Enviado por Programa Chuletas y clasificado en Otras materias

Escrito el en español con un tamaño de 3,68 KB

¿Qué es un Data Warehouse (DW)?

Un Data Warehouse es una base de datos diseñada para la toma de decisiones, caracterizada por ser:

  • Temática: Enfocada en áreas específicas.
  • Integrada: Requiere fuentes de datos internas y externas.
  • No volátil: Los datos no cambian una vez almacenados.
  • Variante en el tiempo: Registra la evolución histórica.

Se diferencia principalmente entre OLTP (procesos transaccionales) y OLAP (procesos analíticos).

Procesos ETL: Extracción y Transformación

Extracción

Consiste en identificar los cambios en los datos operacionales desde el último refresco. Los métodos para identificar cambios incluyen:

  • Carga total: Se empieza desde cero en cada proceso.
  • Comparación de instancias: Revisión de la base de datos operacional.
  • Marca de tiempo (Time stamping).
  • Disparadores (Triggers).
  • Fichero de log.
  • Técnicas mixtas.

Transformación

Proceso de limpieza y formateo de datos extraídos para garantizar su calidad y evitar anomalías. Los datos pueden presentar impurezas como ruido, inconsistencias o estar incompletos. Las transformaciones principales incluyen limpieza, formateo e integración.

Reporting y Análisis OLAP

Reporting

Corresponde a un análisis dirigido por el analista que requiere un conocimiento acabado de los datos. Incluye la definición de consultas, acceso, recuperación, manipulación, cálculos y entrega de reportes.

Análisis OLAP

Análisis asistido que permite manipular datos multidimensionales basándose en tablas resumidas dentro de un DW. Ejemplo: listado de los N productos más vendidos.

Comparativa: OLTP vs. OLAP

CriterioOLTPOLAP
GranularidadAutomatizadoSumarizado
TemporalidadDatos actualesHistóricos
UsoInformación operativaInformación estratégica
AccesoPocos a la vezMuchos a la vez
Tipo de accesoLectura y escrituraSolo lectura
Modelo de datosRelacionalMultidimensional
MétricaRendimiento transaccionalRendimiento de consultas
Tipo de consultaPredefinidasAd-hoc
VolumenBajo (100 MB)Alto (100 GB)
UsuarioMilesCentenas

Data Mining y Business Intelligence (BI)

Data Mining

Permite el descubrimiento de conocimiento mediante la exploración de datos para buscar tendencias, patrones y correlaciones útiles para la toma de decisiones estratégicas.

Business Intelligence (BI)

Conjunto de estrategias y herramientas para la administración y creación de conocimiento a través del análisis de datos.

Arquitectura para BI

  • Convencional: Basada en Data Warehouse (DW).
  • Operacional: Trabaja directamente sobre datos en tiempo real.
  • Big Data: Gestión de datos no estructurados (Clickstream, logs del sistema).

Aplicaciones Prácticas

  • Manufactura: Gestión de materia prima y programación de la producción.
  • Salud: Asignación de tratamientos basada en patrones de datos.

Entradas relacionadas: