Fundamentos de Data Warehouse y Business Intelligence: Conceptos Clave
Enviado por Programa Chuletas y clasificado en Otras materias
Escrito el en
español con un tamaño de 3,68 KB
¿Qué es un Data Warehouse (DW)?
Un Data Warehouse es una base de datos diseñada para la toma de decisiones, caracterizada por ser:
- Temática: Enfocada en áreas específicas.
- Integrada: Requiere fuentes de datos internas y externas.
- No volátil: Los datos no cambian una vez almacenados.
- Variante en el tiempo: Registra la evolución histórica.
Se diferencia principalmente entre OLTP (procesos transaccionales) y OLAP (procesos analíticos).
Procesos ETL: Extracción y Transformación
Extracción
Consiste en identificar los cambios en los datos operacionales desde el último refresco. Los métodos para identificar cambios incluyen:
- Carga total: Se empieza desde cero en cada proceso.
- Comparación de instancias: Revisión de la base de datos operacional.
- Marca de tiempo (Time stamping).
- Disparadores (Triggers).
- Fichero de log.
- Técnicas mixtas.
Transformación
Proceso de limpieza y formateo de datos extraídos para garantizar su calidad y evitar anomalías. Los datos pueden presentar impurezas como ruido, inconsistencias o estar incompletos. Las transformaciones principales incluyen limpieza, formateo e integración.
Reporting y Análisis OLAP
Reporting
Corresponde a un análisis dirigido por el analista que requiere un conocimiento acabado de los datos. Incluye la definición de consultas, acceso, recuperación, manipulación, cálculos y entrega de reportes.
Análisis OLAP
Análisis asistido que permite manipular datos multidimensionales basándose en tablas resumidas dentro de un DW. Ejemplo: listado de los N productos más vendidos.
Comparativa: OLTP vs. OLAP
| Criterio | OLTP | OLAP |
|---|---|---|
| Granularidad | Automatizado | Sumarizado |
| Temporalidad | Datos actuales | Históricos |
| Uso | Información operativa | Información estratégica |
| Acceso | Pocos a la vez | Muchos a la vez |
| Tipo de acceso | Lectura y escritura | Solo lectura |
| Modelo de datos | Relacional | Multidimensional |
| Métrica | Rendimiento transaccional | Rendimiento de consultas |
| Tipo de consulta | Predefinidas | Ad-hoc |
| Volumen | Bajo (100 MB) | Alto (100 GB) |
| Usuario | Miles | Centenas |
Data Mining y Business Intelligence (BI)
Data Mining
Permite el descubrimiento de conocimiento mediante la exploración de datos para buscar tendencias, patrones y correlaciones útiles para la toma de decisiones estratégicas.
Business Intelligence (BI)
Conjunto de estrategias y herramientas para la administración y creación de conocimiento a través del análisis de datos.
Arquitectura para BI
- Convencional: Basada en Data Warehouse (DW).
- Operacional: Trabaja directamente sobre datos en tiempo real.
- Big Data: Gestión de datos no estructurados (Clickstream, logs del sistema).
Aplicaciones Prácticas
- Manufactura: Gestión de materia prima y programación de la producción.
- Salud: Asignación de tratamientos basada en patrones de datos.