Principios de Data Warehousing y Métodos de Resolución de Conflictos en Bases de Datos
Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones
Escrito el en español con un tamaño de 4,45 KB
Métodos para Mitigar Conflictos en Bases de Datos
A continuación, se presentan los principales métodos para mitigar los conflictos que pueden surgir en entornos de bases de datos:
Bloqueo
Se define como el método que no permite que, mientras una transacción esté operando sobre un recurso, ninguna otra transacción sea capaz de tomar dicho recurso. En Oracle, es posible implementar estos bloqueos, aplicando distintos tipos de granularidad a la base de datos, lo que permite bloquear desde un atributo hasta una tabla entera. Este método permite cumplir con la característica funcional de aislamiento.
Timestamp
Consiste en aplicar un identificador de tiempo a cada transacción, de modo que, dependiendo de la configuración, si la marca de tiempo es mayor o menor, la transacción se abrirá o se mantendrá en permanencia.
Control de Versiones
Está basado en el método Timestamp. La diferencia es que siempre se va a trabajar con la última copia confirmada de la transacción, de modo que se confirmará. Se implementa en la parte física de la base de datos, específicamente en los segmentos de rollback. Cada vez que una transacción inicia, se copia aquí, y el manejador de la base de datos gestiona su estado.
Data Warehouse: Conceptos y Componentes Esenciales
Un Data Warehouse (DW) es un sistema especializado y orientado al soporte para la toma de decisiones dentro de una organización. Es una solución para la obtención de información proveniente del procesamiento operativo del negocio, así como de diversas fuentes externas, cuyo objetivo es proporcionar una sola fuente integrada de información para el análisis y la toma de decisiones.
Debido a que las fuentes de información son híbridas o heterogéneas, es necesario un método que normalice los datos antes de ser introducidos en el DW. Este proceso se divide en las siguientes fases:
Fases del Proceso ETL (Extracción, Transformación y Carga)
Extracción
Consiste en los métodos necesarios para extraer datos de las fuentes del sistema, que pueden ser formularios, FTP, SSH, entre otros.
Transformación
La unificación de los datos es requerida para tener una base de datos consolidada y normalizada (no es lo mismo que la normalización en modelos Entidad-Relación - ER). Ejemplos incluyen la estandarización de formatos de fecha, sexo, nombres, etc.
Carga (Transporte)
Es el método que transfiere los datos desde el repositorio ETL al DW, alimentando así el Data Warehouse. Puede utilizar protocolos como SSH, entre otros.
Otros Componentes Clave del Ecosistema Data Warehouse
Datos del Data Warehouse
Es la información masiva, procesada y estructurada (aunque no necesariamente normalizada en el sentido relacional tradicional), que reside en el Data Warehouse.
Herramientas de Usuario Final
Consta de todas aquellas herramientas de inteligencia de negocio (BI) como CRM, ERP, y herramientas de minería de datos, que permiten a los usuarios interactuar y obtener valor de la información del DW.
Propiedades Fundamentales de un Data Warehouse
Orientado a Temas
La información almacenada en el DW responderá a las preguntas definidas de un tema de interés para la organización, permitiendo así un enfoque temático y facilitando el análisis específico.
Variable en el Tiempo
Dado que la información final proviene de múltiples fuentes, es lógico suponer que el día a día sigue generando nuevas operaciones transaccionales que deben añadirse al DW. Por ello, se debe definir la granularidad de los datos para saber cada cuánto tiempo se debe alimentar el DW con información nueva.
Información Unificada e Integrada
La información del DW ha sido previamente clasificada y validada. Si múltiples fuentes de datos tienen la misma información, esta, al ser consolidada, debe venir con una sola versión integrada para el DW, garantizando la coherencia.
No Volátil
La información del DW es no volátil, lo que significa que ningún usuario puede cambiar, eliminar o añadir nuevos contenidos directamente. El almacén de datos es una fuente única, integrada y confiable destinada a la consulta y no al procesamiento de transacciones operativas.