Principios de Data Warehousing y Métodos de Resolución de Conflictos en Bases de Datos

Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 4,45 KB

Métodos para Mitigar Conflictos en Bases de Datos

A continuación, se presentan los principales métodos para mitigar los conflictos que pueden surgir en entornos de bases de datos:

  1. Bloqueo

    Se define como el método que no permite que, mientras una transacción esté operando sobre un recurso, ninguna otra transacción sea capaz de tomar dicho recurso. En Oracle, es posible implementar estos bloqueos, aplicando distintos tipos de granularidad a la base de datos, lo que permite bloquear desde un atributo hasta una tabla entera. Este método permite cumplir con la característica funcional de aislamiento.

  2. Timestamp

    Consiste en aplicar un identificador de tiempo a cada transacción, de modo que, dependiendo de la configuración, si la marca de tiempo es mayor o menor, la transacción se abrirá o se mantendrá en permanencia.

  3. Control de Versiones

    Está basado en el método Timestamp. La diferencia es que siempre se va a trabajar con la última copia confirmada de la transacción, de modo que se confirmará. Se implementa en la parte física de la base de datos, específicamente en los segmentos de rollback. Cada vez que una transacción inicia, se copia aquí, y el manejador de la base de datos gestiona su estado.

Data Warehouse: Conceptos y Componentes Esenciales

Un Data Warehouse (DW) es un sistema especializado y orientado al soporte para la toma de decisiones dentro de una organización. Es una solución para la obtención de información proveniente del procesamiento operativo del negocio, así como de diversas fuentes externas, cuyo objetivo es proporcionar una sola fuente integrada de información para el análisis y la toma de decisiones.

Debido a que las fuentes de información son híbridas o heterogéneas, es necesario un método que normalice los datos antes de ser introducidos en el DW. Este proceso se divide en las siguientes fases:

Fases del Proceso ETL (Extracción, Transformación y Carga)

  • Extracción

    Consiste en los métodos necesarios para extraer datos de las fuentes del sistema, que pueden ser formularios, FTP, SSH, entre otros.

  • Transformación

    La unificación de los datos es requerida para tener una base de datos consolidada y normalizada (no es lo mismo que la normalización en modelos Entidad-Relación - ER). Ejemplos incluyen la estandarización de formatos de fecha, sexo, nombres, etc.

  • Carga (Transporte)

    Es el método que transfiere los datos desde el repositorio ETL al DW, alimentando así el Data Warehouse. Puede utilizar protocolos como SSH, entre otros.

Otros Componentes Clave del Ecosistema Data Warehouse

  • Datos del Data Warehouse

    Es la información masiva, procesada y estructurada (aunque no necesariamente normalizada en el sentido relacional tradicional), que reside en el Data Warehouse.

  • Herramientas de Usuario Final

    Consta de todas aquellas herramientas de inteligencia de negocio (BI) como CRM, ERP, y herramientas de minería de datos, que permiten a los usuarios interactuar y obtener valor de la información del DW.

Propiedades Fundamentales de un Data Warehouse

  • Orientado a Temas

    La información almacenada en el DW responderá a las preguntas definidas de un tema de interés para la organización, permitiendo así un enfoque temático y facilitando el análisis específico.

  • Variable en el Tiempo

    Dado que la información final proviene de múltiples fuentes, es lógico suponer que el día a día sigue generando nuevas operaciones transaccionales que deben añadirse al DW. Por ello, se debe definir la granularidad de los datos para saber cada cuánto tiempo se debe alimentar el DW con información nueva.

  • Información Unificada e Integrada

    La información del DW ha sido previamente clasificada y validada. Si múltiples fuentes de datos tienen la misma información, esta, al ser consolidada, debe venir con una sola versión integrada para el DW, garantizando la coherencia.

  • No Volátil

    La información del DW es no volátil, lo que significa que ningún usuario puede cambiar, eliminar o añadir nuevos contenidos directamente. El almacén de datos es una fuente única, integrada y confiable destinada a la consulta y no al procesamiento de transacciones operativas.

Entradas relacionadas: