Fundamentos de Sistemas de Información: Organización de Archivos, Claves e Indexación en Bases de Datos

Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 9,84 KB

Conceptos Fundamentales de Sistemas de Información y Datos

A continuación, se definen los términos esenciales utilizados en la gestión de datos y sistemas de información:

Sistema de Información (S.I.)
Conjunto de equipos y procedimientos que permiten que una empresa funcione correctamente.
Sistema Informático (S.Inf.)
Conjunto de equipos y software que permiten la utilización y gestión de una base de datos.
Dato
Valor o cifra que, por sí solo, no posee un significado completo.
Marco (Frame)
El contexto que otorga significado al dato.
Información
Conjunto de datos organizados y recopilados con un propósito específico.
Aplicación Inyectiva
Principio donde cada valor es único y no se repite.
Atributo Identificador
Campo único de cada registro.
Campo
Cada una de las características o atributos de una entidad.
Registro (Fila)
Conjunto de datos que se guardan en una tabla, representando una instancia única.
Fichero
Conjunto de todos los registros almacenados.
Dominio
Restricción aplicada a un campo que limita los valores que puede introducir.
Time-Stamping (Marca de Tiempo)
Indicador que señala cuándo se ha creado o modificado un elemento del fichero.
Clave
Campo o conjunto de campos que sirve para identificar un registro.
Valor Nulo
Valor vacío en la tabla, indicando la ausencia de datos.
Organización de un Archivo
La manera en que los registros están almacenados dentro del fichero.
Modo de Acceso de un Archivo
La forma en que el sistema lee o busca los datos en la base de datos.
Índice
Estructura auxiliar que facilita la localización rápida de registros. (Similar a un índice de contenido).
Sinónimo
Dos valores hash diferentes que apuntan a la misma posición de destino.
Intruso
Ocupar una posición de almacenamiento que no le corresponde.

Tipos de Claves en Bases de Datos

Las claves son fundamentales para la integridad y la relación de los datos:

Clave Primaria (PK - Primary Key)
Es única y no puede contener valores nulos (NULL). Identifica de manera inequívoca cada registro.
Clave Foránea (FK - Foreign Key)
Clave que enlaza con una clave principal de otra tabla. Puede ser nula.
Clave Candidata
Cualquier campo o conjunto de campos que podría identificar únicamente el registro.
Clave Alternativa
Una clave candidata que no ha sido seleccionada como clave primaria. Funciona como una segunda clave principal.
Clave Compuesta
Necesita un mínimo de dos campos combinados para actuar como clave primaria.

Organización y Acceso a Archivos

Diferencia entre Registro Lógico y Registro Físico

  • Registro Lógico: Lo que el usuario o el programa percibe (ej. las tablas y sus datos).
  • Registro Físico: Cómo se guardan internamente los bits en el dispositivo de almacenamiento (ej. formato binario).

Tipos de Organización Física de los Archivos

Define cómo se almacenan los registros dentro del fichero:

Secuencial
Dos registros se almacenan uno detrás de otro, en orden consecutivo.
Directa/Relativa
Se puede acceder a los registros directamente por su clave. Es rápido, pero poco flexible al añadir o eliminar registros.
Indexada
Utiliza un fichero índice auxiliar que asocia cada clave con su posición física. Requiere poco mantenimiento, pero implica mantener dos ficheros sincronizados.
Hashing
Usa una función hash para determinar dónde se debe guardar cada registro. Es eficiente y de acceso muy rápido, pero su implementación es compleja.
Invertida
Permite múltiples índices sobre diversos campos, facilitando la búsqueda por múltiples criterios.

Modos de Acceso a los Archivos

Secuencial
Acceso registro por registro, desde el inicio hasta el deseado.
Directo
Acceso inmediato a un registro específico mediante un filtro o clave determinada.
Indexado
Acceso a través de un índice auxiliar que proporciona la ubicación física.

Dirección Lógica vs. Dirección Física

Dirección Lógica
La dirección que utiliza el programa o el usuario para identificar un registro dentro de un fichero.
Dirección Física
La posición real en el dispositivo de almacenamiento donde se encuentra la información. Esta posición puede variar con el tiempo.

Organización Indexada y Tipos de Índices

¿En qué consiste la Organización Indexada?

Consiste en un fichero de datos principal que se complementa con un fichero auxiliar llamado Índice. Este índice contiene las claves principales de cada registro y su posición física dentro del fichero de datos, permitiendo un acceso rápido a registros concretos sin necesidad de leer todo el conjunto.

Ventajas y Desventajas de la Organización Indexada

  • Ventajas:
    • Búsquedas más rápidas que en un fichero secuencial.
    • Facilita inserciones y modificaciones sin reordenar todo el conjunto.
    • No requiere que el fichero de datos esté ordenado físicamente.
  • Desventajas:
    • Es necesario mantener el índice actualizado.
    • Ocupa más espacio de almacenamiento.
    • Si el índice se pierde o se corrompe, el fichero se vuelve inútil.

Tipos de Índices

Existen seis tipos principales de índices utilizados en la gestión de archivos:

1. Índice Primario

Es el índice principal, basado en el campo de la Clave Primaria del fichero o tabla. Identifica de manera única cada registro, y sus claves nunca se repiten.

  • Ventaja: Acceso rápido y directo.
  • Inconveniente: Solo permite búsquedas por la clave primaria.
2. Índice Secundario

Índice adicional creado sobre un campo que no es la clave primaria. Este campo puede contener valores repetidos.

  • Ventaja: Permite búsquedas por otros campos.
  • Inconveniente: Requiere más espacio y debe actualizarse cada vez que se modifica el fichero.
3. Índice Denso

Contiene una entrada para cada registro del fichero. El índice conoce la posición exacta de todos los registros.

  • Ventaja: Búsquedas mucho más rápidas.
  • Inconveniente: El índice ocupa mucho espacio.
4. Índice No Denso

No cuenta con todas las claves del fichero; solo guarda algunas, típicamente una por cada bloque o grupo de registros. El sistema sabe dónde comienza cada bloque, pero no la posición exacta de cada registro.

  • Ventaja: Menos espacio requerido.
  • Inconveniente: Es más lento, ya que requiere una lectura secuencial dentro del bloque.
5. Índice Alternativo

Se aplica sobre una clave candidata. Sirve como camino alternativo para encontrar registros de forma única a través de campos diferentes a la clave primaria.

  • Ventaja: Flexibilidad para realizar búsquedas únicas.
  • Inconveniente: Es necesario mantener y actualizar múltiples índices con cada cambio.
6. Índice Compuesto

Utiliza más de un campo combinado para crear el índice, permitiendo identificar registros complejos.

  • Ventaja: Permite identificar registros basados en múltiples criterios.
  • Inconveniente: Ocupa más espacio y puede ser más lento en las actualizaciones.

Organización Invertida

¿En qué consiste la Organización Invertida?

La organización invertida es una evolución de la organización indexada. Mientras que la indexada tiene un índice principal, la invertida permite tener diversos índices a la vez, cada uno basado en un campo diferente. Esto facilita búsquedas mucho más flexibles y potentes, ya que se puede localizar un registro por cualquier atributo sin recorrer todo el fichero.

Componentes Principales

  • Fichero de datos principal.
  • Ficheros de índices (múltiples).
  • Listas de enlace.

Ventajas y Desventajas

  • Ventajas:
    • Permite búsquedas por cualquier campo.
    • Rápido y flexible en consultas complejas.
    • Ideal para motores de búsqueda o filtros múltiples.
  • Inconvenientes:
    • Ocupa más espacio debido a los múltiples índices.
    • Actualizar un registro implica actualizar diversos índices.
    • Mayor tiempo de mantenimiento y sincronización.

Aplicaciones Habituales

Motores de búsqueda web, utilizados para encontrar documentos que contienen una palabra o frase concreta.

Entradas relacionadas: