Fundamentos de Sistemas de Información: Organización de Archivos, Claves e Indexación en Bases de Datos
Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones
Escrito el en
español con un tamaño de 9,84 KB
Conceptos Fundamentales de Sistemas de Información y Datos
A continuación, se definen los términos esenciales utilizados en la gestión de datos y sistemas de información:
- Sistema de Información (S.I.)
- Conjunto de equipos y procedimientos que permiten que una empresa funcione correctamente.
- Sistema Informático (S.Inf.)
- Conjunto de equipos y software que permiten la utilización y gestión de una base de datos.
- Dato
- Valor o cifra que, por sí solo, no posee un significado completo.
- Marco (Frame)
- El contexto que otorga significado al dato.
- Información
- Conjunto de datos organizados y recopilados con un propósito específico.
- Aplicación Inyectiva
- Principio donde cada valor es único y no se repite.
- Atributo Identificador
- Campo único de cada registro.
- Campo
- Cada una de las características o atributos de una entidad.
- Registro (Fila)
- Conjunto de datos que se guardan en una tabla, representando una instancia única.
- Fichero
- Conjunto de todos los registros almacenados.
- Dominio
- Restricción aplicada a un campo que limita los valores que puede introducir.
- Time-Stamping (Marca de Tiempo)
- Indicador que señala cuándo se ha creado o modificado un elemento del fichero.
- Clave
- Campo o conjunto de campos que sirve para identificar un registro.
- Valor Nulo
- Valor vacío en la tabla, indicando la ausencia de datos.
- Organización de un Archivo
- La manera en que los registros están almacenados dentro del fichero.
- Modo de Acceso de un Archivo
- La forma en que el sistema lee o busca los datos en la base de datos.
- Índice
- Estructura auxiliar que facilita la localización rápida de registros. (Similar a un índice de contenido).
- Sinónimo
- Dos valores hash diferentes que apuntan a la misma posición de destino.
- Intruso
- Ocupar una posición de almacenamiento que no le corresponde.
Tipos de Claves en Bases de Datos
Las claves son fundamentales para la integridad y la relación de los datos:
- Clave Primaria (PK - Primary Key)
- Es única y no puede contener valores nulos (NULL). Identifica de manera inequívoca cada registro.
- Clave Foránea (FK - Foreign Key)
- Clave que enlaza con una clave principal de otra tabla. Puede ser nula.
- Clave Candidata
- Cualquier campo o conjunto de campos que podría identificar únicamente el registro.
- Clave Alternativa
- Una clave candidata que no ha sido seleccionada como clave primaria. Funciona como una segunda clave principal.
- Clave Compuesta
- Necesita un mínimo de dos campos combinados para actuar como clave primaria.
Organización y Acceso a Archivos
Diferencia entre Registro Lógico y Registro Físico
- Registro Lógico: Lo que el usuario o el programa percibe (ej. las tablas y sus datos).
- Registro Físico: Cómo se guardan internamente los bits en el dispositivo de almacenamiento (ej. formato binario).
Tipos de Organización Física de los Archivos
Define cómo se almacenan los registros dentro del fichero:
- Secuencial
- Dos registros se almacenan uno detrás de otro, en orden consecutivo.
- Directa/Relativa
- Se puede acceder a los registros directamente por su clave. Es rápido, pero poco flexible al añadir o eliminar registros.
- Indexada
- Utiliza un fichero índice auxiliar que asocia cada clave con su posición física. Requiere poco mantenimiento, pero implica mantener dos ficheros sincronizados.
- Hashing
- Usa una función hash para determinar dónde se debe guardar cada registro. Es eficiente y de acceso muy rápido, pero su implementación es compleja.
- Invertida
- Permite múltiples índices sobre diversos campos, facilitando la búsqueda por múltiples criterios.
Modos de Acceso a los Archivos
- Secuencial
- Acceso registro por registro, desde el inicio hasta el deseado.
- Directo
- Acceso inmediato a un registro específico mediante un filtro o clave determinada.
- Indexado
- Acceso a través de un índice auxiliar que proporciona la ubicación física.
Dirección Lógica vs. Dirección Física
- Dirección Lógica
- La dirección que utiliza el programa o el usuario para identificar un registro dentro de un fichero.
- Dirección Física
- La posición real en el dispositivo de almacenamiento donde se encuentra la información. Esta posición puede variar con el tiempo.
Organización Indexada y Tipos de Índices
¿En qué consiste la Organización Indexada?
Consiste en un fichero de datos principal que se complementa con un fichero auxiliar llamado Índice. Este índice contiene las claves principales de cada registro y su posición física dentro del fichero de datos, permitiendo un acceso rápido a registros concretos sin necesidad de leer todo el conjunto.
Ventajas y Desventajas de la Organización Indexada
- Ventajas:
- Búsquedas más rápidas que en un fichero secuencial.
- Facilita inserciones y modificaciones sin reordenar todo el conjunto.
- No requiere que el fichero de datos esté ordenado físicamente.
- Desventajas:
- Es necesario mantener el índice actualizado.
- Ocupa más espacio de almacenamiento.
- Si el índice se pierde o se corrompe, el fichero se vuelve inútil.
Tipos de Índices
Existen seis tipos principales de índices utilizados en la gestión de archivos:
- 1. Índice Primario
Es el índice principal, basado en el campo de la Clave Primaria del fichero o tabla. Identifica de manera única cada registro, y sus claves nunca se repiten.
- Ventaja: Acceso rápido y directo.
- Inconveniente: Solo permite búsquedas por la clave primaria.
- 2. Índice Secundario
Índice adicional creado sobre un campo que no es la clave primaria. Este campo puede contener valores repetidos.
- Ventaja: Permite búsquedas por otros campos.
- Inconveniente: Requiere más espacio y debe actualizarse cada vez que se modifica el fichero.
- 3. Índice Denso
Contiene una entrada para cada registro del fichero. El índice conoce la posición exacta de todos los registros.
- Ventaja: Búsquedas mucho más rápidas.
- Inconveniente: El índice ocupa mucho espacio.
- 4. Índice No Denso
No cuenta con todas las claves del fichero; solo guarda algunas, típicamente una por cada bloque o grupo de registros. El sistema sabe dónde comienza cada bloque, pero no la posición exacta de cada registro.
- Ventaja: Menos espacio requerido.
- Inconveniente: Es más lento, ya que requiere una lectura secuencial dentro del bloque.
- 5. Índice Alternativo
Se aplica sobre una clave candidata. Sirve como camino alternativo para encontrar registros de forma única a través de campos diferentes a la clave primaria.
- Ventaja: Flexibilidad para realizar búsquedas únicas.
- Inconveniente: Es necesario mantener y actualizar múltiples índices con cada cambio.
- 6. Índice Compuesto
Utiliza más de un campo combinado para crear el índice, permitiendo identificar registros complejos.
- Ventaja: Permite identificar registros basados en múltiples criterios.
- Inconveniente: Ocupa más espacio y puede ser más lento en las actualizaciones.
Organización Invertida
¿En qué consiste la Organización Invertida?
La organización invertida es una evolución de la organización indexada. Mientras que la indexada tiene un índice principal, la invertida permite tener diversos índices a la vez, cada uno basado en un campo diferente. Esto facilita búsquedas mucho más flexibles y potentes, ya que se puede localizar un registro por cualquier atributo sin recorrer todo el fichero.
Componentes Principales
- Fichero de datos principal.
- Ficheros de índices (múltiples).
- Listas de enlace.
Ventajas y Desventajas
- Ventajas:
- Permite búsquedas por cualquier campo.
- Rápido y flexible en consultas complejas.
- Ideal para motores de búsqueda o filtros múltiples.
- Inconvenientes:
- Ocupa más espacio debido a los múltiples índices.
- Actualizar un registro implica actualizar diversos índices.
- Mayor tiempo de mantenimiento y sincronización.
Aplicaciones Habituales
Motores de búsqueda web, utilizados para encontrar documentos que contienen una palabra o frase concreta.