Archivos

Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 16,58 KB

 
archivo.- colección de registros que se encuentran relacionados entre si
IDE .- Un nuevo enfoque de interfaz unidad/controlador es la llamada IDE, Integrated Drive Electronics (Electrónica Integrada de Unidad).
SCSI .- SCSI (se pronuncia scosi), significa SMALL COMPUTER SYSTEMS INTERFACE (Interfaz de Sistemas Pequeños de Computo). Esta interfaz se utiliza para conectar varios periféricos a una computadora
REM
Visualiza mensajes en pantalla durante el procedimiento por lotes
PAUSE
Es similar al Rem, pero suspende temporalmente el procesamiento hasta pulsar una tecla
ECHO
Permite o impide la visualización de nombres de ordenes del Dos, no inhibe la salida producida por las ordenes, su longitud es de 117 caracteres, cuando esta activado visualiza los nombres de todas las ordenes en pantalla a medida que se ejecuta.
GOTO
Proporciona un mecanismo para hacer un salto dentro de un archivo de procesamiento por lotes.
IF
Es el procesamiento condicional dentro de las ordenes del dos.
FOR
Proporciona un mecanismo para hacer un procesamiento repetitivo dentro de un archivo .bat
SHIFT
Se utiliza para utilizar mas de 10 parámetros, se limita a hacer rotar los parámetros un lugar hacia la izquierda.
1.4 Buffer Es un área de memoria principal reservada para contener los datos leídos de un archivo mientras se utilizan. Cuando esta área temporal queda llena, el programa puede empezar a utilizar estos datos.
Almacenamiento temporal único por demanda.
Es utilizado cuando existe un registro por bloque y un almacenamiento por archivo. En este caso el buffer es llenado por demanda del programa del usuario.
Almacenamiento temporal por anticipación.
Se utiliza para evitar esos tiempos ociosos, o sea que se pretende anticipar a la solicitud de lectura del programa manteniendo el buffer lleno.
Almacenamiento temporal con bloques.
Este caso se utiliza para cuando en el bloque leído existen n registros. La estructura del buffer incluye un contador (respecto a la estructura anterior) para indicar el registro (registro del buffer) próximo a leer.
Doble almacenamiento temporal.
Es utilizado para n registros por bloque, en este caso existen dos buffers, uno se llena mientras el otro desaloja, esto reduce la espera.
1.5 Cinta Magnética
La unidad de cinta es un dispositivo de acceso secuencial, esto quiere decir que no puede saltar sobre la superficie del cassette como los discos.
Método de sectores.-Este método consiste en dividir la superficie del disco en segmentos invisibles cuya forma es similar a las rebanadas de un pastel, generalmente existen al menos 8 de estos segmentos en un disco.
Método de cilindros.- Este método para organizar los datos en el disco se usa con los paquetes de discos removibles. Los brazos de accesos se mueven al unísono en dirección radial con respecto al paquete de discos.
Pistas o Tracks
son unas pistas concéntricas invisibles a lo largo de las cuales se graban los pulsos magnéticos. En otras palabras son los renglones del disco.

Sectores
Cada pista se subdivide en sectores; por ejemplo 9 sectores por pista o 15 sectores por pista en discos flexibles DD (doble densidad) y HD (alta densidad) respectivamente.
Cilindro
Se le llama cilindro al conjunto de pistas a las que el sistema operativo puede acceder simultáneamente en cada posición de las cabezas. Si se trata de un disco flexible, cada cilindro consta de dos pistas, una por encima y otra por debajo del disco. En el caso de un disco duro que tenga dos platos, el cilindro consta de 4 pistas
Cluster
Es la longitud de la pista tomada como unidad de proceso en cada operación de lectura o de escritura en el disco, la cual equivale a la longitud de un sector en los discos flexibles o al conjunto de 4 u 8 sectores contiguos en los discos duros.
Tabla de partición
Es el índice del disco duro y especifica la ubicación y el tamaño de cada una de las particiones del disco. El sistema operativo puede manejar varias tablas de particiones lógicas.


Archivos Secuencial - Indexado
4.1 Estructura
Dentro de las organizaciones de archivos existen diversos modelos que hacen uso de índices; es decir, estructuras que contienen parejas llave_dierccion de tal manera que se hace referencia a los datos contenidos en el archivo principal.
Los tipos de índices que existen son:
DENSO: El índice tiene una entrada por cada registro en el archivo principal.
DISPERSO: El índice contiene una entrada por cada conjunto de registros en el archivo principal.
DESBORDE SECUENCIAL:
Al saturarse un bloque, los registros excedentes se envían al área de desborde; de esta manera, me mezclan registros que originalmente correspondían a bloques distintos. Durante la búsqueda de una llave, se barre (uno por uno) el bloque correspondiente, de no encontrarse o si este estaba saturado se barre el área de desborde.

DESBORDE LIGADO:

Cuando un bloque se satura, se activa una liga en el ultimo registro del bloque para indicar la dirección en el área de desborde del primer registro que correspondería a este mismo bloque. Cada registro en el área de desborde tiene una liga que apunta al siguiente registro asociado al mismo bloque.

Archivos directos
La organización directa es aquella que permite un posicionamiento sobre registros específicos al localizar una llave. Lo anterior permite agilizar la localización de un dato en un archivo determinado al no requerirse el procesamiento de los registros contiguos previos.
Archivo clasificado para búsqueda binaria: Se requiere que el archivo principal se mantenga ordenado respecto a la llave en todo momento
Ajuste de llave a esqueleto: Este método se utiliza cuando la llave contiene digitos y opcionalmente caracteres alfabéticos. El algoritmo de asignación consiste en tomar de la llave aquellos caracteres (preferentemente digitos) que presenten mayor variación y utilizarlos como dirección en un esqueleto previamente creado
Transformación de llaves (Hashing): Este método consiste en descomponer la lave en múltiples fragmentos y mediante la aplicación de diverso algoritmos, dar origen a un numero en un intervalo determinado y utilizarlo como dirección de registro en el esqueleto.
Existe otro modelo de acceso directo que es considerado como un caso especial:
Relación directa - Llave dirección: Este método es aplicable para sistemas donde los elementos a registrar reciben un folio consecutivo como llave. La llave del registro se hace corresponder con la dirección física de este, por lo que la velocidad de acceso es extremadamente alta
ACCESO DIRECTO POR INDEXAMIENTO

La utilización de un índice denso (con una entrada para cada registro en el archivo principal) permitirá un acceso directo en el archivo principal después de un proceso de búsqueda en el índice.
ISAM
Es un modelo que se relaciona íntimamente al hardware de almacenamiento puesto que se diseña de acuerdo a la estructura de los niveles del medio físico como los cilindros, pistas y sectores.
VSAM
Consiste en mantener en memoria principal un índice maestro, el cual contiene los intervalos iniciales de las llaves y las referencias (ligas) hacia los archivos que contienen subintervalos mas específicos de las llaves.
Correspondencia entre la llave y la dirección física
El direccionamiento de dos registros puede darse en forma directa e indirecta. Se dice que es directa cuando es posible determinar la dirección mediante una relación natural con la llave. Es indirecta cuando la llave debe ser alterada o se le deben de aplicar operaciones para determinar la dirección del registro
Método del residuo.
Es el de mayor aceptación y consiste en la determinación de un numero primo (inmediatamente menor al total de registros esperados) que será utilizado como divisor del numero grande. El residuo de esta división será el numero hash buscado.
Método del centro de los cuadrados.
Consiste en obtener el cuadrado del numero "grande"; del valor resultante se rescatan los dígitos centrales tantos como se requieran para direccionar el esqueleto y se multiplican por un factor de ajuste para colocar el resultado en el rango deseado.
Método del desplazamiento.
En este caso se consideran los dígitos mas externos del numero "grande". De cada extremo se toman tantos dígitos como se requieran para el direccionamiento. Estos se suman y se aplica un factor de ajuste.
Método del plegado.
Es similar al anterior salvo que los dígitos de los extremos se suman en forma encontrada, semejando que el numero total se encontrara escrito en una hoja y esta fuera doblada por la mitad.
Método de conversión de base.
Se asume que el numero "grande" se encuentra en una base determinada diferente de 10 al suprimirle los dígitos fuera de base. El valor resultante es convertido a base 10 y se le aplica el factor de ajuste. Tomar los tres últimos dígitos.

Método del análisis de dígitos.
Se obtiene una muestra de gran tamaño de llaves posibles y sus números hash correspondientes, se analiza la frecuencia de repetición para cada una de las columnas y se van descartando aquellos que presentan mayor repetición. Finalmente, se toman las columnas con mayor variación y tantas como dígitos se requieren. Se aplica factor de ajuste.
Manejo de cubos

Estadísticamente se ha comprobado que se presenta una distribución mas adecuada en el esqueleto donde cada dirección hash tiene capacidad para almacenar mas de un registro que en aquel donde cada localidad almacena solo un registro y se extiende a una longitud equivalente a la cantidad de registros a aceptar
Densidad de empaquetamiento

Al diseñar la estructura de acuerdo a un tamaño de cubo especifico, debe procurarse un nivel de saturación que no sea extremadamente alto; es decir debe preferirse sacrificar algunas localidades a cambio de optimizar el funcionamiento del modelo. El parámetro que nos indica el nivel de saturación es conocido como densidad de empaquetamiento
Compactación de datos
COMPACTACIÓN DE DATOS
La compactación de datos tiene por objeto el almacenamiento de información con un ahorro en el espacio requerido en el medio.
·
Técnicas dependientes del tipo de datos.
Se aplican sobre archivos con una estructura, formato o tipo de contenido que se conoce previamente.

·
Técnicas independientes del tipo de datos.
Se aplican sobre cualquier archivo sin importar su contenido.


Técnicas dependientes del tipo de datos.
Utilizan básicamente la sustitución y codificación de la información. Los principales puntos que considera son:
1.- Eliminación de elementos redundantes
MÉTODO DE HUFFMAN

COMPACTAR
1. Realizar un recorrido por el archivo a compactar, e ir acumulando en un arreglo de contadores de incidencias la cantidad de veces que aparece cada carácter.
2. Construir un árbol binario de recorridos de tal forma que los caracteres encontrados sean hojas en la estructura. Es importante que los caracteres con mayor incidencias queden mas cercanos a la raíz .
3. Etiquetar las ramas del árbol con bits, 0 rama izquierda, 1 rama derecha.
4. Crear una tabla de códigos (vector) donde se registre el recorrido desde la raíz hasta una hoja especifica, señalando los bits encontrados en las ramas.
5. Recorrer el archivo original e ir acumulando los bits de la nueva codificación hasta completar ocho de ellos, escribir en el archivo destino el carácter del ASCII que corresponda a los ocho bits codificados según la codificación normal.
DESCOMPACTAR
1. Recuperar de los contadores de incidencias almacenados el árbol de recorridos y la cantidad de bits de relleno del ultimo carácter.
2. Recorrer el archivo compactado aplicando el siguiente procedimiento para cada carácter.
· Obtener ordinal y convertirlo a binario.
· Realizar recorrido al árbol hasta llegar a una hoja.
· Guardar en el archivo destino (descompactado) el carácter encontrado en la hoja
.
Acceso Multi-Llaves
ACCESO MULTILLAVE

Esta organización se utiliza para establecer conexiones entre datos con características similares. No es el objetivo principal el acceso rápido a una llave en particular. En este tipo de organización deben determinarse e identificarse aquellos campos en los que el rango de valores esta bien definido y que representan una utilidad al acceso por cada uno de estos valores.

ATRIBUTO: Es un campo con un rango de valores bien determinado, sobre el cual es deseable una consulta.

CARACTERISTICA: Es cada uno de los valores que puede tomar un atributo.

El modelo utiliza para su funcionamiento dos archivos:

·
Archivo de cabecera.- Almacena las direcciones de inicio de cada cadena de característica. Recomendablemente incluye un campo de longitud de cadena que permite seleccionar el acceso de la cadena mas corta cuando se conocen dos o mas características. Tendrá tantos registros como características tenga el modelo.
·
Archivo Principal (Datos).- Además de los campos de almacenamiento normales utilizan tantos campos adicionales como atributos tenga el modelo; cada uno de estos será una liga al siguiente registro con la misma característica.
8.2 Métodos para el acceso multillave


a) Indexamiento.-
Consiste en utilizar un índice denso para cada tipo de llave distinta.
b) Redireccionamiento.- Consiste en utilizar archivos de redireccionamiento como esqueletos, mientras que el archivo principal crece conforme se requiere. Debe mantener ligas para la formación de las cadenas. Podrá utilizar cualquier método para el calculo de direcciones

Entradas relacionadas: