Tipos de archivos en informática

Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 31,82 KB

INTRODUCCIÓN

  • En la mayoría de las aplicaciones el archivo es un elemento central.
    • La entrada se realiza por medio de archivos
    • La salida se guarda en archivos para su almacenamiento a largo plazo.
  • Un sistema de archivos consta de programas de utilidad del sistema que se ejecutan como aplicaciones privilegiadas.
  • Términos asociados con archivos.
    • Campo

Elemento de datos básico

Contiene un valor único

Se caracteriza por su  longitud y su tipo de dato.

  • Registro

Conjunto de campos relacionados.

Pueden tratarse como una unidad.

Ejemplo:  Registro  “empleado”,  campos: nombre, número de seguridad social, fecha de contratación, puesto, etc.

  • Términos asociados con archivos.
    • Archivo

Conjunto de registros similares.

Los usuarios y las aplicaciones lo tratan como una entidad única refiriéndose a él por su nombre.

Las restricciones de control de acceso se aplican a los archivos.

  • Base de datos

Conjunto de datos relacionados

Dispone de un sistema de gestión de base de datos, que es independiente del sistema operativo

  • Operaciones típicas
    • Recuperar

Todos

El siguiente

El previo

Varios

  • Insertar
    • Borrar
    • Actualizar

SISTEMA DE GESTIÓN DE ARCHIVOS

  • La única manera de que un usuario pueda acceder a los archivos es mediante el sistema de gestión de archivos.
  • Un programador no necesita desarrollar software especifico para cada aplicación en lo que se refiere al uso de archivos.
  • Objetivos

    • Cumplir con las necesidades de almacenamiento y realizar las operaciones relativas a los archivos.
    • Garantizar que los datos sean válidos.
    • Optimizar el rendimiento

En términos del sistema operativo productividad global.

En términos del usuario tiempo de respuesta.

  • Ofrecer soporte de E/S para la variedad de tipos de dispositivos de almacenamiento.

Minimizar la posibilidad de pérdida de datos.

Ofrecer un conjunto estándar de rutinas de interfaz de E/S.

Proporcionar E/S para múltiples usuarios en el caso de sistemas multiusuarios.

REQUISITOS MÍNIMOS QUE DEBE CUMPLIR LA GESTIÓN DE ARCHIVOS.

  • Cada usuario debe ser capaz de crear, borrar y modificar archivos.
  • Cada usuario puede tener acceso controlado a los archivos de otros usuarios.
  • Cada usuario puede controlar qué tipos de acceso estarán permitidos para sus archivos.
  • Cada usuario debe poder restaurar sus archivos de manera adecuada a un determinado problema.
  • Cada usuario debe ser capaz de mover datos entre archivos.
  • Cada usuario debe ser capaz de guardar una copia de reserva y recuperar sus archivos en el caso de algún daño.
  • Cada usuario debe ser capaz de acceder a sus archivos mediante un nombre simbólico.

ARQUITECTURA DE LOS SISTEMAS DE ARCHIVOS

  • Gestores de dispositivos

    • Se encuentran en el nivel más bajo.
    • Se comunican directamente con los dispositivos periféricos.
    • Son los responsables de comenzar la operación de E/S en un dispositivo y procesar la terminación de una solicitud E/S.
    • En operaciones con archivos los dispositivos típicos controlados son discos y unidades de cinta.
  • Sistema de archivos básicos

    • Nivel de E/S física
    • Este nivel trata con bloques de datos que se intercambian con discos o cintas.
    • Se encarga de ubicar dichos bloques en el almacenamiento secundario y del almacenamiento intermedio en la memoria principal.
    • En este nivel no se comprende el contenido de los datos.
  • Supervisor básico de E/S

    • En este nivel se mantienen estructuras de control que se encargan de la E/S con los dispositivos, la planificación y el estado de los archivos.
    • Se ocupa de la selección del dispositivo donde va a realizarse la E/S que depende del archivo seleccionado.
    • También se ocupa del acceso  a disco y  cinta para optimizar el rendimiento.
    • En este nivel se asignan los buffer de E/S y se reserva la memoria secundaria.
  • E/S lógica

    • Es la parte del sistema de archivos que permite a los usuarios y aplicaciones acceder a los registros.
    • Mientras el sistema de archivos básico trabaja con bloques de datos, el módulo de E/S lógica lo hace con registros.
  • Método de acceso


    • Es el nivel del sistema de archivos más cercano al usuario.
    • Cada método proporciona una interfaz estándar entre las aplicaciones y los sistemas de archivos y los dispositivos que guardan los archivos.
    • Reflejan las diferentes formas de acceder y procesar datos.

FUNCIONES DE LA GESTIÓN DE ARCHIVOS

  • Los usuarios y los programas de aplicación interactúan con el sistema de archivos por medio de ordenes de creación, modificación y eliminación de archivos.
  • Antes de realizar cualquier operación el sistema de archivos debe identificar y ubicar el archivo.
  • Se requiere de un directorio que describa la ubicación de todos los archivos y sus atributos.
  • Se debe tener un control de acceso a usuarios.
  • El usuario contempla al archivo como una estructura que organiza los registros
  • Se debe usar un método de acceso apropiado a la estructura del archivo.
  • La entrada y salida se lleva a cabo por bloques.
  • Los registros de un archivo deben traducirse a bloques para su salida y los bloques deben traducirse a registros después de la entrada.
  • Para respaldar la E/S por bloques se necesita:
    • Gestión de almacenamiento secundario.
    • Asignación de archivos a los bloques disponibles

ORGANIZACIÓN Y ACCESO A ARCHIVOS

  • Diversos criterios son importantes para la elección de una organización de archivos:
    • Acceso rápido
    • Facilidad de actualización
    • Economía de almacenamiento
    • Mantenimiento sencillo
    • Fiabilidad.

La prioridad de estos criterios dependerá de las aplicaciones que usarán el archivo.

  • Organizaciones fundamentales de archivos:
    • Pilas
    • Archivos secuenciales
    • Archivos secuenciales indexados
    • Archivos indexados
    • Archivos directos o de dispersión.

ORGANIZACIÓN DE ARCHIVOS

  • Pilas

    • Es la forma menos complicada de organización.
    • Los datos se almacenan en el orden en que llegan.
    • La finalidad es acumular una masa de datos y guardarla.
    • Los registros pueden tener campos diferentes.
    • Cada campo debe ser autodescriptivo.
    • La longitud del campo debe indicarse mediante delimitadores.
    • No tiene estructura.
    • El acceso a un registro se hace mediante búsqueda exhaustiva.
    • Los archivos de pila se usan cuando los datos se recogen y se almacenan antes de procesarlos.
    • Este tipo de archivos no se adapta a la mayoría de las aplicaciones.
  • Archivos secuenciales

    • Es la forma más común de organización de un archivo.
    • Se emplea un formato fijo para los registros.

Misma longitud de campo, misma cantidad de campos y determinado orden.

  • Solo se necesita almacenar los valores del campo.
    • El nombre del campo y su longitud son atributos de la estructura del archivo.
    • Un campo en particular, generalmente el primero, es conocido como campo clave.
    • Los registros se almacenan en secuencia.

Orden alfabético

Orden numérico.

  • Los archivos secuenciales se utilizan para aplicaciones de proceso por lotes, por ejemplo: facturación o nóminas.
    • En aplicaciones interactivas, las solicitudes o modificaciones a registros individuales ofrecen un rendimiento pobre.
    • Un archivo se almacena en bloques secuenciales, la organización física corresponde a la organización lógica.
  • Archivos secuenciales indexados


    • Los registros se organizan en una secuencia basada en un campo clave, se añaden dos carácterísticas:

Un índice para soportar los accesos aleatorios.

Archivo de desbordamiento.

  • El índice proporciona una capacidad de búsqueda para llegar rápidamente a las proximidades del registro deseado.
    • Los registros del archivo de desbordamiento se ubican siguiendo un puntero desde su registro antecesor.
    • La estructura secuencial indexada más simple consta de un único nivel de indexación.
    • El índice en este caso es un archivo secuencial simple.
    • Cada registro del archivo índice consta de dos campos.

Un campo clave

Un puntero al archivo principal

  • Se busca en el índice hasta encontrar el valor de la clave que es igual o menor al valor deseado.
    • La búsqueda continua en el archivo principal a partir de la posición indicada.
  • Comparación entre un archivo secuencial y un secuencial indexado


    • Considéresé un archivo secuencial con un millón de registros, donde se requiere una búsqueda particular.
    • Sin índice- En promedio se requerirán 500,000 accesos.
    • Con índice. Si se construye un índice con 1000 entradas con la claves del índice más o menos distribuidas a lo largo del archivo principal.
    • Ahora se tendrán en promedio 500 accesos al archivo índice seguidos de 500 accesos al archivo principal .
  • Para añadir datos al archivo principal se hace de la siguiente forma


    :
    • Cada registro contiene un puntero al archivo de desbordamiento.
    • El registro del archivo principal que antecede el nuevo registro se actualiza con un puntero al nuevo registro que esta en el archivo de desbordamiento.
    • Si éste registro también esta en el archivo de desbordamiento se actualizará el puntero en este archivo.
    • En ciertos periodos de tiempo el archivo de desbordamiento se combina con el archivo principal para la actualización de los datos.
  • Archivos indexados

    • Usa diferentes índices para diferentes campos claves.
    • Suelen usar dos tipos de índices

Índice exhaustivo contiene una entrada por cada registro del archivo principal.

Índice parcial contiene entradas a los registros donde este el campo de interés.

  • Contiene registros de longitud variable.
    • Los archivos indexados son muy usados en aplicaciones donde el tiempo en la obtención de información es crítico.

Reservas de líneas aéreas

Sistemas de control de inventarios

  • Archivos directos o de dispersión


    .
    • Explotan la capacidad de los disco para acceder directamente a cualquier bloque de dirección conocida.
    • Se requiere un campo clave para cada registro.
    • Se usa las técnicas de dispersión sobre el valor de la clave.
    • Estos archivos se usan en registros con longitud fija y donde siempre se accede a los registros de una sola vez, por ejemplo: guías telefónicas, listas de precios, horarios, etc.

ORGANIZACIÓN DE DIRECTORIOS

  • El directorio contiene información sobre los archivos.
    • Atributos
    • Ubicación
    • Propietario
  • Gran parte de esta información la gestiona el sistema operativo, sobretodo la referente al almacenamiento.
  • El directorio es propiamente un archivo, propiedad del sistema operativo, accesible a través de las rutinas de gestión de archivos.
  • Elementos de un directorio de archivos

    • Información básica

Nombre del archivo, tipo de archivo.

  • Información de dirección

Volumen, dirección de comienzo, tamaño usado y tamaño asignado.

  • Información de control de acceso

Propietario, información de acceso y acciones permitidas.

  • Información de uso

Fecha de creación, identidad del creador, fecha de la última lectura/modificación, identidad del último lector/modificador, utilización actual.

  • Estructura simple

    • Una lista de entrada para cada archivo
    • Puede representarse como un archivo secuencial

El nombre de archivo como clave

  • El usuario debe tener cuidado de en la duplicidad de nombres.
  • Esquema de dos niveles

    • Existe un directorio para cada usuario y un directorio maestro.
    • El directorio maestro dispone de una entrada por cada directorio de usuario.
    • Cada directorio de usuario es una simple lista de archivos de usuario.
    • Los nombres deben ser únicos solo dentro de los directorios de usuario.
  • Estructura jerárquica o en árbol

    • Contiene un directorio maestro que contiene un número determinado de directorios de usuario.
    • Cada directorio de usuario contiene subdirectorios y estos a su vez otros subdirectorios o archivos.
    • Cada directorio se puede organizar como un archivo secuencial.
    • Minimiza la dificultad de asignar nombres únicos.
    • Cualquier archivo del sistema puede ser localizado siguiendo una ruta desde el directorio raíz o maestro hasta llegar al archivo.
    • Los archivos pueden tener el mismo nombre siempre y cuando tenga nombres de camino distintos.
  • Cada usuario o proceso tiene asignado un directorio actual conocido como directorio de trabajo.
  • Los archivos son referenciados de acuerdo al nombre del directorio de trabajo.
  • Durante la ejecución de un proceso el valor por defecto del directorio de trabajo será el del usuario.

COMPARTIMIENTO DE ARCHIVOS

  • En sistemas multiusuario es necesario permitir a los usuarios compartir archivos.
  • Derecho de acceso

    • Ninguno

El usuario no tiene conocimiento de la existencia del archivo.

  • Conocimiento

El usuario sabe de la existencia del archivo y quién es su dueño.

  • Ejecución

El usuario puede cargar y ejecutar el programa pero no puede copiarlo.

  • Derecho de acceso

    • Lectura

El usuario puede leer el archivo para cualquier propósito, incluyendo copia y ejecución.

  • Adición

El usuario puede añadir datos al archivo pero no puede modificar o borrar el contenido del archivo.

  • Actualización

El usuario puede modificar, borrar y añadir datos al archivo.

  • Cambio de protección

El usuario puede cambiar los derechos de acceso otorgados a otros usuarios.

  • Borrado

El usuario puede borrar el archivo.

El propietario del archivo puede otorgar derechos de acceso a otros usuarios.

            Usuario específico

   Grupo de usuarios

    Todos         

  • Acceso simultaneo

  • El usuario puede bloquear el archivo cuando se esta actualizando el archivo.
    • El usuario  puede bloquear el registro específico que se esta actualizando.
    • Al diseñar la posibilidad de accesos compartidos deben abordarse temas de exclusión mutua e interbloqueo.

AGRUPACIÓN DE REGISTROS

  • Los registros son la unidad lógica de acceso a los archivos, mientras que los bloques son unidad de E/S para almacenamiento secundario.
  • Hay dos aspectos a considerar:
    • Si los bloques deben ser de longitud fija o variable
    • Cuál debe ser el tamaño del bloque en comparación con el registro.
  • Considerando el tamaño del bloque existe tres métodos de agrupación de bloques.
    • Bloques fijos.
    • Bloques de longitud variable con tramos.
    • Bloques de longitud variable sin tramos.

ADMINISTRACIÓN DE ALMACENAMIENTO SECUNDARIO

  • El sistema operativo o el sistema de gestión de archivos es el responsable de la asignación de bloques a los archivos.
    • Debe asignarse el espacio de memoria secundaria a los archivos.
    • Es necesario guardar constancia del espacio disponible para asignar.
  • Asignación de archivos

    • Cuando se crea un archivo, ¿se asigna de una sola vez el máximo espacio que necesita?
    • El espacio se asigna a un archivo en forma de una o más unidades contiguas, que se llaman secciones.
      ¿Qué tamaño de bloque debería usarse para asignar archivos?.
    • ¿Qué tipo de estructura de datos o tabla se usa para guardar constancia de las secciones asignadas a un archivo?. Esta tabla se conoce como tabla de asignación de archivos (FAT, File Allocation Table).
  • Asignación previa

    • Necesita conocer el tamaño máximo del archivo al momento de la creación.
    • Es difícil para muchas aplicaciones determinar de manera fiable el posible tamaño máximo del archivo
    • El usuario tiende a sobrestimar el tamaño del archivo de tal manera que no quede sin espacio.
    • Es mejor la asignación dinámica.
  • Tamaño de la sección

    • Secciones contiguas variables y grandes.

Mejor rendimiento.

Tablas de asignación de archivo serán pequeñas.

El espacio es difícil de reutilizar.

  • Bloques

Secciones fijas y pequeñas.

Tablas de asignación grandes.

Los bloques se asignan a medida que se necesiten.

  • Métodos de asignación de archivos

    • Asignación contigua

Cuando se crea un archivo se le asigna un único conjunto contiguo de bloques.

La tabla de asignación de archivos necesita solo una entrada por cada archivo.

El bloque del comienzo

Longitud del archivo

Puede ocurrir fragmentación externa.

  • Métodos de asignación de archivos

    • Asignación encadenada

La asignación se hace con bloques individuales.

Cada bloque contendrá un puntero al bloque de la cadena

La tabla de asignación de archivos solo necesita una entrada por cada archivo

El bloque del comienzo

Longitud del archivo

No existe fragmentación externa

No hay cabida para el principio de cercanía.

  • Métodos de asignación de archivos

    • Asignación indexada

La tabla de asignación de archivos contiene un índice separado de un nivel para cada archivo.

El índice posee una entrada para cada sección asignada al archivo.

La tabla de asignación contiene el número de bloque para el índice.

GESTIÓN DEL ESPACIO LIBRE

  • Tabla de asignación de disco

    • Cuales  bloques de disco están disponibles.
  • Tablas de asignación de bits
    • Se asigna un bit para cada bloque de disco. Cada entrada igual a cero corresponde a un bloque libre, una entrada a uno es un bloque ocupado.
  • Secciones libres encadenadas.
    • Se encadenan mediante un puntero y el valor de la sección libre.
    • No es necesario un tabla de asignación de disco.
  • Indexación
    • Utiliza un tabla de índices parecida a la de asignación de archivos.

RESUMEN

  • Un sistema de gestión de archivos es un software del sistema que proporciona servicios a usuarios y aplicaciones para el uso de archivos.
  • Un archivo es un conjunto de registros, la forma de acceder a él determina su organización lógica.
  • Si un archivo va a ser procesado en su totalidad, la organización secuencial es la adecuada.
  • Si el acceso va a ser aleatorio es preferible un archivo indexado o de dispersión.
  • Independientemente de la organización, se necesita un servicio de directorios.
  • Con los directorios se tiene
    • Organización jerárquica del archivo.
    • Útil para que el usuario siga la pista del archivo.
    • Ayuda al gestor de archivos al control de accesos.
  • Los registros de los archivos no se ajustan al tamaño del los bloques físicos por lo que es necesario hacer una agrupación de bloques.
  • Una función clave de la gestión de archivos es la administración del espacio en disco.
    • Asignación de bloques de disco a los archivos

Métodos y estructura de datos para guardar constancia de la ubicación de cada archivo.

Entradas relacionadas: