Principios Fundamentales para la Selección y Representación de Conceptos en la Indexación Documental

Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 3,64 KB

1.3.2 El tipo de documento y su contenido

Además de proporcionar una idea general del contenido que vamos a encontrar en él, el tipo de documento determinará de forma general qué términos deben seleccionarse.

La información de un documento no está delimitada por su extensión: puede ser corto, pero de gran valor informativo. No se debe limitar a priori el número de términos de indización que debe llevar un documento. El número está determinado por la cantidad de información contenida en el documento.

Para los documentos de gran contenido informativo es necesario extraer varios conceptos, en cambio, los documentos de contenido general no deben extraerse muchos conceptos.

Van Slype da pautas a seguir a la hora de elegir en un documento las nociones que determinan el tema:

a) Deben retenerse:

  • Las nociones explícitamente presentes sobre las que se aporta información susceptible de responder a una necesidad de un usuario del sistema documental.
  • Las nociones implícitamente contenidas dentro del documento, que son tratadas suficientemente en detalle como para interesar ocasionalmente a los usuarios.

b) No deben retenerse:

  • Las nociones presentes que el autor dice que no va a tratar.
  • Las nociones que sólo figuran a título de ejemplo.
  • Las nociones que están presentes en la argumentación del autor dentro del documento.

1.3.3 Los intereses de los usuarios

El indizador debe ser fiel al contenido de los documentos y tener en cuenta los intereses de los usuarios.

Aunque la indización se destinará a un grupo de usuarios concreto, debe estar abierta a otros posibles grupos de usuarios.

Para los textos de literatura científica y técnica se recomienda no limitar la indización a los aspectos científicos y técnicos, y tener en cuenta también los aspectos económicos o sociales.

Con el desarrollo de las redes informáticas, grupos de usuarios distintos pueden acceder a diferentes tipos de bases de datos.

2 La representación del contenido (Introducción)

Las etapas no están bien definidas para todos los sistemas de indización; una vez seleccionados los conceptos a indizar, dependiendo del sistema elegido, se seguirá un procedimiento diferente. Estos procedimientos son:

SISTEMA:

  1. Palabras-clave: procedimiento por extracción.
  2. Descriptores libres: por control.
  3. Descriptores; materias; clasificaciones: por traducción.

Slype, Fugmann, Lancaster y la ISO, excluyen algunos de los sistemas de indización propuestos: las palabras-clave y los descriptores libres.

- Slype habla de dos etapas:
  • 3. Traducción de los conceptos en descriptores.
  • 4. Se establecen enlaces sintácticos.
- Lancaster
  • 2. Traducción de un lenguaje de indización.
- ISO
  • 3. Selección de los términos de indización.
- Fugmann
  • Representación del contenido de los documentos.
Tres formas de representar el contenido de los documentos:
  • Indización por extracción.
  • Indización libre.
  • Indización por asignación.

Entradas relacionadas: