Representació i Recuperació de la Informació: Guia Essencial
Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones
Escrito el en
catalán con un tamaño de 7,65 KB
Representació i Recuperació de la Informació
Necessitem saber com es representa un tema en les fonts d’informació que consultarem. El tipus de representació determina l’estratègia de cerca.
La Indústria de la Comunicació
La indústria de la comunicació es caracteritza per la gestió de:
- Informació en brut
- Processos tècnics
- Distribució internacional
- Informació amb valor afegit
La informació desorganitzada i caòtica equival a no tenir informació.
Fases de la Indústria de la Comunicació
- Generació i Producció: científica, tècnica, industrial, humanística, d’actualitat... pública/privada.
- Processament: selecció, representació, emmagatzematge, sistemes de recuperació i dotació de valor afegit.
- Distribució: local, nacional, internacional. D'acord amb les necessitats dels clients.
Tractament Documental: Un Pont per a la Recuperació de la Informació
Representació Documental
La representació documental implica la descripció formal, que requereix la normalització de la descripció formal.
Descripció Bibliogràfica Estàndard Internacional (ISBD)
La ISBD és la norma que determina els requisits per a la descripció i identificació dels elements més comuns de recursos publicats que poden formar les col·leccions de les biblioteques.
- És un conjunt de regles fetes per la Federació Internacional d'Associacions de Biblioteques i Institucions (IFLA) per a crear un estàndard de descripció, en un format llegible, especialment per a ser emprades en una bibliografia o un catàleg de biblioteca.
- Un dels objectius de les ISBD és proporcionar una forma estàndard de descripció bibliogràfica que podria servir per a intercanviar registres a nivell internacional.
- Existeixen ISBN (internacional, per a llibres) i ISSN (internacional, per a publicacions periòdiques com diaris, revistes, butlletins, etc.).
Estructura de l'ISBN (International Standard Book Number)
- Producte Llibre: 978 (en el codi de barres)
- País, àrea geogràfica o lingüística (1-5 dígits)
- Exemple: Espanya és el 84
- Prefix editorial (fins a 7 dígits)
- Identificador del títol (edició i format)
- Dígit de comprovació
- Exemple: 84-283-2052-7 (Espanya - Ed. Paraninfo - 3a ed. rev. i ampl. - dígit de control)
Estructura de l'ISSN (International Standard Serial Number)
- Tipus de publicació (primeres xifres)
- Codi concret de la revista o diari (xifres centrals)
- Dígit de control
- Exemple: 0214-0349 (revista ITEM en paper)
- Exemple: 1699-521X (Internet)
La Classificació Documental
La classificació permet:
- Descriure i representar el tema principal del document.
- Organitzar físicament la documentació.
- Agrupar els documents en grans categories temàtiques.
- Localitzar documents afins.
L'eina de classificació més estesa és la CDU (Classificació Decimal Universal), que és decimal, enciclopèdica, controlada, precoordinada, amb una estructura per classes i subclasses; taules principals i auxiliars, índex i notació. Exemple: Història de Galícia 94 (469.556).
La Indexació Documental
La indexació és la representació d’aspectes temàtics. Serveix per:
- Descriure amb precisió l’abast temàtic d’un document.
- Recuperar de manera selectiva documents segons la seva temàtica.
Tipus d'Indexació
Indexació Lliure (exemple: Google)
Els llenguatges lliures es construeixen a posteriori sobre la base de la indexació de documents en llenguatge natural ja registrats en una col·lecció (llistes de paraules clau, llistes de descriptors lliures, etc.).
Indexació Controlada (exemple: catàleg de biblioteca)
Els llenguatges controlats es construeixen a priori, o sigui, abans d’indexar els documents d’una col·lecció. Serveixen per representar temes de forma unívoca i evitar ambigüitats pròpies del llenguatge natural (llista d’autoritats, tesaures, Lemac, etc.). Incideix en la recuperació de la informació.
Condicionants de la Indexació
Creences religioses, política, prejudicis i bagatge cultural poden ser condicionants de la indexació. Conseqüències: incidència en la recuperació documental.
LEMAC (Llista d'Encapçalaments de Matèria en Català)
- Totes les biblioteques indexen la informació dels documents de les seves col·leccions.
- L'eina més estesa per indexar és l'adaptació de la LCSH (Library of Congress Subject Headings).
- Cada sistema bibliotecari adapta la LCSH. A Catalunya, aquesta adaptació és LEMAC. És un vocabulari controlat format per encapçalaments de matèria (expressió lingüística –paraula o conjunt de paraules–) que representen el contingut temàtic d’un document (un concepte, un esdeveniment, un nom, un títol) emprats per fer recerca en un catàleg, bibliografia o índex. S’usa per a la classificació temàtica i la indexació dels documents.
Subdivisions en LEMAC
- Encapçalaments temàtics i de forma.
- Encapçalaments de nom personal, d’entitat i títols que serveixen de model.
- Noms geogràfics de jurisdiccions polítiques i administratives seguits de subdivisions i noms geogràfics no jurisdiccionals.
- Subdivisions sota noms geogràfics, sota noms de llengua i subdivisions comunes o de lliure aplicació.
Característiques del LEMAC
- Llenguatge natural
- Controlat
- Enciclopèdic
- Alfabètic
- Precoordinat
La indexació també és present en moltes monografies com a eina de cerca en el seu contingut. Sol rebre el nom d’índex analític.
Diferència entre Classificació i Indexació
La classificació descriu el tema principal dels documents i la indexació descriu els diferents aspectes temàtics tractats en el document, per tal de facilitar la seva recuperació a partir d’aspectes concrets i específics.
Resum o Abstract
El resum és una explicació abreujada i sintètica, objectiva i precisa del més essencial del contingut del document, normalment sense interpretació crítica. El seu objectiu és l’extracció dels continguts principals d’un document, per tal de facilitar la indexació, la cerca i la recuperació. Permet que l’usuari decideixi si necessita consultar el text complet.
- Informatiu i analític: idees importants.
- Llenguatge propi i objectiu.
- Sense redundàncies.
- Indicació del tipus de document.
- Estructura en paràgrafs.
- Redacció clara, verbs en veu activa, tercera persona.
- No inclou taules, gràfiques, etc.
Tesaurus
Un tesaurus és un glossari jerarquitzat de termes. Hi ha un descriptor principal que conté tots els mots que depenen semànticament d’ell, amb precisions sobre el seu ús. També inclou els sinònims i antònims i els mots relacionats amb l’entrada, de tal manera que agrupen tot el vocabulari d’un tema de forma ordenada.
- Llenguatge natural.
- Controlat (màxim control terminològic).
- Especialitzat.
- Relacions (jerarquia, associació, equivalència).
- Postcoordinat.