Como se administran los procesos por parte del sistema operativo

Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 4,43 KB


3.2 Índices Distribuidos

En muchos casos, por bueno que sea el algoritmo de indexación o de búsqueda, no es suficiente para cubrir la demanda:

 El texto es demasiado grande.  La frecuencia de actualización es demasiado alta.  Llegan demasiadas consultas por segundo.  La velocidad de los discos no está creciendo al ritmo necesario.  Una alternativa es utilizar paralelismo. Bien diseñado, puede expandir la capacidad de procesamiento tanto como se quiera.  Las redes muy rápidas formadas por unas pocas máquinas muy potentes se han convertido en una alternativa de bajo costo.

Índices Distribuidos construcción:

 En estas redes el acceso remoto cuesta aproximadamente lo mismo que el acceso al disco local.  Normalmente, todos los procesadores pueden comunicarse de a pares sin causar congestión.  Se puede considerar el total de RAMs como una gran memoria distribuida.  Dos medidas de interés para las consultas: o Throughput: Cantidad de consultas respondidas por segundo. O Tiempo de respuesta: Tiempo que demora una consulta particular

Generación Distribuida de Índices Invertidos:

 Se distribuye el texto entre las máquinas equitativamente.  Cada máquina construye su índice invertido local.  Se unen de a dos, jerárquicamente, hasta que una sola contiene todo el vocabulario.  Esa máquina calcula qué parte del vocabulario será responsabilidad de cada procesador, y distribuye esa información.
Los procesadores se aparean todos con todos intercambiando las listas de posteo.  Secuencialmente transmiten su parte del índice a un disco central, donde se concatenan para formar un índice centralizado.

3.3 Indexación  Incremental

El proceso de construcción del índice descripto previamente asume que los documentos que comprenden la colección nunca cambian. Sin embargo, ciertas colecciones resultan ser dinámicas, hecho que implica que su composición sufre modificaciones con el paso del tiempo, nuevos documentos se agregan, otros se modifican y muchos desaparecen (recuérdese las carácterísticas de la Web, Sección 1.1). En su mayoría, la literatura se avoca a resolver el problema de agregar nuevos documentos. 

La indexación dinámica o incremental es también conocida como indexación en-línea, ya que los documentos arriban al sistema una vez que este se encuentra en pleno funcionamiento, es decir disponible para recibir consultas. Como se menciónó, las listas de posteo son generalmente almacenadas en memoria secundaria.

Debido a las carácterísticas físicas que estos dispositivos presentan es conveniente disponer de los datos de forma contigua si se desea maximizar el rendimiento en las operaciones de entrada/salida. Por ello, concretar ciertos cambios sobre las postings involucra extender sus estructuras incurriendo en procesos que consumen gran cantidad de tiempo. Esto puede degradar en gran medida la efectividad del sistema recuperación, ya que ciertos fragmentos del índice no se encuentran disponibles para su consulta mientras dure la correspondiente actualización. La opción más simple para lidiar con esta cuestión consiste en periódicamente re-construir el índice por completo.

Este suele ser un buen enfoque si el número de cambios acumulados en el tiempo resulta relativamente reducido y sobre todo, si el retraso para permitir la búsqueda sobre los nuevos documentos puede admitirse. Asimismo, es necesario contar con los recursos suficientes para construir el nuevo índice mientras el anterior aún se encuentra disponible para servir consultas.

RI – LA WEB

Marcelo Antezana C.

Navegación versus Recuperación de Información:

• Concepto

 La navegación es el programa que permite consultar y obtener información mediante los sistemas hipertexto.

• Diferencias La diferencia esencial entre ambos conceptos, radica en la forma de obtener información; mientras que en la recuperación de información se obtiene de forma lineal, la navegación tiene la capacidad de obtener información a través del hipertexto. Esto quiere decir que, la adquisición de conocimiento se realiza paulatinamente y dependiendo del interés del usuario se profundiza a través de los nodos de información en una materia u otra.


Entradas relacionadas: