miércoles, 9 de marzo de 2011

Una aproximación a la recuperación de información

Como profesionales debemos afrontar el problema de recuperar información por la aparición de bibliotecas digitales ( bibliotecas hibridas) y el crecimiento vertiginoso de recursos electrónicos.
  • Esto se ha se hace posible por tres lineas de acción
           1. Indices compilados manualmente.
2. Bases de datos creadas por robots o arañas
3. Métodos de indización distribuida 

1. Índices compilados manualmente

Los indices son creados por los usuarios manualmente

2. Bases de Datos creadas por robots o arañas


‘Robots.txt : Todo lo que deberia saber | Emezeta’ [accedido 6 Marzo 2011].

Estos rastreadores ingresan a nuestro sitio web en busca de información navegan por el hipertexto con el fin de alimentar bases de datos textuales a partir de documentos HTML, así como otro tipo de formatos de edición electrónica, distribuidos en diferentes servidores.


Estos robots toman los archivos en las páginas y sacan nueva información a partir de ello con esto indizan.  

El problema es que se recupera información que no es relevante, cualquier busqueda arroja demasiados resultados , por la falta que las páginas web esten lo suficientemente descritas , lo que hace imposible acceder por titulo, autor, codigos de materia.




Bibliografía

SENSO, José A.  y  ROSA PINERO, Antonio de la. El concepto de metadato: algo más que descripción de recursos electrónicos. Ci. Inf. [online]. 2003, vol.32, n.2, pp. 95-106. ISSN 0100-1965.  doi: 10.1590/S0100-19652003000200011.


No hay comentarios:

Publicar un comentario

Licencia de Creative Commons
Los Quijotes de la Recuperación de Información by Diego Fernando Bocanegra is licensed under a Creative Commons Reconocimiento-NoComercial-CompartirIgual 2.5 Colombia License.