Los Quijotes de la Recuperación de Información: marzo 06, 2011

(Memoria de clase IV)
Alli Marissa Mayer vicepresidenta de productos y servicios al usuario nos describen a Google como un buscador en la red y también una empresa centrada en la innovación tecnológica y en organizar la información del mundo con ello ambicionan organizar toda la información ya que hasta ahora se habían centrado en páginas web ahora apuntan a libros documentos almacenados en bibliotecas, videos y cualquier soporte donde se encuentre la información.

Ya que Internet y la World Wide web se han convertido en partes de nuestra vida diaria Vincent Cerf quien es vicepresidente y jefe de evangelización de Internet también ha comenzado a trabajar con Google se le considera el padre de Internet el se dice a si mismo como fundador nos cuenta que la gente ha aprendido a manejar la información de modo que estuviera disponible en la world wide web ahora la pregunta es ¿como encontrarla? empresas como Google han encontrado formas de indexar toda esa información en el sistema.

A mediados de los noventa aparecen dos jóvenes de la universidad de Stanford, Larry Page y Serguey Brin en 1999 con un capital de cien mil dólares fundadoron Google y con su salida en la bolsa en 2004 se convirtieron en multimillonarios ahora cuenta con mas de seis mil setecientos de empleados, lo ironico es que ellos no pretendían crear una empresa si no vender su tecnología a una ya existente, lo intentaron pero todas le respondían que las búsquedas que ellos hacían eran en un 80% tan buenas como las demás estos jóvenes pretendían captar ese 20% que las demás no captaban que nuestras búsquedas sean mejores a las de cualquiera es lo que marca la diferencia.

¿Pero como funciona este buscador? a esto nos responde Frederick Vallaeys por medio de miles de algoritmos que determinan que mostrar y cuando mostrarlo, también el tiempo de respuesta es fundamental debe ser lo más rápido posible, los resultados están en la izquierda de la pantalla y la publicidad en la derecha a veces aparece la publicidad en los primeros lugares resaltadas con un color diferente, Google determina el ranking se basa en buscar vínculos en las páginas web, por ejemplo si existe una página que hable sobre flores y esta se ha convertido en una autoridad en la materia otras páginas que hablen de la misma materia tendrán vínculos hacia esta página lo que nos da a entender que esta es importante también la importancia se la el vinculo que la visite ya que no es lo mismo un blog cualquiera ha que sea el new york times, pero como mediante mecanismos que intentan valorizar que información es supuestamente más útil ese valor se otorga por el número de hipervínculos que llevan a ese lugar, aun así cada uno de nosotros es quien decide si es o no importante la información que se nos proporciona.

En 2005 Google obtuvo unos ingresos brutos de seis mil cien millones de dólares y un beneficio neto de mil quinientos millones. Nikesh Arora vicepresidente de operaciones en Europa nos cuenta que Google obtiene sus ganancias gracias a la publicidad ya que los usuarios están interesados en obtener cierta información y además existen vendedores interesados en ofrecer algo relacionado por ejemplo si alguien esta buscando sobre carros encontrara información sobre estos y además ofertas sobre venta o reparación de estos claro que los resultados aparecerán como ya se ha dicho antes unos a la izquierda y la publicidad a la derecha.

Vuelve Frederick Vallaeys y nos cuenta como es trabajar en Google, muchas de las personas estudiaban con el compañeros de clase y maestros así que según el parece como estar en la universidad ya que cuenta con una cafetería, gimnasio también la cultura de la gente trabajan duro pero también se divierten, Google cuenta con un gran recurso humano.

¿Pero es honesto el método que utiliza Google? Vincent Cerf nos dice que Google intenta ser neutral con los puntos de vista y por medio de el algoritmo que usa, trata de no tomar partido político o ideología alguna, ya que Google no produce información alguna los resultados que aparecen son gracias a personas que los han publicado aquí es donde el receptor debe ser critico sobre la información que se le suministra. hacer filtros seria complicado y eso matemáticamente es complicado lo que cuenta para Google es dar un resultado no filtrado, si Google es un buscador popular lo es porque se ha esmerado en ser útil.

Un buscador no puede ser objetivo ni imparcial es lo que nos cuenta Brewster Kahle fundador y bibliotecario digital de Archivo de Internet ya que hay decidir que indexar, que no indexar a que otorgas más valor y a que menos. Podemos almacenar todas las obras publicadas y ponerlas a disposición ya que se cuenta con la tecnología para ello, lo habría que examinar es el papel de la esfera pública y privada con respecto a los derechos de autor y los diferentes manifiestos que existen al derecho de la información

Si Google contara con un lema seria no seas malvado esto aplica a que se puede triunfar en los negocios si sacrificar la ética.

Este éxito se debe a que Google diversifica en sus servicios por ejemplo Franz Josef Och un científico investigador esta trabajando en un traductor que sirva para hallar la información que se encuentre en un idioma diferente a los términos que se ingresaron en el buscador, la humanidad así ha evolucionado en base a la información existente y en esta era los avances serán cada vez más rápidos con ello también se trataría de alcanzar la meta de Google ofrecer la disponibilidad toda la información. Tambien existen los Google books un esfuerzo de Google por digitalizar las colecciones que se encuentran en diferentes bibliotecas y ponerlas a disposición de todo el mundo Google hace esto con el fin de aumentar sus búsquedas pero también con un sentido altruista. Esta innovación proviene del 20% del tiempo que los empleados desarrollan trabajos que realmente quieren investigar el otro 80% es del trabajo que realizan para la empresa

¿Pero como afecta esto a la privacidad? a ello responde Ian Brown quien trabaja en el Open Rights Group, ser más cuidadosos con la información personal ya que Google ha declarado públicamente que retiene los datos de búsqueda, de que ordenador se ha realizado la búsqueda y dirección de Internet del mismo con ello se puede rastrear a cualquier persona, con ello los gobiernos pueden solicitar a Google sobre que esta averiguando las personas y allí es donde comienza el problema de la privacidad. Google esta alcanzando unas dimensiones que lo obligaran a ser vigilado por los tribunales de competencia de Estados Unidos y Europa, por ello es que debe existir diversidad para que las personas tengan diferentes caminos para acceder a la misma información , a esto Alli Marissa Mayer asegura que la política de privacidad de Google dice que los datos se retienen no para crear perfiles si no para usar estos datos para mejorar las búsquedas un ejemplo claro es la opción “usted quiso decir” se desarrollo gracias a los datos que se retuvieron.

Para mas información visita el siguiente video que tiene 5 partes

Bibliografía

YOUTUBE. El Mundo Segun Google (en español) P1, 2008. (consultado el 10-03-2011) .Disponible en: http://www.youtube.com/watch?v=747sTYxz2XM&feature=youtube_gdata_player.

Como profesionales debemos afrontar el problema de recuperar información por la aparición de bibliotecas digitales ( bibliotecas hibridas) y el crecimiento vertiginoso de recursos electrónicos.

Esto se ha se hace posible por tres lineas de acción

1. Indices compilados manualmente.

2. Bases de datos creadas por robots o arañas

3. Métodos de indización distribuida

1. Índices compilados manualmente

Los indices son creados por los usuarios manualmente

2. Bases de Datos creadas por robots o arañas

‘Robots.txt : Todo lo que deberia saber | Emezeta’ [accedido 6 Marzo 2011].

Estos rastreadores ingresan a nuestro sitio web en busca de información navegan por el hipertexto con el fin de alimentar bases de datos textuales a partir de documentos HTML, así como otro tipo de formatos de edición electrónica, distribuidos en diferentes servidores.

Estos robots toman los archivos en las páginas y sacan nueva información a partir de ello con esto indizan.

El problema es que se recupera información que no es relevante, cualquier busqueda arroja demasiados resultados , por la falta que las páginas web esten lo suficientemente descritas , lo que hace imposible acceder por titulo, autor, codigos de materia.

Bibliografía

SENSO, José A. y ROSA PINERO, Antonio de la. El concepto de metadato: algo más que descripción de recursos electrónicos. Ci. Inf. [online]. 2003, vol.32, n.2, pp. 95-106. ISSN 0100-1965. doi: 10.1590/S0100-19652003000200011.

Los Quijotes de la Recuperación de Información

jueves, 10 de marzo de 2011

Conoce un poco más de Google

miércoles, 9 de marzo de 2011

Lo que necesitas saber sobre documento electronico, digital y virtual

Una aproximación a la recuperación de información

1. Índices compilados manualmente

Bibliografía

SENSO, José A. y ROSA PINERO, Antonio de la. El concepto de metadato: algo más que descripción de recursos electrónicos. Ci. Inf. [online]. 2003, vol.32, n.2, pp. 95-106. ISSN 0100-1965. doi: 10.1590/S0100-19652003000200011.

Buscar en Metabiblioteca/Ecuador

Los Quijotes de la Recuperación de Información

Páginas

PlanetaColombia