con distintos criterios y procedimientos para la recogida, indexación, almacenamiento y presentación de información ante las consultas realizadas por usarios a través de Internet.
Máquinas para una información más accesible.
Los motores de búsqueda son sistemas informáticos diseñados para la búsqueda y presentación de información (incluyendo textos, gráficos y elementos audiovisuales) contenidos en archivos existentes en servidores web accesibles a través de Internet mediante el empleo de diversas técnicas y metodología.
Aunque existen motores de búsqueda para gran parte de los protocolos existentes en Internet, nos referiremos a aquellos que operan en relación a la totalidad de la WWW, con capacidad para acceder a todos o la mayoría de los recursos existentes en este medio, e independientemente de su ubicación y los protocolos de acceso que tengan asignados, presentándose así como una herramienta de valor excepcional para la búsqueda de información que se encuentra localizada de forma difusa en Internet.
Es precisamente el enorme volumen de información accesible a través de Internet, su crecimiento constante y exponencial, y su falta de catalogación uniforme lo que a lo largo de la década de 1990 determina el desarrollo de una tecnología que se aparta del proceder en la gestión de los primeros directorios, basado en la intervención de editores humanos, y que presenta una mecánica dividida en cuatro fases.
Rastreo de Contenidos Web - Programas informáticos especialmente diseñados para tal fin (conocidos como robots o arañas) navegan por los distintos archivos web a través de enlaces de hipertexto, recogiendo la información contenida en ellos de forma metódica y con distinto régimen de periodicidad para su posterior tratamiento por otros sistemas parte de los motores de búsqueda a los que sirven. Sistemas automáticos que comienzan su función identificando un número de URLs a visitar, al que se unirán otras presentes en enlaces de hipertexto detectados en un primer análisis, y que aplican diversas metodologías en cuanto a profundidad y frecuencia de visita para la gestión de distintos problemas planteados por el alto volumen contenido en la Web, su rápido ritmo de cambio y el carácter dinámico en la edición de algunas páginas.
Indexación de Contenidos Web - Proceso de almacenamiento indexado de la información en una base de datos a fin de asegurar una recuperación rápida y precisa de la misma frente a futuras búsquedas.
Un proceso que supone el almacenamiento total o parcial de la página objeto de análisis e indexación, incluyendo en ocasiones cierta información sobre la misma, y que se repite de forma periódica a efectos de lograr el mayor grado posible de actualización de contenidos en base a diversos criterios de valoración en cuanto a la novedad correspondiente a la información nuevamente obtenida o a la modificación que supone con respecto a la ya indexada, con importantes desafíos tecnológicos derivados del propio volumen y variabilidad de los contenidos almacenados.
Proceso de Búsqueda - A partir de la realización de una determinada consulta, se procede al contraste de la palabra o expresión utilizada con el índice existente. La mayoría de los motores operativos en Internet permiten la aplicación de lógica booleana para un mayor afinamiento en las búsquedas sobre la base del establecimiento de determinadas relaciones y combinaciones entre los criterios o términos en que aquéllas se realizan, y en cualquiera de las cuatro variantes a continuación.
Algunos motores de búsqueda incluyen funciones avanzadas para la especificación de la proximidad entre palabras clave a la hora de valorar la relevancia de un resultado que contenga dichas claves.
En otros se habilita incluso la utilización de preguntas gramaticalmente correspondientes al lenguaje natural.
Resultado de la Búsqueda - El éxito o fracaso de los motores de búsqueda deriva de su capacidad para ofrecer resultados relevantes a las consultas realizadas por sus usuarios, es decir, referencias a páginas web que contengan información relevante con respecto a las palabras y o frases clave utilizadas durante el procedo de indagación. Así, ante una determinada búsqueda, la mayoría de estos sistemas arrojan como resultado un listado de opciones jerarquizadas a partir de la aplicación de diversos algoritmos y criterios de valoración que toman en cuenta títulos, contenido de palabras y expresiones, densidad y prominencia de las mismas, antigüedad del recurso, grado de modificaciones del mismo a lo largo del tiempo, etc., con un enlace de hipertexto hacia el recurso correspondiente, que incluye generalmente un título y alguna una referencia descriptiva de su contenido.
La mayor parte de los motores de búsqueda están operados por empresas que rentabilizan su funcionamiento mediante la aceptación de pagos a cambio de promocionar enlaces hacia un determinado recurso, o a través de la inclusión de publicidad directa y la puesta en marcha de diversos esquemas para la promoción de sitios web.
por José Manuel Rosón Bravo
(Bilbao, 14 de junio de 2010)
© 2006 - 2012 Oleolik
Grupo JM Rosón
Elcano, 14, Entrpl. Dcha.
48008 Bilbao (Vizcaya)
Teléfono: 650 01 97 36
Fax: 94 410 45 37