Un motor de búsqueda o buscador, como coloquialmente se le conoce, es un sistema para obtener información, diseñado para facilitar la localización de información almacenada en un sistema de cómputo. Un objetivo primordial de los buscadores es minimizar el tiempo requerido para encontrar información y, cuando se habla de la que se encuentra en internet, también se quiere minimizar la cantidad que se debe revisar. Los buscadores más comunes son aquellos especializados en la web, o buscadores web, aunque los hay de muchos tipos, entre ellos los personales, que sirven para localizar rápidamente información en un equipo de cómputo personal, o los institucionales, que buscan solamente en servidores y máquinas locales de la organización.
Existen muchos buscadores, cada uno con sus propias técnicas y tecnología. A manera de ejemplo, aquí se hablará sobre la tecnología de uno de los buscadores más importantes que concentra más de 50% de las búsquedas en la web: Google. Antes que nada, ¿cómo sabe el buscador qué palabras aparecen en un sitio o página web dada? Se logra generando un índice, a través de programas que navegan de manera autónoma en la web. Estos programas reciben el nombre de arañas, robots o rastreadores. El robot de Google se llama GoogleBot y recorre las páginas web como si fueran una autopista; cada vez que encuentra una página nueva, analiza el código, lo rastrea y lo envía a su centro de datos.
Otro robot, en este caso el FreshBot, se encarga de visitar sitios previamente indexados para mantener su información al día, buscar cambios e integrarlos a su índice. La base de datos de Google mantiene miles de millones de páginas y utiliza un algoritmo propietario para calificar la relevancia de los sitios. Cuando un usuario ingresa una cadena de búsqueda, utilizan estos valores de relevancia para entregar los resultados ordenados.
Algunos datos curiosos de Google:
• Su nombre nació de la palabra googol, que significa 1 seguido de cien ceros.
• Su índice incluye miles de millones de páginas y su capacidad es tal que puede buscar en todas ellas en menos de medio segundo.
• Sus grupos de discusión contienen más de 845 000 000 de mensajes de Usenet, lo que representa la colección más grande de mensajes: más de un terabyte de conversación humana.