Hay varios trucos para sacarle el jugo a los motores de búsqueda y obtener resultados más precisos.
Como explica con detalle Ricardo Sametband en La Nación, nadie duda que Google es, hoy, el sitio más importante de la Red y el puerto digital de muchísimos navegantes. Su valor reside en la gran cantidad de páginas Web indexadas (3.307.998.701 al cierre de esta edición), en su eficiencia a la hora de catalogar los datos y en la simpleza de su diseño, que facilita el acceso a la información que provee.
La potencia de su motor, sin embargo, a veces le juega en contra al navegante: una búsqueda de la palabra verano arrojará casi 1,2 millón de resultados.
El usuario avanzado, sin embargo, sabrá que esta forma de buscar es la menos efectiva, y que el propio Google (al igual que la mayoría de los demás buscadores) ofrece herramientas para afinar la pesquisa.
Palabras clave
En principio, use más de un término en la búsqueda para hacerla más precisa. Olvídese de los artículos: los buscadores los ignorarán, precisamente porque son lo más común en los textos (buscar vacaciones de verano o vacaciones verano es lo mismo, si no se encierran estas frases entre comillas)
En Google puede aprovechar el signo más (+), que indica que una palabra debe estar sí o sí en el texto de las páginas consultadas (verano +vacaciones); el signo menos (--), para excluir un término de las mismas (vacaciones --invierno); las comillas (""), para que busque una frase exacta ("mar del plata"), o el comando site: seguido de una dirección Web para que consulte la presencia de un término en páginas sólo de ese dominio (periodismo site: www.periodistadigital.com).
Pero hay más. Con filetype: (seguido por el formato de archivo deseado) Google buscará las palabras clave sólo en esos tipos de archivo (recuerde, Google puede leer PDF, DOC, RTF y TXT, además de HTML, ASP y PHP). Un ejemplo: vacaciones filetype:doc. Con inurl: la búsqueda requerirá que el término en cuestión figure en la dirección Web (por ejemplo, si recuerda que una página sobre determinado tema tenía una dirección que no tenía nada que ver: vacaciones inurl:mateando); con intitle: sólo se mostrarán páginas que tengan la palabra deseada en su título (por ejemplo, intitle:vacaciones).
El superdirectorio
Buscar por palabras tiene un defecto: aparece todo tipo de sitios, sin importar su calidad o la precisión de su información (incluyendo páginas de publicidad sin relación con los términos clave que contienen). Aquí son fundamentales los directorios, y Yahoo! es el líder indiscutido.
En este tipo de índices, los sitios son agregados en forma manual; es decir, una persona (un editor, en la jerga) verifica que el sitio tenga realmente información sobre cierto tema. Esto le da mucho más valor a los resultados de una búsqueda, porque se garantiza su pertinencia, etcétera.
Los directorios permiten, además, ver un listado de los sitios disponibles sobre un mismo tema e ir refinando la búsqueda usando la clasificación por categorías.
Yahoo! también ofrece un buscador basado en la tecnología de Google (ar.search.yahoo.com ; los resultados se combinan con los de su directorio), así como este último incluye un directorio en su sitio ( www.google.com/dirhp , basado en el Open Directory, dmoz.org , hecho por voluntarios). Ambos son capaces, además, de buscar imágenes y noticias sobre un tema específico.
Sabuesos de todo tipo
Google y Yahoo! no alcanzan, sin embargo, a indexar toda la Red ni mucho menos. Se calcula que sólo la mitad de las páginas de la Web está en la base de datos de Google. Esto es así porque los robots de búsqueda de Google sólo llegarán a una página si hay un enlace a ella desde otra página (o si fue sugerida por sus creadores, ver recuadro). Hay miles de millones de páginas que no aparecen en ningún listado, o lo hacen en unos pocos.
Por eso una consulta a otros buscadores puede deparar resultados diferentes, sobre todo si son sitios especializados, que luego se pueden combinar para hacer una búsqueda más exhaustiva.
Por ejemplo, AlltheWeb (www.alltheweb.com ) tiene una extensísima base de datos, y busca competir con Google con sus 3100 millones de páginas indexadas. Si quiere consultar ambos a la vez (y otros motores de búsqueda populares) puede recurrir a los metabuscadores. Estos sitios no tienen una lista de páginas propia, sino que inician pesquisas en varios buscadores al mismo tiempo, y combinan luego los resultados.
Esto ofrece, por ejemplo, el excelente ez2Find ( ez2find.com ), capaz de agrupar los datos ofrecidos por Google, AlltheWeb, Open Directory, Altavista, MSN, Yahoo!, Wisenut y Teoma; Mamma ( www.mamma.com ) y Dogpile ( www.dogpile.com ), dos decanos en el tema, ofrecen algo similar, lo mismo que Vivísimo ( www.vivisimo.com ). Un directorio que puede arrojar resultados interesantes es Ask Jeeves ( www.ask.com ; también ofrece un motor de búsqueda convencional).
Estos sitios son buscadores globales, y sus bases de datos se forman a partir de sitios norteamericanos. Aunque listan páginas del resto del mundo, una consulta sobre un tema regional puede muchas veces dar mejores resultados con un buscador o un directorio de la zona (las páginas en español tienden a enlazarse unas a otras, pero es probable que tengan pocas conexiones con páginas senegalesas, por más que en estas últimas haya buena información).
Si necesita más, puede consultar los listados de www.searchenginecolossus.com , www.search-engine-index.co.uk, www.allsearchengines.com o www.searchengineguide.com/search-engines.html .
Soft de búsqueda
Una alternativa para iniciar una pesquisa es recurrir al software. Su versión más popular está en las barras de búsqueda que se agregan a las demás barras del Internet Explorer. Hoy, cualquier buscador que se precie ofrecerá la descarga de un plugin para ese browser. No obstante, el más conocido sigue siendo el Google Toolbar ( toolbar.google.com ; los usuarios de Netscape o Mozilla deberán dirigirse a googlebar.mozdev.org ).
A propósito, si se escribe una palabra (o varias) en la barra de direcciones del Internet Explorer, la aplicación usará el motor de búsqueda de MSN. Netscape y Mozilla ofrecen hacerlo con Google; Firebird (basado en Mozilla) agrega un casillero de consulta al lado de la barra de direcciones para este mismo motor de búsqueda (aunque se pueden usar otros). Google presentó también el Deskbar, que abre un cuadro de búsqueda en la barra de tareas. Allí se anotan las palabras clave y los resultados aparecen en una ventana emergente (o en el browser).
Lo mismo, pero con muchísimas más opciones, es lo que ofrece el excelente freeware Dave´s Quick Search Taskbar Toolbar Deskbar ( hnotesbydave.com/toolbar/doc.htm ), capaz de consultar múltiples buscadores, generar alarmas, hacer cálculos, iniciar pesquisas en diversas bases de datos, etcétera. Esta aplicación es de código abierto (GNU), por lo que se pueden generar nuevos comandos de búsqueda.
Tenga en cuenta que algunas de estas aplicaciones pueden monitorear sus costumbres en la Red (sobre todo en lo que respecta a las búsquedas). La información registrada y transmitida suele ser anónima e inocua.
No obstante, no está de más consultar sitios como www.spychecker.com o www.spyware-guide.com para verificar que no tenga spyware (también pude instalar el software Ad-aware, o cualquiera de los otros programas gratis que revisan la máquina en busca de programas espía; Mi PC le dedicó una nota al tema en su número del 18 de agosto último).
La aplicación para la barra de tareas de Google, por ejemplo, registra estas estadísticas, aunque ofrece la opción de desactivarlas (en la solapa General de la opción Settings).
También hay aplicaciones independientes del navegador, como el pionero WebFerret ( www.ferretsoft.com , gratis), que consulta varios motores de búsqueda, agrupa los resultados y los guarda como HTML. Permite definir en qué parte de la página debe aparecer la palabra buscada.
El freeware FirstStop Websearch ( www.firststopwebsearch.com ) también busca en varios índices. Es capaz de organizar los resultados en un árbol jerárquico, según el contexto que rodea el término encontrado (si aparece en el título, en la URL, en el cuerpo del texto, etcétera). También es posible verificar los resultados (para no perder tiempo esperando a que se carguen páginas que ya no existen, pero que quedaron en la base de datos del buscador), hacer varias búsquedas en una misma sesión y tenerlas todas juntas, etcétera.
PractiSearch ( www.practisearch.com , freeware), por su parte, aparece como una pequeña ventana de búsqueda que flota sobre el Escritorio (se activa con atajo de teclas o en combinación con el mouse), o como un menú contextual del mouse dentro del Internet Explorer (al pintar una palabra con el cursor). Es posible definir consultas en buscadores y muy diversos sitios (diccionarios, sitios de subastas, etcétera).
Por último, el Copernic Agent Basic ( www.copernic.com , gratis) permite definir el tipo de motores de búsqueda, directorios o base de datos sobre los que realizará la consulta. Incluso puede mostrar una miniatura de las páginas que aparecen en el listado de resultados, filtrar éstos según diversos parámetros, etcétera.
La Web dejará entonces de ser un galimatías y se podrá, finalmente, encontrar ese dato tan necesario sin perder horas frente a la pantalla.
Para el webmaster
Encontrar páginas con determinado contenido está muy bien, pero, ¿qué pasa si queremos que nuestra página aparezca en el buscador?
En principio, hay dos maneras de acceder a las listas de los directorios y buscadores más populares.
La primera es pagando un abono mensual o anual, que asegura una presencia destacada dentro de la lista de resultados.
La otra es hacerlo manualmente. Aunque el método varía de buscador a buscador, se piden siempre determinados datos, como la URL de la página, una categorización temática y una descripción de la misma.
La demora en la aparición en las listas dependerá del sitio apelado, aunque en los directorios tiende a ser de un par de semanas.
Para aparecer en Google, por ejemplo, hay que ir a www.google.com/addurl.html ; Yahoo! exige sugerir un sitio desde la categoría a la que pertenece.
Los webmaster también reconocen el valor de incluir en las páginas HTML de su sitio meta tags con las palabras clave de las mismas, para facilitar el trabajo a las arañas de los buscadores (las arañas son programas que recorren la Web indexando los contenidos de las páginas).
Después de
debe anotarse Hay más información en español en www.mundoprogramacion.com/HTML_meta.htm y en www.imperios.com/principal/tutoriales/tutorial_metatag.html Inversamente, es posible indicarle a estos programas robot que deben evitar indexar un sitio o una página en particular. Esto se hace colocando el archivo robots.txt con una secuencia de comandos en el directorio raíz del sitio. En www.robotstxt.org se listan los comandos que deben incluirse en ese archivo.
Periodista Digital, 6 de enero de 2004