Juan José DE HARO Introducción Tal como avanzamos en la primera parte de este artículo, analizaremos la sintaxis de búsqueda avanzada haciendo hincapié en los elementos comunes a los diferentes buscadores. También se proporcionarán sistemas alternativos de búsqueda, tales como los programas que buscan simultáneamente en varios buscadores o aquellos que nos envían los resultados por correo electrónico. Sintaxis avanzada Algunos buscadores poseen opciones para realizar una búsqueda avanzada en la que se pueden introducir expresiones lógicas del tipo AND, NOT, OR, etc. Como norma general estas expresiones hay que escribirlas en mayúsculas ya que algunos buscadores así lo exigen.
Esta expresión fuerza la aparición de las dos expresiones que une. Por ejemplo, si deseamos buscar las páginas en las que aparece un especialista en neurópteros llamado Smith, podríamos utilizar la siguiente secuencia:
Nos dará como resultado las páginas que contengan ambas palabras, sean éstas contiguas o no.
Muestra las páginas que contienen alguna o las dos expresiones que une. Para encontrar páginas relativas a la familia Eulophidae podríamos usar la siguiente sentencia:
El resultado estará formado por las páginas que contengan una, dos o las tres palabras.
Se suele utilizar para refinar una búsqueda. En el caso que se obtengan demasiadas páginas sobre un determinado tema podemos impedir la aparición de parte de ellas. AND NOT permite excluir determinadas palabras de la búsqueda.
Se mostrarán los documentos sobre filogenia de abejas, excluyendo al género Halictus.
Es un tipo especial de búsqueda AND, muestra los documentos cuyas palabras son cercanas, es decir, separadas por pocos términos. Es útil para excluir algunas páginas con una gran cantidad de texto inconexo entre sí.
Esta búsqueda nos mostrará los documentos que contengan la palabra 'neuroptera' y 'smith' relativamente cercanas. Altavista realiza las búsquedas con 10 palabras de separación como máximo entre ellas. Dejanews permite indicar el número de palabras de separación:
Obtendremos los documentos que contengan ambas expresiones separadas por 20 o menos palabras.
Los paréntesis permiten agrupar las expresiones lógicas para realizar búsquedas complejas. Las comillas dobles sirven para encontrar las frases exactamente igual a como están escritas.
Con esta expresión obtendremos resultados sobre filogenia de abejas excluyendo el género Halictus, tanto si el documento se encuentra en inglés como en castellano.
Esta búsqueda dará como resultado los documentos donde se cite a la revista Scientific American y se hable de entomología.
Muchos buscadores diferencian entre mayúsculas y minúsculas. Si se escribe una palabra con mayúsculas el buscador nos mostrará documentos que tengan las mayúsculas en la misma posición, ignorando la misma palabra con minúsculas. Si se escribe la palabra en minúsculas el resultado estará formado por todas las páginas que tengan esa palabra, independientemente de que esté en mayúsculas o minúsculas. Por este motivo es recomendable escribir las búsquedas siempre en minúsculas. Los acentos, la 'ñ' y otros caracteres no disponibles en el teclado anglosajón son normalmente ignorados por los buscadores. Así, si introducimos la palabra 'caña', los buscadores nos devolverán tanto las páginas que contengan 'cana' como 'caña'. Con los acentos sucede algo semejante y la búsqueda de 'entomología' nos proporcionará tanto las páginas con 'entomologia' como con 'entomología'. Como norma general es preferible no poner acentos en las búsquedas ya que obtendremos los mismos resultados que si los ponemos y prevenimos los buscadores que no admiten los acentos.
Para evitar resultados con excesiva cantidad de información es conveniente restringir las búsquedas mediante el uso de las expresiones lógicas explicadas anteriormente. Muchos buscadores permiten limitar la búsqueda al título de la página, la dirección o el servidor. Pero únicamente Altavista permite incluir esta información de forma escrita por parte del usuario. El resto de los buscadores permiten hacerlo a través de la selección apropiada en un formulario. Las expresiones que se usan en Altavista (USA y Magallanes) son las siguientes:
Si buscamos temas genéricos o amplios será aconsejable realizar la búsqueda en el servidor (host) y posteriormente en la dirección (URL) ya que de esta forma podremos encontrar sitios web dedicados exclusivamente al tema buscado, en el primer caso, y páginas temáticas en el segundo. Por ejemplo, la búsqueda en Altavista de host:lepidoptera proporciona como único resultado el servidor: www.lepidoptera.com dedicado al arte gráfico con lepidópteros. La búsqueda url:lepidoptera nos da como resultado 619 páginas web con este nombre (incluida la anterior). Estas páginas tratan todas, de un modo u otro, de lepidópteros. Buscando title:lepidoptera produce 428 páginas web cuyo título tiene esta palabra. La búsqueda menos selectiva, es decir, usando directamente la palabra lepidoptera nos da como resultado 59640 páginas en las que aparece, ya sea en la dirección, título o texto. Si estuviésemos interesados en conseguir imágenes de la familia Geometridae podríamos realizar la siguiente búsqueda:
Lo que nos proporciona 130 páginas web. Si decidimos que son demasiadas y que, en realidad, únicamente nos interesaba la subfamilia Larentiinae la búsqueda sería:
Lo que reduce el número de páginas a 28. Ahora ya podemos pasar a revisarlas una por una para comprobar cuales son de nuestro agrado. En ocasiones será preferible escribir parte de una palabra en lugar de la palabra entera para que nos pueda encontrar todas las variantes de la misma. Por ejemplo, buscando 'entom' conseguiremos los mismos resultados que buscando 'entomologia', 'entomology', 'entomologo', 'entomologist', etc. Algunos buscadores buscan palabras completas y entonces se pueden utilizar comodines para realizar el mismo efecto. Es el caso de Dejanews, para realizar la búsqueda anterior habría que introducir la palabra 'entom*'. El asterisco es un carácter comodín que suple a cualquier terminación de la palabra. Si estuviésemos interesados en buscar la palabra 'entom' en un buscador distinto de Dejanews deberíamos poner la palabra entre comillas dobles para evitar que nos buscase variantes de esta misma palabra.
Buscadores personales, alternativas al buscador basado en la web Buscadores personales, alternativas al buscador basado en la web Los buscadores que hemos tratado hasta ahora en este trabajo deben ser consultados a través de la página web que cada uno de ellos tiene. Aunque de buscadores de este tipo hay literalmente miles, las alternativas diferentes no pasan de ser unas cuantas, no obstante, algunas de ellas merecen ser tenidas muy en cuenta. Programas buscadores Existen programas que se descargan de Internet y realizan las búsquedas en varios buscadores simultáneamente, por lo que se pueden obtener resultados más satisfactorios que en uno solo. En esta categoría podemos citar SSSpider (http://www.kryltech.com/spider.htm) que provee de una versión completa útil durante 30 días, siendo la definitiva de pago. Web Bandit (http://www.tsmk.se/wb/) tiene una versión limitada gratuita, además de la de pago. MacroBot Pro (http://209.45.182.34/macrobot/mcrbtfree.htm) es gratuita pero sólo realiza las búsquedas en Yahoo USA. En último lugar citaremos WebFerret (http://www.ferretsoft.com) que dispone de una versión gratuita limitada y otra completa de pago. A diferencia de los anteriores programas buscadores, este último permite realizar búsquedas utilizando operadores lógicos del tipo AND, OR y AND NOT. También permite el uso de paréntesis y comillas, además, se puede limitar la búsqueda al título o al cuerpo de la página. Con cada resultado se proporciona el porcentaje de relevancia con respecto a la búsqueda, la dirección, el título de la página, el buscador en el que ha sido encontrada y el resumen de la misma. La búsqueda de imágenes de Larentiinae con WebFerret da como resultado 126 documentos.
Los resultados de la búsqueda pueden guardarse en un archivo para ser imprimidos o utilizados posteriormente. Permite archivar en un formato sólo apto para ser abierto con el mismo programa, especialmente para repetir la misma consulta en momentos diferentes y también en formato texto delimitado por comas, el cual puede ser abierto mediante otros programas tales como una hoja de cálculo o una base de datos. Buscador por correo electrónico Otro tipo de buscador es el que envía los resultados por correo electrónico. Posee la ventaja de que, una vez construida la búsqueda, el robot buscador se encarga de enviar periódicamente los documentos por correo electrónico (10 resultados como máximo). Esto permite ir obteniendo los resultados de una forma lenta y escalonada, pudiéndose revisar todas las páginas resultado de la consulta. Aunque el autor de este trabajo ha buscado de forma exhaustiva por todo Internet buscadores de este tipo, la verdad es que sólo ha podido encontrar uno. Éste es The Informant (http://informant.dartmouth.edu/). Su uso es gratuito y únicamente es necesario proporcionar un nombre de usuario, contraseña y dirección de correo electrónico. Tras indicar estos datos, se pueden especificar hasta 3 cadenas de búsqueda, utilizando OR o AND. Se debe indicar también el buscador que se desea utilizar (Altavista, Lycos, Excite o Infoseek). Los resultados se envían con periodicidad de 3, 7, 14 ó 30 días, según se haya indicado previamente. Tiene la ventaja de que se pueden abrir tantas cuentas como se deseen.
Conclusiones Todo el éxito que tengamos cuando buscamos información sobre un determinado tema va a depender del uso que hagamos de las herramientas que Internet nos brinda para buscarla. A diferencia de una biblioteca, base de datos o listín telefónico, no existe ningún sitio donde podamos acudir para encontrar, con una certeza del 100%, información sobre un determinado tema. Si la información es escasa deberemos usar varios buscadores o programas de búsqueda que lo hagan por nosotros. Si, por el contrario, el problema es la sobre-información tendremos que usar los operadores lógicos (o sus equivalentes en forma de formulario) en los buscadores. Una vez nos manejemos con soltura con estos elementos podremos extraer de sus fuentes el petróleo del siglo XXI, como empieza a denominarse la información. |
[ Mapa de ARACNET ] [ Mapa de la CV-e ] [Cómo citar los artículos de ARACNET] © 1999-2002 CV-e Comunidad Virtual de Entomología - http://entomologia.rediris.es - admin@entomologia.rediris.es |