ARACNET VOL III

Número 3, abril de 1999
Índice

 

ARACNET

.

Publicación de ENTOMOLOGÍA

.

 

Índice

Cómo encontrar en la red: buscadores
(2ª Parte)
.

Juan José DE HARO
jjdeharo@terra.es
Departamento de Biología Animal, Vegetal y Ecología
Universidad Autónoma de Barcelona
08193 Bellaterra (Barcelona)
ESPAÑA

Introducción

    Tal como avanzamos en la primera parte de este artículo, analizaremos la sintaxis de búsqueda avanzada haciendo hincapié en los elementos comunes a los diferentes buscadores. También se proporcionarán sistemas alternativos de búsqueda, tales como los programas que buscan simultáneamente en varios buscadores o aquellos que nos envían los resultados por correo electrónico.

Sintaxis avanzada

    Algunos buscadores poseen opciones para realizar una búsqueda avanzada en la que se pueden introducir expresiones lógicas del tipo AND, NOT, OR, etc. Como norma general estas expresiones hay que escribirlas en mayúsculas ya que algunos buscadores así lo exigen.

  • AND

    Esta expresión fuerza la aparición de las dos expresiones que une. Por ejemplo, si deseamos buscar las páginas en las que aparece un especialista en neurópteros llamado Smith, podríamos utilizar la siguiente secuencia:

neuroptera AND smith

Nos dará como resultado las páginas que contengan ambas palabras, sean éstas contiguas o no.

  • OR

    Muestra las páginas que contienen alguna o las dos expresiones que une. Para encontrar páginas relativas a la familia Eulophidae podríamos usar la siguiente sentencia:

eulophidae OR eulofido OR eulophid

El resultado estará formado por las páginas que contengan una, dos o las tres palabras.

  • AND NOT

    Se suele utilizar para refinar una búsqueda. En el caso que se obtengan demasiadas páginas sobre un determinado tema podemos impedir la aparición de parte de ellas. AND NOT permite excluir determinadas palabras de la búsqueda.

phylogeny AND bee AND NOT halictus

Se mostrarán los documentos sobre filogenia de abejas, excluyendo al género Halictus.

  • NEAR

    Es un tipo especial de búsqueda AND, muestra los documentos cuyas palabras son cercanas, es decir, separadas por pocos términos. Es útil para excluir algunas páginas con una gran cantidad de texto inconexo entre sí.

neuroptera NEAR smith

Esta búsqueda nos mostrará los documentos que contengan la palabra 'neuroptera' y 'smith' relativamente cercanas.

    Altavista realiza las búsquedas con 10 palabras de separación como máximo entre ellas. Dejanews permite indicar el número de palabras de separación:

neuroptera NEAR 20 smith

Obtendremos los documentos que contengan ambas expresiones separadas por 20 o menos palabras.

  • Paréntesis y comillas

    Los paréntesis permiten agrupar las expresiones lógicas para realizar búsquedas complejas. Las comillas dobles sirven para encontrar las frases exactamente igual a como están escritas.

(filogenia OR phylogeny) AND (bee OR abeja OR apis) AND NOT halictus

    Con esta expresión obtendremos resultados sobre filogenia de abejas excluyendo el género Halictus, tanto si el documento se encuentra en inglés como en castellano.

"scientific american" NEAR entomology

Esta búsqueda dará como resultado los documentos donde se cite a la revista Scientific American y se hable de entomología.

  • Uso de mayúsculas y caracteres especiales

    Muchos buscadores diferencian entre mayúsculas y minúsculas. Si se escribe una palabra con mayúsculas el buscador nos      mostrará documentos que tengan las mayúsculas en la misma posición, ignorando la misma palabra con minúsculas. Si se escribe la palabra en minúsculas el resultado estará formado por todas las páginas que tengan esa palabra, independientemente de que esté en mayúsculas o minúsculas. Por este motivo es recomendable escribir las búsquedas siempre en minúsculas.

    Los acentos, la 'ñ' y otros caracteres no disponibles en el teclado anglosajón son normalmente ignorados por los buscadores. Así, si introducimos la palabra 'caña', los buscadores nos devolverán tanto las páginas que contengan 'cana' como 'caña'. Con los acentos sucede algo semejante y la búsqueda de 'entomología' nos proporcionará tanto las páginas con 'entomologia' como con 'entomología'. Como norma general es preferible no poner acentos en las búsquedas ya que obtendremos los mismos resultados que si los ponemos y prevenimos los buscadores que no admiten los acentos.

  • Consejos para las búsquedas

    Para evitar resultados con excesiva cantidad de información es conveniente restringir las búsquedas mediante el uso de las expresiones lógicas explicadas anteriormente. Muchos buscadores permiten limitar la búsqueda al título de la página, la dirección o el servidor. Pero únicamente Altavista permite incluir esta información de forma escrita por parte del usuario. El resto de los buscadores permiten hacerlo a través de la selección apropiada en un formulario.

    Las expresiones que se usan en Altavista (USA y Magallanes) son las siguientes:

Tabla 1. Búsqueda avanzada en Altavista y Altavista Magallanes

Sintaxis

Utilidad

Ejemplo

host:dirección

Muestra las páginas de un determinado servidor

host:www.ub.es

(Muestra las páginas indexadas de la Universidad de Barcelona)

domain:nombre

Muestra las páginas de un determinado dominio (es, com, net, uk, etc.) coccinelidae AND domain:.it

(Muestra las páginas relativas a Coccinelidae alojadas en servidores italianos)

title:título_buscado

Realiza búsquedas en los títulos de las páginas title:odonata OR title:odonatos

(Páginas cuyo título sea Odonota u odonatos)

url:dirección

Busca palabras en las direcciones de Internet (incluyendo el dominio y el servidor) url:entomologia

(Documentos cuya dirección contenga la palabra 'entomologia')

Pueden consultarse más opciones en http://www.altavista.magallanes.net/esp/help_advanced.htm

    Si buscamos temas genéricos o amplios será aconsejable realizar la búsqueda en el servidor (host) y posteriormente en la dirección (URL) ya que de esta forma podremos encontrar sitios web dedicados exclusivamente al tema buscado, en el primer caso, y páginas temáticas en el segundo.

    Por ejemplo, la búsqueda en Altavista de host:lepidoptera proporciona como único resultado el servidor: www.lepidoptera.com dedicado al arte gráfico con lepidópteros.

    La búsqueda url:lepidoptera nos da como resultado 619 páginas web con este nombre (incluida la anterior). Estas páginas tratan todas, de un modo u otro, de lepidópteros.

    Buscando title:lepidoptera produce 428 páginas web cuyo título tiene esta palabra.

    La búsqueda menos selectiva, es decir, usando directamente la palabra lepidoptera nos da como resultado 59640 páginas en las que aparece, ya sea en la dirección, título o texto.

    Si estuviésemos interesados en conseguir imágenes de la familia Geometridae podríamos realizar la siguiente búsqueda:

(images OR photos OR imagenes OR fotografias OR dibujos OR pictures) AND geometridae

    Lo que nos proporciona 130 páginas web. Si decidimos que son demasiadas y que, en realidad, únicamente nos interesaba la subfamilia Larentiinae la búsqueda sería:

(images OR photos OR imagenes OR fotografias OR dibujos OR pictures) AND larentiinae

    Lo que reduce el número de páginas a 28. Ahora ya podemos pasar a revisarlas una por una para comprobar cuales son de nuestro agrado.

    En ocasiones será preferible escribir parte de una palabra en lugar de la palabra entera para que nos pueda encontrar todas las variantes de la misma. Por ejemplo, buscando 'entom' conseguiremos los mismos resultados que buscando 'entomologia', 'entomology', 'entomologo', 'entomologist', etc. Algunos buscadores buscan palabras completas y entonces se pueden utilizar comodines para realizar el mismo efecto. Es el caso de Dejanews, para realizar la búsqueda anterior habría que introducir la palabra 'entom*'. El asterisco es un carácter comodín que suple a cualquier terminación de la palabra. Si estuviésemos interesados en buscar la palabra 'entom' en un buscador distinto de Dejanews deberíamos poner la palabra entre comillas dobles para evitar que nos buscase variantes de esta misma palabra.

Tabla 2. Uso de operadores lógicos y avanzados por parte de los buscadores que los soportan
 

AND

OR

AND NOT

NEAR

"..."

(...)

Comodines

Altavista Magallanes

No

Altavista, Usa

No

Dejanews

Excite

No

No

 

Buscadores personales, alternativas al buscador basado en la web

Buscadores personales, alternativas al buscador basado en la web

    Los buscadores que hemos tratado hasta ahora en este trabajo deben ser consultados a través de la página web que cada uno de ellos tiene. Aunque de buscadores de este tipo hay literalmente miles, las alternativas diferentes no pasan de ser unas cuantas, no obstante, algunas de ellas merecen ser tenidas muy en cuenta.

Programas buscadores

    Existen programas que se descargan de Internet y realizan las búsquedas en varios buscadores simultáneamente, por lo que se pueden obtener resultados más satisfactorios que en uno solo. En esta categoría podemos citar SSSpider (http://www.kryltech.com/spider.htm) que provee de una versión completa útil durante 30 días, siendo la definitiva de pago. Web Bandit (http://www.tsmk.se/wb/) tiene una versión limitada gratuita, además de la de pago. MacroBot Pro (http://209.45.182.34/macrobot/mcrbtfree.htm) es gratuita pero sólo realiza las búsquedas en Yahoo USA.

    En último lugar citaremos WebFerret (http://www.ferretsoft.com) que dispone de una versión gratuita limitada y otra completa de pago. A diferencia de los anteriores programas buscadores, este último permite realizar búsquedas utilizando operadores lógicos del tipo AND, OR y AND NOT. También permite el uso de paréntesis y comillas, además, se puede limitar la búsqueda al título o al cuerpo de la página. Con cada resultado se proporciona el porcentaje de relevancia con respecto a la búsqueda, la dirección, el título de la página, el buscador en el que ha sido encontrada y el resumen de la misma.

La búsqueda de imágenes de Larentiinae con WebFerret da como resultado 126 documentos.

Figura 1. Resultados obtenidos mediante la versión registrada de WebFerret

    Los resultados de la búsqueda pueden guardarse en un archivo para ser imprimidos o utilizados posteriormente. Permite archivar en un formato sólo apto para ser abierto con el mismo programa, especialmente para repetir la misma consulta en momentos diferentes y también en formato texto delimitado por comas, el cual puede ser abierto mediante otros programas tales como una hoja de cálculo o una base de datos.

Buscador por correo electrónico

    Otro tipo de buscador es el que envía los resultados por correo electrónico. Posee la ventaja de que, una vez construida la búsqueda, el robot buscador se encarga de enviar periódicamente los documentos por correo electrónico (10 resultados como máximo). Esto permite ir obteniendo los resultados de una forma lenta y escalonada, pudiéndose revisar todas las páginas resultado de la consulta.

    Aunque el autor de este trabajo ha buscado de forma exhaustiva por todo Internet buscadores de este tipo, la verdad es que sólo ha podido encontrar uno. Éste es The Informant (http://informant.dartmouth.edu/).

    Su uso es gratuito y únicamente es necesario proporcionar un nombre de usuario, contraseña y dirección de correo electrónico. Tras indicar estos datos, se pueden especificar hasta 3 cadenas de búsqueda, utilizando OR o AND. Se debe indicar también el buscador que se desea utilizar (Altavista, Lycos, Excite o Infoseek). Los resultados se envían con periodicidad de 3, 7, 14 ó 30 días, según se haya indicado previamente. Tiene la ventaja de que se pueden abrir tantas cuentas como se deseen.

Figura 2. The Informant. El único buscador que envía los resultados por correo electrónico.

 

Conclusiones

    Todo el éxito que tengamos cuando buscamos información sobre un determinado tema va a depender del uso que hagamos de las herramientas que Internet nos brinda para buscarla. A diferencia de una biblioteca, base de datos o listín telefónico, no existe ningún sitio donde podamos acudir para encontrar, con una certeza del 100%, información sobre un determinado tema. Si la información es escasa deberemos usar varios buscadores o programas de búsqueda que lo hagan por nosotros. Si, por el contrario, el problema es la sobre-información tendremos que usar los operadores lógicos (o sus equivalentes en forma de formulario) en los buscadores. Una vez nos manejemos con soltura con estos elementos podremos extraer de sus fuentes el petróleo del siglo XXI, como empieza a denominarse la información.


Índice


 

¡Recibe un e-mail cuando esta página cambie!


it's private
Powered by
ChangeDetection

Volver a la última página visitada   [ Mapa de ARACNET ] [ Mapa de la CV-e ]  [Cómo citar los artículos de ARACNETImprimir

© 1999-2002 CV-e Comunidad Virtual de Entomología - http://entomologia.rediris.es - admin@entomologia.rediris.es