ARACNET VOL II

Número 2, marzo de 1999
Índice

 

ARACNET

.

Publicación de la CV-e

.

 

Índice

Cómo encontrar en la red: buscadores
(1ª parte) [2ª parte]
.

Juan José DE HARO
jjdeharo@terra.es
Departamento de Biología Animal Vegetal y Ecología
Universidad Autónoma de Barcelona
08193 Bellaterra (Barcelona)
ESPAÑA

Resumen

    Se analizan 14 buscadores de Internet, 7 específicos en el ámbito del idioma español y otros 7 de alcance internacional. Para la valoración se ha tenido en cuenta la presencia de algunas características importantes de búsqueda, también se ha realizado la búsqueda de algunas palabras con la finalidad de comparar los resultados obtenidos. Se describe la sintaxis que debe ser utilizada en los buscadores para obtener los resultados esperados, así como para refinar en lo posible las búsquedas evitando el exceso de información y los resultados irrelevantes.

Introducción

   La red Internet es una fuente inagotable de información, pero el mayor problema con el que se tropieza todo el que intenta acceder a ella es optimizar la búsqueda de forma que se encuentre aquello en lo que uno está realmente interesado. Indudablemente la cuestión reside más en 'encontrar' que en 'buscar'. El número de buscadores se cifra en varios miles de ellos, distribuidos por todo el mundo. Algunos de los mas importantes buscadores internacionales tienen versiones específicas en español además de la del país originario. Otros son de ámbito exclusivo o prioritario en el idioma español. Dado que es absolutamente imposible examinar todos ellos, ni siquiera una mínima parte, nos centraremos en siete de los buscadores con más prestigio en España y otros siete de los más utilizados a nivel mundial.

   En primer lugar haremos una descripción general de los 14 buscadores para pasar posteriormente a profundizar en el modo de realizar las búsquedas de una forma óptima.

Los buscadores

   Hemos seleccionado 14 buscadores de reconocido prestigio internacional. Aunque todos ellos se presentan como buscadores de tipo genérico, en realidad podemos distinguir dos tipos diferentes. Aquellos cuyo énfasis está puesto en su misión como directorio o índice temático de páginas web (son componentes destacados Olé y Yahoo) y los que tienen como principal misión la de buscar los términos requeridos en inmensas bases de datos que agrupan millones de páginas web (por ejemplo, Altavista).

Tabla 1. Direcciones de los buscadores analizados.

Españoles

Altavista Magallanes

http://www.altavista.magallanes.net/

Biwe

http://www.biwe.es

Elcano

http://www.elcano.com/

Olé

http://www.ole.es

Ozú

http://www.ozu.com

Yahoo España

http://www.yahoo.es

Yupi

http://www.yupi.com

Internacionales

Altavista (USA)

http://www.altavista.com

Dejanews

http://www.dejanews.com

Excite

http://www.excite.com

Hot Bot

http://www.hotbot.com

Infoseek

http://www.infoseek.com/

Web Crawler

http://www.webcrawler.com

Yahoo (USA)

http://www.yahoo.com

   Dejanews no es un buscador de páginas web, como los demás, sino de grupos de noticias (news). En el mundo existen varios cientos de miles de grupos de noticias donde se discute sobre los temas más variados. Este buscador realiza sus búsquedas entre los millones de mensajes que dispone en sus bases de datos. Lo hemos incluido por considerarlo de indudable valor a la hora de recoger información de Internet.

   Las características que se han tenido en cuenta para valorar la capacidad de los buscadores son las indicadas a continuación.

  1. Búsqueda en URL. Es la capacidad de buscar en la propia dirección de Internet. Tiene dos objetivos principales. En primer lugar permite conocer todas las páginas que existen sobre determinado servidor. Por ejemplo, realizando la búsqueda de www.uab.es obtendríamos todas las páginas de la Universidad Autónoma de Barcelona. Por otro lado, permite buscar palabras presentes en la dirección, por ejemplo, buscando "coleoptera", obtendríamos el sitio www.coleoptera.org donde presumiblemente el tema del sitio entero son los coleópteros. Esto nos permite encontrar sitios completamente dedicados a temas específicos.
  2. Búsqueda en título. Es la búsqueda en el título de las páginas (el que aparece en la barra del menú superior del navegador). Esta característica nos permite encontrar páginas que tratan determinado tema (no únicamente en el cuerpo de la página). El hecho de encontrar las palabras en el título nos asegura que esa página está dedicada por entero al tema buscado, ya que el hecho de que una palabra aparezca alguna vez en el interior del texto no asegura en absoluto que sea el tema principal de la página.
  3. Búsqueda de imágenes. Los buscadores que poseen esta capacidad nos permiten encontrar fotos o dibujos concretos.
  4. Búsqueda de sonidos. Permite hallar archivos de sonidos.
  5. Idioma de los resultados. Algunos buscadores permiten elegir el idioma de las páginas web que se obtienen en los resultados. Por ejemplo nos puede interesar obtener resultados únicamente en español.
  6. Principal énfasis. Con esta característica indicamos si el buscador se centra sobre todo como directorio (lista de temas amplia, con abundantes subtemas) o como buscador (gran capacidad de búsqueda).
  7. Caracteres boleanos. Los caracteres boleanos, tales como AND, OR o NOT son los que proporcionan la máxima potencia al usuario ya que permite refinar en extremos las páginas que se van a obtener. Entendemos aquí que el usuario puede escribir directamente las condiciones de búsqueda y no por medio de una elección a través de un formulario. Sería ejemplo de este tipo de búsqueda: "entomología AND (biodiversidad OR diversidad)"
  8. Búsqueda avanzada. Algunos buscadores permiten aumentar el control de los resultados obtenidos mediante opciones adicionales de búsqueda.

 

Tabla 2. Características de búsqueda de cada uno de los buscadores.
 

Búsqueda en URL

Búsqueda en título

Búsqueda de imágenes

Búsqueda de sonidos

Permiten elegir idioma de los resultados

Principal énfasis

Permite caracteres boleanos

Búsqueda avanzada

Altavista Magallanes

Buscador

Biwe

No

No

No

Directorio

No

Elcano

No

No

No

No

No

Directorio

No

No

Olé

No

No

En parte

Directorio

No

Ozú

No

No

No

Directorio

No

Yahoo España

No

No

No

Directorio

No

Yupi

No

No

No

No

No

Buscador

No

No

Altavista (USA)

Buscador

Dejanews

-

-

-

-

Buscador

Excite

No

No

No

No

No

Buscador

No

Hot Bot

No

No

Algunos

Buscador

No

Infoseek

No

No

No

Buscador

No

Web Crawler

No

No

No

No

No

Buscador

No

No

Yahoo

No

No

No

Directorio

No

Comparativa

   Sin ánimo de intentar realizar un muestreo con significación estadística, y sólo a modo de ejemplo ilustrativo, hemos realizado varias búsquedas en cada uno de los buscadores. Han sido usados términos generales tales como 'Hymenoptera' y 'Biodiversidad + Insectos' con la finalidad de comprobar la indexación de grandes grupos de páginas que nos dan una idea de la amplitud abarcada por cada buscador en un tema específico. Como contrapunto se ha incluido 'Malaise + trap' como algo mucho más restringido y específico. Igualmente hemos buscado el género Platycleis, perteneciente al orden Orthoptera, como una prueba mucho más difícil de superar. Aunque la búsqueda de un único género no es significativo, sí nos da una idea bastante clara del nivel de detalle conseguido por cada buscador en sus bases de datos.

   La siguiente tabla muestra los resultados obtenidos. En negrita se destacan los resultados más notables.

Tabla 3. Resultados de búsqueda, número de páginas encontradas.

Buscador

Términos buscados

Hymenoptera

Biodiversidad, insectos

Platycleis

Malaise trap

Altavista Magallanes

18030

533

36

765

Biwe

0

0

0

0

Elcano

2

0

0

0

Olé

2

0

0

0

Ozú

10

10

0

10

Yahoo España

25

1

0

0

Yupi

224

1

0

6

Altavista (USA)

6973

486

39

776

Dejanews

800

16

0

100

Excite

2250

4692

16

179

Hot Bot

4300

390

18

790

Infoseek

3705

159

8

2

Web Crawler

32

0

0

13

Yahoo

1

179

11

372

    El buscador más utilizado en el mundo, Yahoo, no obtiene el mejor resultado en ninguna de las categorías. Igualmente Olé, el más visitado de España, tampoco obtiene resultados mínimamente aceptables. Esto es debido, en parte, a que el gran número de visitas que reciben se puede atribuir a su condición de directorio más que a la de buscador. Tanto Olé como Yahoo (incluyendo Yahoo España) son excelentes índices de páginas web, agrupadas éstas por temas. Sin embargo su capacidad para encontrar términos especializados y muy concretos es más que cuestionable.

    Sin lugar a dudas Altavista, tanto el de Estados Unidos como el español, son los que obtienen el mayor número de encuentros positivos. Altavista es reconocido como el buscador con más páginas indexadas. Posee unos 60 millones de páginas en sus bases de datos. Además indexa el texto entero de las páginas y no únicamente las palabras claves suministradas por sus creadores, o los títulos de las mismas, tal como sucede en alguno de los otros. Esto hace que se puedan encontrar términos que en otros buscadores no aparecen. Los resultados de Excite, Hot Bot e Infoseek no son nada despreciables y consiguen encontrar un buen número de páginas. Son una buena alternativa cuando no encontremos alguna palabra en Altavista.

    Para terminar esta primera entrega sobre los buscadores, es recomendable visitar el sitio web de Buscopio (http://www.buscopio.com). Un buscador de buscadores, en español, que nos permite encontrar buscadores de temas específicos, países, regiones, etc. Tiene su propio sistema de búsqueda que facilita encontrar el buscador a la medida de cada uno. Posee una base de datos con 2612 buscadores de todo el mundo. Sin lugar a dudas, el mejor sitio para encontrar el buscador que sea más de nuestro agrado.  >>>


ÍndiceÍndice del volumen 2

 


 

¡Recibe un e-mail cuando esta página cambie!


it's private
Powered by
ChangeDetection

Volver a la última página visitada  Atrás ] Arriba ] [ Mapa de ARACNET ] [ Mapa de la CV-e ]  [Cómo citar los artículos de ARACNETImprimir

© 1999-2002 CV-e Comunidad Virtual de Entomología - http://entomologia.rediris.es - admin@entomologia.rediris.es