Bueno para no cansarlos con el tema vamos directo al punto; aqui tienen algunos tips para que puedan facilitar sus busquedas.
El dicho popular todo lo que puedas soñar que existe está en Internet tiene mucho más de cierto que de falso, pero no dice nada sobre lo fácil o difícil que pueda ser encontrar lo que uno busca. Cualquiera que lleve tiempo circulando por la Red le podrá confirmar que seguramente existe eso que por razones de trabajo o afición está buscando, pero también debe advertirle que necesitará algo de tiempo para aprender a usar los buscadores y filtrar el ruido recibido hasta dar en la diana. Tal vez sea la temperatura de una remota ciudad, una descripción del penacho de Moctezuma o una foto de un carnero merino... La página más interesante sobre Kenneth Branagh, por ejemplo, puede estar escondida entre quinientas otras con referencias sobre el actor, sus películas, citas y referencias a Shakespeare, pero se puede terminar encontrando con un poco de paciencia. [Incidentalmente: todos los ejemplos anteriores y los que verá en este artículo son reales, pero se necesitaron entre 2 minutos y una hora para encontrarlas en los lugares adecuados.]
Muchas veces, los usuarios terminan padeciendo lo que se denomina angustia de la información: hay demasiados datos revoloteando por el ciberespacio, imposibles de procesar (o encontrar) por un ser humano por mucho tiempo que le dedique al día, y la tarea de encontrar lo mejor sobre... se convierte en una misión imposible. En ocasiones esto hace que la persona se desespere al buscar una página o documento sobre un tema determinado, y que olvide lo más importante: dedicar previamente unas horas (o días) a comprender exactamente cómo funcionan los sistemas de búsqueda de Internet. Si se mira de otro modo, es como aprender el funcionamiento de un nuevo software para sacarle el mayor partido: todo el tiempo empleado en esta formación es extremadamente valioso e importante.
Un poco de historia
Hasta la llegada de Internet, pocas personas consideraban factible poder localizar toda la información publicada sobre un tema de su interés en periódicos, revistas, agencias, notas de prensa e informes corporativos de empresas u organizaciones. Y mucho menos podían imaginar que algún día podrían acceder al instante a información detallada sobre esos temas en debates, y ver opiniones y aportaciones de otras personas con intereses similares a los suyos.
Con la llegada de Internet, todo esto ha cambiado: las posibilidades de la Red global han hecho que empresas y organizaciones se preocupen de hacer pública su información en forma de páginas web para promocionar productos, servicios o ideas, sean unas zapatillas deportivas, un programa político o un proyecto para la conservación ecológica de algún paraje remoto.
Por otra parte, la red Usenet (englobada en Internet) ofrece más de 13.000 grupos vivos de noticias y charla entre usuarios en los que quedan publicados miles de mensajes a diario de todas partes del mundo, sobre cualquier tema imaginable: ciencia, política, series de televisión, discusiones técnicas y científicas y partidas de ajedrez, entre otros.
Afortunadamente, desde que la Red fue consciente de su crecimiento y de la dificultad a la hora de catalogar la información, aparecieron diversas empresas que basan su negocio en recopilar de un modo u otro toda esa información y hacer que esté a disposición de cualquier navegante.
Lo que verdaderamente ha cambiado con la llegada de Internet es que toda la información de la Red existe en formato digital y que miles de ordenadores de todo el mundo la almacenan públicamente. Gracias a ello, se puede buscar cualquier palabra o concepto y acceder a ella en cuestión de segundos. Lo mejor de todo es que no hace falta ningún programa especial: existen buscadores de Internet, en forma de páginas de la World Wide Web a las que se puede acceder con cualquier programa navegador desde un ordenador personal.
Con una nueva página publicada en algún punto de la World Wide Web de Internet cada dos o tres segundos, y más de un mensaje de texto por segundo en Usenet haciendo comentarios o dando una opinión, ningún ser humano podría mantener un catálogo de todo ello. Sin embargo, muchas empresas se dedican a realizar esta tarea clasificando la información más relevante de forma temática y manual: son los llamados Índices de Internet, simbolizados por el precursor de todos ellos, Yahoo.
Con la llegada de nuevas tecnologías y mejores conexiones, también aparecieron nuevos sistemas más potentes que recopilaban toda la información de la World Wide Web y de Usenet: los motores de búsquedas. Encabezados por AltaVista, de Digital, los servicios de este tipo emplean robots inteligentes que saltan de una página a otra de la Web (a través de los enlaces de hipertexto) recogiendo páginas y almacenando toda la información en una gigantesca base de datos.
Cada sistema tiene sus ventajas y desventajas, y ninguno es perfecto ni completo ni está exento de fallos de precisión. Teniendo en cuenta lo cambiante de la Red (se dice que una dirección URL tiene una vida media de menos de dos meses antes de que desaparezca o cambie de sitio), esto es inevitable. La a propia idiosincrasia de los usuarios y organizaciones que publican la información hace que encontrar lo que se busca sea a veces una árdua tarea.
Antes de empezar
Hay que dejar claras algunas premisas y conceptos antes de dedicarse a buscar información en Internet, que ayudan a hacerse una idea de la situación.
Las búsquedas en Internet son muchas veces cuestión de filosofía: hay navegantes que consideran que es incluso más divertido el hecho de buscar que el encontrar las cosas en sí, dado que durante el viaje de búsqueda se descubren sitios y lugares que algo tienen que ver con lo buscado aunque sea tangencialmente, pero que aportan algo que se había pasado por alto. En último caso, el consuelo de todo cibernauta: aunque lo que busque no esté en ese momento en Internet, tampoco lo estaría si la Red no existiera... y al menos puede que aparezca en el futuro. Y, aunque parezca obvio, en cualquier caso toda esa información es pública y gratuita.
Tipos de buscadores
Desde el punto de vista práctico, los buscadores de Internet se dividen principalmente en dos categorías: los índices y los motores de búsqueda. En los índices, hay personas detrás de ellos que clasifican inteligentemente las páginas web y los recursos de la red en categorías predeterminadas, a modo de gran árbol. Los motores de búsqueda son, en cambio, bases de datos que almacenan, una versión reducida de todas las páginas web y recursos que encuentran en la Red y que, aunque almacenan más información, son ligeramente menos precisos.
Otra forma de clasificar los buscadores es hacerlo por el lugar en que se encuentran. Se puede trabajar con buscadores globales, a nivel mundial, o con buscadores específicos de un país, como España. Actualmente hay más de una decena de índices españoles, que contienen información únicamente sobre recursos disponibles en España (o en castellano y otras lenguas oficiales), y también motores de búsqueda que recopilan únicamente información sobre páginas en castellano. Elegir uno u otro tipo de buscador (global o local) depende tanto de lo que cada cual puede procesar (información en varios idiomas, cantidad de páginas) como de lo interesante que puedan ser los resultados (ej. disposiciones administrativas, noticias locales o el teléfono de un restaurante al que pedir una pizza... mejor cuanto más cerca.)
El número de buscadores de Internet aumenta cada día, de modo que sería imposible y poco práctico explicar el funcionamiento detallado de cada uno de ellos en un solo artículo. En vez de ello, y dado que todos operan de forma muy parecida, a continuación se explican dos de los más importantes (Yahoo y AltaVista) por ser en los que están basados todos los demás, y finalmente se darán algunos consejos para realizar las búsquedas que son válidos para estos y otros buscadores con ligeras adaptaciones. También encontrará un cuadro con los principales buscadores de todos los tipos.
Nacido de la mano de dos estudiantes en abril de 1994 como una iniciativa para catalogar los recursos más atractivos de la World Wide Web (cuando la Web todavía era pequeña), Yahoo se ha convertido en una fructífera empresa que ofrece su servicio de forma gratuita a cambio de que el usuario vea algo de publicidad cada vez que accede para realizar una consulta. Las ventajas principales de Yahoo son su completitud, su sencilla y atractiva interfaz y su facilidad de uso.
Los empleados de Yahoo examinan personalmente páginas Web y recursos de todo el mundo y las incluyen en una guía jerárquica universal. Una vez examinado el material, incorporan cada una de las páginas en una categoría predeterminada (con referencias cruzadas a otras si es necesario), hacen un pequeño resumen de su contenido y lo publican en el catálogo general, un árbol que recoge todo lo que pueda existir completamente organizado en más de 20.000 categorías y cientos de miles de páginas documentadas.
El árbol de Yahoo comienza con unas ramas de generalidades: Arte, Ciencia, Noticias, Informática, Juegos... y se despliega a medida que el usuario va avanzando pantallas: Arte lleva a Pintura, Escultura, Fotografía; Fotografía lleva a Fotógrafos, Biografías, Escuelas... y así sucesivamente.
Los punteros finales del árbol de categorías de Yahoo no son más que enlaces a recursos de Internet: grupos de noticias de Usenet, sitios FTP, y principalmente, páginas web. Yahoo en sí no almacena esas páginas: simplemente proporciona los enlaces HTML adecuados. Un solo clic con el ratón es suficiente para saltar a ellos gracias a la magia del hipertexto de Internet.
Una primera forma de usar Yahoo es conectarse y navegar por el árbol de categorías (por ejemplo: Entretenimiento: Cine: Películas: Directores: Quentin Tarantino: Pulp Fiction) hasta que se encuentra lo que se desea. A la derecha de cada categoría aparece siempre un número entre paréntesis que indica cuantas referencias y subcategorías contienen las siguientes subcategorías.
Inteligentemente, Yahoo cataloga de forma prioritaria los FAQ (documentos de preguntas frecuentes) y los recursos que contienen índices de cualquier tipo. En el caso del Cine, por ejemplo, aparecen la espléndida Internet Movie Database, (www.imdb.com) y los FAQ de los grupos de noticias art.rec.movies.* (muchas preguntas comunes están contestadas allí). Cuando una categoría tiene el signo arroba (@) en su nombre quiere decir que se trata de una referencia cruzada a otra categoría similar que se encuentra en otro nivel de Yahoo.
Otra forma de navegar por Yahoo es buscar palabras clave que aparezcan en el nombre de una categoría o en la descripción de los propios recursos que se están buscando. Esta búsqueda se puede hacer en todo Yahoo o sólo en una categoría determinada (de un nivel hacia abajo). El resultado: al buscar Umberto Eco (por ejemplo) aparecen páginas de categorías sobre el autor, en distintas áreas (Autores/Ficción literaria; Literatura/Semiótica) y también algunas de las páginas concretas, enlazadas hacia la WWW.
Yahoo ofrece algunos detalles más que son de interés: junto a las nuevas incorporaciones a la base de datos aparece un icono destacado (New) durante unas semanas, así como otro icono (Cool, unas gafas rojas) si el sitio es especialmente interesante. (Como en todas las clasificaciones de Internet, la valoración depende del gusto de los catalogadores, pero dado el gran trabajo que realizan en Yahoo, un icono de este tipo suele ser sinónimo de calidad).
Desde el menú principal de Yahoo también se puede acceder a noticias y novedades procedentes de agencias, dar saltos aleatorios por la Red en los momentos de aburrimientos o acceder a servicios personalizados, como el Yahoo para niños o el Yahoo personalizado (my.yahoo.com), que se puede configurar según gustos personales.
Los consejos principales para usar Yahoo o un buscador de tipo índice son fáciles de recordar:
Los índices españoles [ver cuadro] tienen todos un funcionamiento muy similar a Yahoo, tanto en la estructura de sus árboles como en el método de búsquedas. La ventaja es que los recursos que almacenan suelen estar más detallados y en castellano. Algunos también ofrecen búsqueda mediante expresiones lógicas avanzadas. Por desgracia, en general resultan más lentos que los servidores internacionales, pues las máquinas sobre las que están situados tienen menos potencia y el estado de la red suele ser peor.
La paradoja de los índices es que sólo muestran información que previamente haya sido facilitada a sus administradores por algún usuario (quien creó una página o alguien de la Red). Si un sitio web no ha sido dado de alta en el índice, puede no aparecer nunca por mucho que se busque (a pesar de existir ahí fuera).
Decidirse por uno u otro índice (internacional o nacional, en sus distintos sabores) es cuestión de experimentar un poco y valorar los resultados. Si quien ha publicado la información en Internet ha sido cuidadoso, habrá incluido referencias en los principales índices españoles y también en Yahoo. Un problema de los índices españoles es que al ser tantos (y a veces inestables) los usuarios muchas veces no dan de alta sus páginas en todos ellos, sino sólo en los más populares. En general, si un recurso merece la pena, o si la información y el trabajo que contienen es especialmente interesante, los autores se habrán preocupado de darlo a conocer adecuadamente a través de Yahoo y el resto de buscadores.
La información existente en las páginas de Internet es tan voluminosa que a veces requiere otro tipo de buscadores más potentes: los motores de búsqueda de contenidos. Se trata de gigantescas bases de datos que almacenan un índice con todas las palabras que aparecen en cualquiera de las más de 60 millones de páginas de la WWW y de los 100.000 mensajes públicos diarios de Usenet. Esto incluye información como la de periódicos y revistas, bibliotecas, trabajos de investigación y, por supuesto, todo tipo de temas mundanos y de interés personal que la gente conectada a Internet publica de una forma u otra. Son una buena forma de localizar información si no se tiene muy claro en qué categoría puede enmarcarse, dónde pueden estar los recursos que la contengan o si el autor se ha molestado en comunicar su existencia a los buscadores.
AltaVista puede, por así decirlo, encontrar referencias a cualquier palabra que se encuentre en una página Web o mensaje público de Usenet, y dar acceso a ese recurso en cuestión de segundos mediante un enlace desde la pantalla del navegador. Para llevar a cabo esta tarea, que en el caso de AltaVista comenzó en diciembre de 1995 y que ya ha indizado más de 30 millones de páginas, Digital cuenta con diversas tecnologías punta: un robot de búsqueda de páginas en Internet y motores de base de datos, indizado y clasificación; todo ello funcionando en servidores Alpha con varios gigabytes de RAM y discos RAID. El índice de la Web ocupa más de 40 GB, y el ancho de banda de los centros AltaVista supera los 100 Mbps. Los diversos sitios espejo de AltaVista (servidores regionales), repartidos por todo el mundo, reciben más de 10 millones de consultas cada día. España cuenta desde mediados de 1997 con uno de esos centros locales, con instrucciones en castellano y búsqueda por idiomas, gracias a un acuerdo entre AltaVista y Telefónica (altavista.magallanes.net).
De cara al usuario, el funcionamiento de un motor de búsqueda como AltaVista no puede ser más sencillo: basta teclear una frase y revisar los resultados: el motor de búsqueda analiza la base de datos en base a conceptos tales como cuántas veces aparecen las palabras buscadas, si el contexto es el mismo (cercanía), si aparece lo buscado en el título de la página o al principio de ésta, si son palabras comunes o no, etc.
Así, por ejemplo, usando la búsqueda simple (la que aparece al conectarse a la página) y tecleando una frase como películas de Pedro Almodovar aparecen al instante cientos de referencias, clasificadas de mejor a peor aproximación. Lo que hace AltaVista es buscar en su índice, extraer las páginas que contienen cualquiera de esas palabras o varias de ellas y presentarlas según un criterio de aciertos respecto a la frase de búsqueda. Un clic con el ratón sobre los resultados dirige el navegador web a la página de destino.
La potencia de AltaVista es tremenda, pero, como todos los buscadores, no siempre acierta al cien por cien. Al buscar naturaleza y medio ambiente en España, por ejemplo, aparecen páginas sobre naturaleza y artículos de boletines y revistas (como Estructura y función del biopolímero suberina) que poco tienen que ver con lo que se busca, excepto que contienen alguna de las palabras.
A pesar de su aparente sencillez, AltaVista cuenta con opciones avanzadas para eliminar parte del ruido inherente a su método de almacenamiento. Esto es así porque si se busca únicamente la palabra radio, por ejemplo, aparecerá información tanto sobre emisoras de radio como sobre matemáticas (el radio de una circunferencia) o el radio como elemento químico: AltaVista no puede hacer mucho más... la palabra radio aparece más de 3 millones de veces en la WWW.
Entre lo que se podrían considerar fallos en una búsqueda (digamos, naturaleza y medio ambiente en España) estarían páginas que provienen de México, como el web de su Ministerio de Medio Ambiente (nada que ver con España) u otros fallos más graves se producen simplemente porque algunas páginas contienen de algún modo las palabras medio y naturaleza. Incluso si hubiera una página con un texto como El cine se diferencia de la televisión por ser un medio... sería encontrada y calificada como relativamente buena.
Por esta razón, las búsquedas se pueden realizar de forma más estricta, incluyendo algunas instrucciones especiales, para evitar que aparezcan páginas no deseadas y concretar lo que se está buscando. Hacerlo es tan sencillo como comprender la sintaxis de las frases de búsqueda y emplear ciertos operadores lógicos, mejorando así los aciertos de la base de datos.
Siguiendo con el ejemplo anterior, para encontrar páginas sobre protección del medio ambiente en España, se podría usar una frase de búsqueda como:
naturaleza medio ambiente protección +España -Mex*Los operadores básicos que se han usado en esta frase son:
Comillas. Permiten pegar varias palabras en una expresión, de modo que si en una página no aparecen exactamente, sino en otro orden (el ambiente en el medio rural) se desestime la información encontrada.
Mayúsculas y minúsculas. Al diferenciar mayúsculas y minúsculas se fuerza a que esas palabras aparezcan literalmente (ej. España).
Incluida (+). El signo más delante de una palabra obliga a que la palabra que va a continuación esté incluida en la información encontrada.
Eliminar (-). El signo menos elimina páginas que contengan la palabra que va a continuación. [Si se emplea este guión para un término que contenga guiones, escriba las dos palabras sin separarlas con un espacio (deja-vu).]
Raíz (*). El asterisco sirve para indicar raíces de palabras (por ejemplo, méxico o mexicano). En general, el asterisco reemplaza a una serie indeterminada de letras: col*r es tanto color como colour.
Con la construcción del ejemplo (que no es la mejor, pero sirve para el propósito explicativo), se fuerza a que aparezca siempre la expresión literal medio ambiente, la información de España y se eliminan las referencias que procedan de México. Esto da lugar a un número más reducido de aciertos: artículos sobre España y el medio ambiente, catalogadores con información sobre naturaleza, el programa de algún partido político (que debe incluir su punto de vista al respecto), información sobre campos de trabajo, una asociación de Boy Scouts y una orden ministerial del BOE.
Una novedad reciente de AltaVista es la selección por idiomas, haciendo una selección previa en la ventana de búsquedas. Aunque es interesante, depende en gran medida del correcto diseño de las páginas HTML que han sido publicadas en la red (que identifiquen el idioma de lo que contienen o no, mediante un código HTML). Como muchas de ellas no incluyen los códigos de idioma adecuados, hay que usar esta opción con precaución para no perder páginas útiles, que AltaVista clasifica como de idioma indeterminado.
El modo de búsquedas avanzadas de AltaVista (al que se accede a través del icono del mismo nombre de la ventana principal) proporciona otro método de seleccionar la información. Puede acotar los aciertos por fechas, con los operadores AND y OR (similares a + y -) y con frases de búsqueda más complejas. Incluso se puede especificar la cantidad de palabras máximas de separación que debe haber entre dos palabras determinadas.
Una última forma de localizar información con AltaVista es dirigir la búsqueda a Usenet. La red de grupos de noticias y debate contiene información más al día que la Web, y es fácil localizar información de usuarios particulares haciendo preguntas y dando respuestas sobre un tema concreto.
Uno de los secretos de AltaVista, que queda fuera de la vista del usuario, es Scooter. El robot inteligente de Digital rastrea la Web constantemente, buscando enlaces en las páginas y saltando a ellos para consultarlos, indizarlos y buscar nuevos enlaces. Su trabajo no termina nunca, y es lo que permite que cada día se añadan y actualicen cientos de miles de nuevas páginas sin que los usuarios o administradores tengan que solicitarlo personalmente. Adicionalmente, AltaVista es tremendamente respetuoso y ecológico con la Red: Scooter viaja de página en página procurando no sobrecargar ningún servidor con consultas repetidas. Además, los usuarios pueden añadir código HTML a sus páginas personales o de empresa para evitar que sean indizadas por el robot, en caso de que sean privadas. Scooter también actúa de forma inteligente: las páginas que más a menudo cambian (como las de noticias) son las más visitadas y actualizadas. También, automáticamente, las que no pueden ser revisitadas en varios días son eliminadas para evitar enlaces que no lleven a ningún lugar.
Consejos generales
Tanto si usa motores de búsqueda como índices, hay algunos consejos relativos a las palabras o frases de búsqueda que pueden serle de utilidad. A continuación se indican algunos de los más generales, cuyo funcionamiento puede variar según cada buscador. Lo primero que debe hacer es leer y revisar con calma la Ayuda o el FAQ (Preguntas Frecuentes) de su buscador favorito para adaptar estos consejos o comprobar si funcionan del mismo modo en unos que en otros. Recuerde que leer las instrucciones del buscador durante unos minutos le ahorrará horas de búsquedas infructuosas y le permitirá aprender nuevos trucos.
Conclusiones
Este artículo ha pretendido servir a la vez de introducción a la búsqueda de información en Internet y a la vez de manual práctico con los trucos más comunes, indicando por donde y cómo comenzar. Además de todo lo mencionado, existen muchos más recursos en la Red para buscar personas, direcciones de e-mail, teléfonos, empresas y la información disponible en miles de bases de datos... e incluso páginas que buscan en varios buscadores de Internet a la vez (los llamados metabuscadores). A buen seguro que irá descubriendo todas ellas a medida que circule por Internet.
Para acabar, recuerde siempre que todo el tiempo que emplee en investigar y leer sobre el funcionamiento de los buscadores de Internet, sobre las principales páginas de recursos de cada tema de interés y sobre el funcionamiento en general de la Red le supondrá un ahorro de tiempo enorme cuando vuelva a buscar información: aunque el pajar es grande, existen herramientas adecuadas para encontrar la aguja, por muy escondida que esté.
|
Mao Valverde | Buscar Información | Mis Datos | Downloads | Todo Gratis | VH1 Channel | HotMail | Buscar en Internet | Visual Basic |