Módem «

Vea también:

Buscadores de dólares

Enlaces

Robots con Martijn Koster
http://info.webcrawler.com/
mak/projects/robots/
robots.html

Human search http://www.humansearch.w1.com/
humansearch/cgi-bin/Limit.txt

Answer
http://www.answers.com

The Mining Company http://miningco.com

 

Naturaleza de los buscadores
Robots y humanos se proyectan hacia el ciberespacio para recopilar información. En medio de la abundancia, máquinas construidas con software surcan Internet a toda velocidad realizando un registro del inmenso catálogo, con el cual se alimentan luego servicios de búsqueda esenciales para la navegación. Pero una nueva tendencia plantea retornar hacia los seres de carne y cerebro, con el argumento de que son agentes más confiables, precisos y naturales.

En el principio, que fue en el amanecer de los 90, la World Wide Web era un sitio difícil de recorrer, los usuarios debían ser verdaderos especialistas en computación para moverse de un lugar a otro. Después, una universidad comenzó a difundir Mosaic, que fue el primer navegador o browser diseñado para comunes mortales. Pero aún no estaba claro hacia dónde orientar las travesías... hasta que hacia mediados de 1994, aparecieron los buscadores.
Estamos en 1999 y los browsers están convertidos en poderosas maquinarias de navegación, pero siguen dependiendo de los sistemas de búsqueda como los barcos lo hacen de una brújula. Por esa razón los buscadores abundan, se habla de centenares en todo el mundo, algunos con más de 30 millones de páginas revisadas, otros tan especializados como para entregar información de un solo producto.
¿Cómo se construyen estas maravillas? Aunque no todos los buscadores son tan maravillosos, casi todos se elaboran mediante el uso de robots. No son, por cierto, las estructuras de metal que protagonizan la ciencia ficción desde hace décadas y que comienzan a plagar las fábricas contemporáneas. En la Red son programas de software que viajan a través del ciberespacio revisando archivos.
Seres artificiales que construyen enormes bases de datos automáticas... Pero cuya efectividad para brindar información de utilidad al usuario final comenzó a ser cuestionada por una nueva tendencia que gana adherentes en el ciberespacio, según la cual el encargado de encontrar las rutas ciberespaciales debe ser un humano.
En medio del boom de Internet esto significó la aparición, en el mundo real, de algunos servicios de corredores de información procedente de la Red. Pero ahora también se está notando la proliferación de nuevos tipos de buscadores que a primera vista son similares a los automáticos, aunque están manejados por personas.
Por esa razón no son tan rápidos, aunque resultan mucho más precisos: en un lugar desbordante de información, es muy fácil recibir altas dosis de basura cuando uno anda en busca de algunos simples datos.

Robots

Karel Capek, el checo que inventó la palabra "robot", e Isaac Asimov, el ruso-estadounidense que elaboró unas leyes de la robótica, no consideraron la existencia de este nuevo tipo de seres de software. Pero la palabra ya está incorporada al léxico de los programadores de Internet, que cuando buscan información sobre el tema pueden pasar, por ejemplo, por un sitio especialmente dedicado a este tipo de robots de Red, mantenido por Martijn Koster en Webcrawler, un buscador que fue de los primeros en utilizar un ente programado para recorrer la Telaraña Mundial.
Koster tiene una larga lista de nombres que identifican a algunos de los robots que atraviesan la Red, aunque no incluye todos los existentes, pues estos programas se pueden comprar, copiar y por supuesto crear mediante el uso de lenguajes de programación, para cumplir con la misión de alimentar a un buscador.
El programa robot está capacitado para recorrer en forma automática el universo hipertextual de la World Wide Web, donde puede registrar un documento, y después hacer lo mismo con aquellos a los cuales acceda desde allí mediante enlaces.
Los movimientos de estos robots están determinados por información contenida en la programación que realizó su creador, pero una vez lanzados hacia el ciberespacio se mueven con bastante autonomía, lo cual constituye una diferencia esencial con los browsers, que deben ser permanentemente operados por un humano y no están capacitados para recuperar documentos en forma automática.
También son distintos a los virus, pues estos acarrean infecciones que se producen mediante la autoreplicación del software que se va copiando a donde llega, mientras el robot actúa como un visitante que pasa y se va, tras haber consultado algunos documentos. Como lo haría un navegante común, sólo que a toda velocidad y, cuando están bien construidos, con eficiencia.
"Arañas", "gusanos", "orugas", "vagabundo", "hormiga", son palabras que se usan para denominar a los robots. Ciertos nombres ya tienen fama, como el "Scooter" de Alta Vista, que ha registrado decenas de millones de sitios.
Lanzados en busca de sitios para aumentar los registros de los buscadores, los robots manifiestan comportamientos diversos, que dependerán de las características de su programación. Pero en general suelen iniciar su tarea a partir de una lista de direcciones que suelen dar frutos: las de lugares de "lo mejor", "lo más nuevo", "lo más cool", y otros por el estilo.
Además, reaccionan ante páginas que son propuestas por los propios usuarios de la Red, quienes pueden inscribir sus páginas web para que sean visitadas por un robot, y por lo tanto catalogadas en los sistemas de búsqueda, un paso importante para adquirir visibilidad en Internet. Pero aunque uno no cumpla con esta rutina, siempre existe la posibilidad de que el sitio sea visitado por una "araña", mientras ésta realiza una travesía de rutina a lo largo y ancho de las redes.
Por otro lado, los programadores de los sitios web pueden introducir en el servidor algunas indicaciones para evitar que los robots los visiten o toquen ciertas zonas que deseen mantener privadas. Pero esta tarea es más complicada y está reservada a quienes se entienden con las máquinas.
Entretanto, en Internet han comenzado a ganar popularidad programas denominados "agentes", que están a disposición de los usuarios como cualquier otro software de computación (se habla de "agentes inteligentes"), cuya operación es similar a la de los robots porque buscan información en forma automática. Pero en este caso siguen instrucciones muy precisas según los parámetros que les han sido fijados por quienes les asignan esta tarea. Y sus resultados no están destinados a alimentar servicios de búsqueda, sino a captar datos para los navegantes.

Humanos

"Piensen en su potencial... al fin un servicio de búsqueda inteligente", dice uno de los primeros mensajes que se encuentran al ingresar en un buscador que pertenece a una nueva estirpe dentro de Internet. "Hemos considerado el factor más importante: los humanos", precisa el sitio de Human Search, que recibe consultas las 24 horas, los 365 días del año.
El servicio de búsqueda es gratuito y personalizado, pero puede demorar unas 48 horas, según se dice en el web. ¿Tiene sentido que exista un lugar así, en una época en la cual se le da tanta importancia a la rapidez?
Quienes proponen un retorno a los humanos en la joven pero vertiginosa World Wide Web aseguran que es necesario un filtro, no para censurar ni para controlar, sino justamente para mantener a la gente a salvo de una avalancha de datos que puede terminar produciendo el efecto contrario al esperado, es decir la desinformación.
El problema ya es detectable en buscadores de gran tamaño como AltaVista o Excite, que arrojan millares de resultados. Periódicamente se añaden nuevas herramientas para acotar las exploraciones, con la finalidad que la gente no se vea abrumada por una gran cantidad de información inútil, recopilada y entregada por robots hechos con software, pero aún así los datos aumentan cada día.
Algunos servicios potentes, como el de Yahoo!, tienen clasificadores humanos que analizan y categorizan los sitios registrados. Sin embargo, hay quienes proponen ir aún más allá.
Los partidarios de colocar buscadores humanos en el ciberespacio argumentan que la receta ya es antigua: las revistas y los diarios filtran la mayor parte de la información de nuestro mundo y entregan un resumen. Cada uno, al menos en teoría, elige el medio que mejor satisface sus necesidades de información.
En la World Wide Web los nuevos servicios basados en buscadores humanos aún no compiten en el campo de la línea editorial, sino que buscan presentarse con ventajas frente a la indiferencia y frialdad de los sistemas automáticos.
En Human Search se entrega un informe con los enlaces que conducen a sitios donde se trata el tema solicitado y se propone una búsqueda que sea "tan fácil como preguntarle a un bibliotecario", lo cual por cierto a veces resulta más complicado que lidiar con los robots de la Red.
El servicio es parecido en Answers.com, aunque en este caso se cobra una tarifa entre 1,7 y 11,9 dólares por el servicio, de acuerdo con la complicación de la consulta.
Y se buscan fórmulas novedosas para ofrecer estos servicios. Una propuesta bastante ambiciosa en el campo de los humanos como vectores de búsqueda, pautada para mediados de año en el sitio de The Mining Company, es la de construir un gigantesco directorio que será revisado por personas para entregar la información a otras personas, los navegantes.
"Dentro de tres años será imposible usar los motores de búsqueda", argumenta el director de esta empresa, Scott Kurnit, quien propone el uso de "poder humano" para hacer frente a la avalancha de información.
En el sitio web se sugiere quienes podrían ser los solicitantes de un servicio así: "¿no puede localizar un servidor, está yendo hacia ninguna parte?".
The Mining Company (ahora About.com), que quiere decir "la empresa minera", tiene algunos empleados a tiempo completo, pero además cuenta con muchísimos guías de web, que están a cargo de mantener sitios especializados por temas. Son buscadores del web, pero también se espera que envíen información a los visitantes más frecuentes, que mantengan actualizada la lista de webs, que dispongan de la información allí mismo en la mayoría de los casos.

Nota: este artículo fue escrito en 1999

el planeta - Módem - Futur@ - CiberManual - Travesías - Guía - Zona - Reseña - Herramientas - WWWebs
todos los derechos reservados © Hecho en Innova
Información - Contactos
en quasar@el-planeta.com