INTERNET | qbitácora

Archive for the ‘INTERNET’ Category

Wayback Machine: Archivando Internet

Posted in Buscadores, Webs, tagged Wayback Machine on lunes, 19 abril 2010| 5 Comments »

Wayback Machine es un sitio que se dedica a archivar Internet. Es decir, rastrea Internet cada cierto tiempo, como lo hacen los buscadores tipo Google, y copia todas las webs que encuentra y que son públicamente accesibles, formando una gigantesca biblioteca de webs, permitiendo su acceso de manera gratuita.

Sólo archiva los sitios que Alexa conoce. No se pueden buscar palabras clave dentro del archivo, sino solamente URL de direcciones, y seleccionar la fecha. Las webs que copian tardan un tiempo en aparecer en el archivo. No es instantáneo.

El rastreo de Internet respeta las directivas de exclusión de robots, por lo que quien no quiere aparecer en el archivo le basta con configurar de manera adecuada el fichero robots.txt de su web. O solicitar después que le borren del archivo.

Wayback Machine es parte de Internet Archive, una biblioteca digital sin ánimo de lucro de San Francisco (EE.UU.), dedicada a ofrecer acceso público general gratis de páginas webs, música, películas y libros digitales. Trabaja en colaboración con la Universidad de Toronto (Canadá) y más de 150 bibliotecas y universidades de todo el mundo.

Utilidad:

Acceder a webs que ya no existen, como por ejemplo, las alojadas en el hospedaje Geocities, que cerró el 26-10-2009.
Examinar cómo era una web en el pasado, cómo ha cambiado.
Investigar sobre algo del pasado. Ejemplo: El de abajo del sistema operativo BeOS.

A veces no se puede o casi no se puede acceder a la dirección raíz de una web, pero sí a alguna dirección interior, y navegar a partir de esa dirección por el sitio tal y como era hace años.

Tiene sus defectos:

A veces falla, y el sitio buscado no fue archivado.
A veces funciona muy lento. Normal, porque es gigantesco.
Tampoco lo almacena todo: La funcionalidad dinámica hecha con JavaScript, formularios, o bases de datos (la web profunda) no se guardan, por lo que puede que se vea distinto o más feo de como era la web original.

Pero el texto está ahí, guardado, y también fotos. Incluso a veces he llegado a descargar algún vídeo. Lo he usado muchas veces. Siempre que me encuentro una web o una dirección que ya no existe, pruebo a ver si la encuentro ahí, y me resulta muy útil. Hay, sin embargo, mucha gente que todavía no lo conoce.

Se puede acceder desde estas direcciones:

URL actual: http://www.archive.org/web/web.php
Espejo en la Biblioteca de Alejandría (Egipto): http://archive.bibalex.org/
Nuevo prototipo: http://www.waybackmachine.org/web/

El polifacético mundo qbitiano

Archive for the ‘INTERNET’ Category

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Compartir:

Archivo:

Entradas del mes:

Entrada aleatoria:

Suscribirse:

qbit en:

Webs hermanas:

Blogroll

Páginas:

Categorías

Etiquetas principales:

Entradas más vistas:

Últimos comentarios:

Clicks:

Visitas recibidas:

Estadísticas:

Licencia