fbpx
Wikipedia

Sitio archivo

Un sitio archivo es un tipo de sitio Web que almacena información sobre páginas web del pasado (o las propias páginas web) para que cualquiera la vea.

Técnicas comunes

Dos técnicas comunes son (1) usar un web crawler o (2) envíos de los usuarios.

(1) Usando un web crawler el servicio no dependerá de una comunidad activa para su contenido, y por tanto se construirá una base de datos más grande más rápido, lo que normalmente resulta en que también la comunidad se haga más grande. Sin embargo, los administradores de sistemas y desarrolladores de sitios web tienen la capacidad de bloquear el acceso de estos robots a [algunas] páginas web (usando un robots.txt).

(2) Aunque puede ser difícil empezar estos servicios debido a las tasas potencialmente bajas de envío de los usuarios, este sistema puede rendir los mejores resultados. Recorriendo páginas web sólo es posible obtener la información que el público se haya ocupado de publicar en la Internet. Puede que no se hayan preocupado de enviarla debido a pensar que nadie estaría interesada en ella, falta de un medio adecuado, etc. Sin embargo, si ven que alguien quiere su información entonces pueden estar más dispuestos a enviarla.

Ejemplos

Google Groups

El 12 de febrero de 2001 Google adquirió el servicio de discusión de Usenet de Deja.com y lo convirtió en su servicio Google Groups. Permiten que los usuarios busquen discusiones antiguas con su altamente reputada tecnología de búsqueda, al tiempo que siguen permitiendo que los usuarios publiquen en las listas de distribución de correo.

Internet Archive

El Internet Archive (sitio web oficial) está construyendo un compendio de páginas web y medios digitales. Desde 1996, Archive ha estado usando un web crawler para construir su base de datos. Son uno de los sitios archivo más conocidos.

TextFiles.com

TextFiles.com es una gran biblioteca de viejos ficheros de texto sostenida por Jason Scott Sadofsky. Su misión es archivar los viejos documentos que han flotado por los bulletin board systems (BBS) de su juventud y documentar las experiencias de otras personas en las BBS.

PANDORA Archive

PANDORA (Archivo Pandora), fundado en 1996 por la National Library of Australia, significa Preserving and Accessing Networked Documentary Resources of Australia, lo que explica su misión. Facilitan un catálogo a largo plazo de publicaciones en la red selectas y sitios web realizados por australianos o que traten sobre algún tema australiano. Emplean sus PANDAS (PANDORA Digital Archiving System) para construir su catálogo.

Véase también

  • Internet Archive (página web)
  • Máquina del tiempo de Internet Archive
  • Wikipedia:Using_the_Wayback_Machine - Una guía de la máquina del tiempo de Internet Archive.
  • Archivo Pandora - Artículo sobre PANDORA en la Wikipedia
  • PANDORA - Sitio web oficial
  • National Library of Australia - Alberga PANDORA
  •   Datos: Q4787276

sitio, archivo, sitio, archivo, tipo, sitio, almacena, información, sobre, páginas, pasado, propias, páginas, para, cualquiera, Índice, técnicas, comunes, ejemplos, google, groups, internet, archive, textfiles, pandora, archive, véase, tambiéntécnicas, comunes. Un sitio archivo es un tipo de sitio Web que almacena informacion sobre paginas web del pasado o las propias paginas web para que cualquiera la vea Indice 1 Tecnicas comunes 2 Ejemplos 2 1 Google Groups 2 2 Internet Archive 2 3 TextFiles com 2 4 PANDORA Archive 3 Vease tambienTecnicas comunes EditarDos tecnicas comunes son 1 usar un web crawler o 2 envios de los usuarios 1 Usando un web crawler el servicio no dependera de una comunidad activa para su contenido y por tanto se construira una base de datos mas grande mas rapido lo que normalmente resulta en que tambien la comunidad se haga mas grande Sin embargo los administradores de sistemas y desarrolladores de sitios web tienen la capacidad de bloquear el acceso de estos robots a algunas paginas web usando un robots txt 2 Aunque puede ser dificil empezar estos servicios debido a las tasas potencialmente bajas de envio de los usuarios este sistema puede rendir los mejores resultados Recorriendo paginas web solo es posible obtener la informacion que el publico se haya ocupado de publicar en la Internet Puede que no se hayan preocupado de enviarla debido a pensar que nadie estaria interesada en ella falta de un medio adecuado etc Sin embargo si ven que alguien quiere su informacion entonces pueden estar mas dispuestos a enviarla Ejemplos EditarGoogle Groups Editar El 12 de febrero de 2001 Google adquirio el servicio de discusion de Usenet de Deja com y lo convirtio en su servicio Google Groups Permiten que los usuarios busquen discusiones antiguas con su altamente reputada tecnologia de busqueda al tiempo que siguen permitiendo que los usuarios publiquen en las listas de distribucion de correo Internet Archive Editar El Internet Archive sitio web oficial esta construyendo un compendio de paginas web y medios digitales Desde 1996 Archive ha estado usando un web crawler para construir su base de datos Son uno de los sitios archivo mas conocidos TextFiles com Editar TextFiles com es una gran biblioteca de viejos ficheros de texto sostenida por Jason Scott Sadofsky Su mision es archivar los viejos documentos que han flotado por los bulletin board systems BBS de su juventud y documentar las experiencias de otras personas en las BBS PANDORA Archive Editar PANDORA Archivo Pandora fundado en 1996 por la National Library of Australia significa Preserving and Accessing Networked Documentary Resources of Australia lo que explica su mision Facilitan un catalogo a largo plazo de publicaciones en la red selectas y sitios web realizados por australianos o que traten sobre algun tema australiano Emplean sus PANDAS PANDORA Digital Archiving System para construir su catalogo Vease tambien EditarInternet Archive pagina web Maquina del tiempo de Internet Archive Wikipedia Using the Wayback Machine Una guia de la maquina del tiempo de Internet Archive Archivo Pandora Articulo sobre PANDORA en la Wikipedia PANDORA Sitio web oficial National Library of Australia Alberga PANDORA Datos Q4787276Obtenido de https es wikipedia org w index php title Sitio archivo amp oldid 121122713, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos