Berto Goldwyn Berto Argò editore

Cinema | Televisione| Fumetti | Tutto Berto| Berto Ganci| Scrivimi

La casa di Berto

SCRITTI VARI

Libri scritti

Interviste

Fumetti

Tesi di laurea

Recensioni

Canzoni

Rubriche

Tutto il resto

Libri tradotti

 
 

TEMPO DI INTERNET

Internet Archive
(l'Orologio - febbraio 2004)

Le parole volano, gli scritti rimangono, dicevano gli antichi. Che però, è chiaro, un'invenzione come Internet nemmeno se l'immaginavano. Per quanto leggermente più duraturo del vento, il supporto elettronico è probabilmente quanto di più modificabile si possa concepire: ci vuole un attimo a ritoccare nei dettagli o nella sostanza una pagina già pubblicata e, come sempre, il solo fatto che qualcosa si possa fare fa sì che si sia indotti a farlo molto più spesso. Così tante pagine vengono messe on line in versioni ancora provvisorie, e aggiustate poi via via che si scoprono refusi, errori di impaginazione o anche, semplicemente, particolari perfettibili.

Nel mondo di informazioni sempre più spesso digitalizzate verso cui ci avviamo inesorabilmente, qualsiasi Grande (o piccolo) Fratello è in grado di modificare tutto con estrema facilità: se per cambiare un libro occorre ristamparlo e sostituirne ogni copia fisica, la rettifica a un testo digitalizzato è questione di pochi clic. La versione attualmente online è quella che fa testo, e quasi nessuno si prende la briga di paragonare la pagina di oggi con quella che si poteva leggere ieri. Persino chi si gestisce un sito personale ben di rado mantiene copia di tutte le versioni delle pagine che ha modificato, per evitare di intasarsi l'hard disk di varianti infinite.

E' pensando a queste problematiche che qualcuno ha creato, nel 1996, The Internet Archive (http://web.archive.org), uno sterminato database che mira a preservare le pagine internet prima che queste vengano eliminate dalla rete o sostituite con versioni diverse. Sono ormai otto anni che i web crawlers dell'archivio rimbalzano senza sosta da un link all'altro registrando pagine su pagine per cercare di preservarne il maggior numero possibile. Considerando che la vita media di una pagina Web è di appena 77 giorni, e che nei primi cinque anni di attività i crawlers sono riusciti a fare il giro completo della rete solo una dozzina di volte, la discrepanza fra la mole di roba da registrare e il tempo che occorre per farlo fa venire le vertigini.

Eppure l'Archivio funziona egregiamente, e lo dimostra con la sua personale versione di macchina del tempo. Battezzata "Wayback Machine" e accessibile al link http://www.archive.org/web/web.php l'invenzione appare come una finestra di un tradizionale motore di ricerca: nel modulo da riempire si inserisce un qualsiasi indirizzo web e - voilà - ci si ritrova in una pagina che elenca tutte le versioni registrate del sito che si sta cercando, a partire dalla sua prima apparizione online. Ma non solo: la "Machine" utilizza un algoritmo progettato appositamente (si chiama DocuComp: per maggiori informazioni occorre visitare http://www.docucomp.com/) che le permette di comparare le diverse versioni di una stessa pagina, individuando qualsiasi aggiunta, cancellazione, modifica o spostamento di testi o contenuti nelle pagine Web. Una volta fornita una URL alla Wayback Machine, basterà cliccare sul pulsante Compare Archive Pages (in alto a destra) per far sì che accanto a ogni versione diverse di una pagina compaia una check-box che permette di selezionarne due fra cui fare il confronto.

Al di là del piacere che l'Internet Archive può offrire a chi desiderasse vedere o rivedere le versioni precedenti dei propri siti preferiti (e anche l'angoscia di chi scopre che l'archivio ha incamerato anche un sito amatoriale in cui si sono pubblicate incautamente foto compromettenti: leggete il post di Becksy all'indirizzo http://www.archive.org/iathreads/post-view.php?id=12781) le implicazioni statistiche, linguistiche, storiche e sociologiche sono pressoché infinite. E si moltiplicano ulteriormente se si tiene conto del fatto che l'Archivio si estende anche a contenuti musicali e filmati, a libri in formato elettronico, e perfino a un inestimabile Software Archive che ambisce a impedire che file di dati in formato elettronico divengano inservibili a causa dell'obsolescenza dei software in grado di "aprirli".

L'obiettivo dichiarato dell'Archivio (che in nemmeno dieci anni di vita ha già raccolto circa undici miliardi di pagine web, e cresce al ritmo di 12 terabyte al mese) e' di costituire per i posteri una versione elettronica della mitica Biblioteca di Alessandria, il leggendario archivio del sapere dell'antichità voluto da Demetrio Falereo e Tolomeo I e arrivato a raccogliere circa 700.000 volumi. Quell'avventura, come tutti sanno, andò a finire malissimo: incrociamo le dita e speriamo che all'Internet Archive arrida sorte migliore.

Torna all'indice

 

Tutti i testi © Alberto Farina