La natura
transeunte e distribuita del Web, insieme con la natura non unitaria ma procedurale del documento web, presuppone ed esige un’infrastruttura sotterranea composta da diversi servizi, il valore dei quali non è individuale ma collettivo perché dipende dal loro complesso e dalla loro integrazione:
Internet Archive (per la “preservazione” digitale mediante la registrazione temporale dei cambiamenti e delle evoluzioni dei siti),
WebCite (che fa la medesima cosa ma a cura degli stessi autori),
Spurl (che - forse in modo più efficace di altri tipici prodotti del 2.0 - raccoglie organizza e fa condividere e soprattutto ritrovare la segnatura dei siti preferiti),
CiteSeerX (per la disseminazione dei contenuti scientifici) o alla provvidenziale
cache di Google che contrasta il famigerato
link rot «Errore 404.
File non trovato», e altri. Tutti servizi intesi a dare stabilità al sistema e a riportare tendenzialmente a segnatura unitaria la disseminazione delle risorse e delle fonti.
Ma il Web possiede nel medesimo tempo anche una natura intrinsecamente e spontaneamente
organizzativa che sa dare individualità a elementi sparsi, per il fatto che un’unità qualsiasi è spesso costituita da frammenti unificati
ad hoc e quindi unificabili anche alla bisogna e per scopi e in modi differenti: una pagina in HTML può, a corredo, contenere - o rinviare a, sparsi per il mondo -
file PDF, immagini, eventi sonori, presentazioni di diapositive o di
video, blog, RSS, dati grezzi od organizzati in tabelle statistiche, eccetera.
Ciò è possibile perché il sistema informativo del Web non intende più rappresentare la realtà “esterna” (come fa un documento tradizionale e come fa una base di dati) ma, in quanto
sistema informativo oggettuale, contiene oggetti - i documenti digitali - che non sono più forme simboliche di fatti che compongono la rappresentazione di una realtà indipendente dal sistema, ma rappresentano solo se stessi, sono parte della realtà e anzi sono la realtà stessa, realtà che ci appare coesa solo perché i metadati (rappresentazione contestuale di fatti “esterni” in un àmbito tuttavia oggettuale) riescono in qualche modo a essere la “colla” che lega tra loro, pur essendone subordinati, i documenti digitali nella totalità del sistema informativo. Tra parentesi, è
questa la “rivoluzione” di Internet: un sistema informativo che si sostituisce alla “vera” realtà...
Da una parte, dunque, è attraverso una serie di servizi; dall’altra, è attraverso la stessa natura
aggregativo-diffusiva dei documenti Web che viene consentita una certa quota di certezza delle risorse e delle fonti.
Complichiamo il quadro: se un essere senziente può facilmente, seppur alla fine di un processo a volte non facile, percepire e quindi dominare i confini e i legami di tali frammenti, non è così facile farlo quando l’essere in campo è un agente automatico, che deve distinguere
perinde ac cadaver catene cognitive di un determinato dominio da altri aggregati non specificamente interessanti o appartenenti a diversa ontologia. È il problema posto da
Pavel Dmitriev nella sua dissertazione PhD alla Cornell University nel gennaio 2008,
As we may perceive: finding the boundaries of compound documents on the Web. Quasi in risposta a questa sfida, OAI (
Open Archives Initiative) ha appena creato ORE (Object Reuse and Exchange), progetto di elaborazione normativa per definire e scoprire le aggregazioni di risorse Web mediante l’introduzione di un’apposita
resource map, ReM, unità che descrive, appunto, confini e legami dei frammenti - per esempio, e tra le più famose:
arXiv.org, ReM interna a un
repository, mantenuta da un nutrito gruppo molto finanziato della Cornell.
Andiamo avanti: ma se la ReM fosse esterna all’archivio? In questo caso sarebbe sottoposta alle medesime transitorietà e fluttuazioni del Web: pagine scomparse, URL spostate, contenuti mutati nel tempo, a fronte di una gestione “democratica” e distribuita, tipica di questi tempi da 2.0. Soccorre qui
Herbert van de Sompel, già di Ghent e ora dei Laboratori nazionali di Los Alamos e inventore dell’
open URL link resolver, che con altri ha creato “ReMember”, ReM esterna che enumera le risorse aggregate (AR) che reintegrano un’aggregazione dispersa e includono metadati descrittivi per ogni AR:
«ReMember attempts to harness the collective abilities of the Web community for preservation purposes instead of solely placing the burden of curatorial responsibilities on a small number of experts».
Dando conto della sua invenzione nel recente OAI 6 di Ginevra (17-19 giugno 2009) con
Everyone is a curator: human-assisted preservation for ORE aggregations, dove
curator ed
everyone sono le parole-chiave, de Sompel sostiene che l’applicazione a un insieme di citazioni bibliografiche
online mescolate con semplici rinvii a siti web, ha consentito di separare correttamente le une dalle altre: un ausilio semi-automatico e di poca spesa ai servizi per la stabilità di cui sopra.
Il bello auspicato delle ReM è che potrebbero, si entusiasma de Sompel, essere efficacemente create da chiunque, con un minimo di organizzazione umana e quindi di costi, “alla Wikipedia”. Ancora una volta, l’identità (e l’individuazione e l’identificazione) dell’autore può passare in secondo piano a vantaggio non solo del lavoro collaborativo ma anche a vantaggio di prodotti “cresciuti” praticamente da soli, autocreati (autore,
auctus, da
augeo, aumentare - il diritto penale parlerebbe forse di “autore mediato”; ma: esistono davvero autori “unici”? e come la metteremmo, in questo caso, con la tutela del
copyright, se perfino Dublin Core [1] dà definizioni abbastanza tautologiche e tutto sommato interscambiabili delle figure
author, creator, contributor, curator, publisher)? Infatti, all’OAI 6 de Sompel non ha mai parlato, pur trattandone, di “articoli scientifici”, ma solo e sempre di
dataset come parti integranti di un non meglio identificato “
record scientifico”, per la qual cosa
chiunque potrebbe essere il
curatore di una pubblicazione scientifica.
Chiunque lavori su una ReM, ovviamente. Ciò impone un ripensamento delle funzioni tradizionali della stessa comunicazione scientifica, delle sue regole e della sua mappatura, che sta mettendo in discussione canoni di valutazione tradizionali come la metrica delle citazioni, per esempio e quindi delle funzioni del
peer reviewing. Nemmeno sfuggono le riviste scientifiche tradizionali, in corso di trasformazione in
enhanced journal: le “pubblicazioni liquide” proposte dal gruppo Casati-Giunchiglia-Marchese (vedi alla voce
Liquefazione in «il Bibliotecario» 3/2008, p. 137-138).
Tra le prime applicazioni di OAI-ORE - a parte il felice esito del controllo delle citazioni in JSTOR, l’archivio storico in linea delle maggiori riviste accademiche a partire dal XVII secolo - è da tener d’occhio
www.myexperiment.org, un ambiente collaborativo nel quale scienziati e ricercatori possono pubblicare in sicurezza i loro flussi di lavoro, i propri oggetti (o raccolte di oggetti) digitali e sperimentare progetti di ricerca, condividendoli con il proprio gruppo o trovando gruppi affini: un Facebook o un MySpace sì controllato e protetto e riservato ma per il quale la sostanzia della (nuova) relazione autoriale non cambia