sabato 18 luglio 2009

Catene cognitive

La natura transeunte e distribuita del Web, insieme con la natura non unitaria ma procedurale del documento web, presuppone ed esige un’infrastruttura sotterranea composta da diversi servizi, il valore dei quali non è individuale ma collettivo perché dipende dal loro complesso e dalla loro integrazione: Internet Archive (per la “preservazione” digitale mediante la registrazione temporale dei cambiamenti e delle evoluzioni dei siti), WebCite (che fa la medesima cosa ma a cura degli stessi autori), Spurl (che - forse in modo più efficace di altri tipici prodotti del 2.0 - raccoglie organizza e fa condividere e soprattutto ritrovare la segnatura dei siti preferiti), CiteSeerX (per la disseminazione dei contenuti scientifici) o alla provvidenziale cache di Google che contrasta il famigerato link rot «Errore 404. File non trovato», e altri. Tutti servizi intesi a dare stabilità al sistema e a riportare tendenzialmente a segnatura unitaria la disseminazione delle risorse e delle fonti.

Ma il Web possiede nel medesimo tempo anche una natura intrinsecamente e spontaneamente organizzativa che sa dare individualità a elementi sparsi, per il fatto che un’unità qualsiasi è spesso costituita da frammenti unificati ad hoc e quindi unificabili anche alla bisogna e per scopi e in modi differenti: una pagina in HTML può, a corredo, contenere - o rinviare a, sparsi per il mondo - file PDF, immagini, eventi sonori, presentazioni di diapositive o di video, blog, RSS, dati grezzi od organizzati in tabelle statistiche, eccetera.

Ciò è possibile perché il sistema informativo del Web non intende più rappresentare la realtà “esterna” (come fa un documento tradizionale e come fa una base di dati) ma, in quanto sistema informativo oggettuale, contiene oggetti - i documenti digitali - che non sono più forme simboliche di fatti che compongono la rappresentazione di una realtà indipendente dal sistema, ma rappresentano solo se stessi, sono parte della realtà e anzi sono la realtà stessa, realtà che ci appare coesa solo perché i metadati (rappresentazione contestuale di fatti “esterni” in un àmbito tuttavia oggettuale) riescono in qualche modo a essere la “colla” che lega tra loro, pur essendone subordinati, i documenti digitali nella totalità del sistema informativo. Tra parentesi, è questa la “rivoluzione” di Internet: un sistema informativo che si sostituisce alla “vera” realtà...

Da una parte, dunque, è attraverso una serie di servizi; dall’altra, è attraverso la stessa natura aggregativo-diffusiva dei documenti Web che viene consentita una certa quota di certezza delle risorse e delle fonti.

Complichiamo il quadro: se un essere senziente può facilmente, seppur alla fine di un processo a volte non facile, percepire e quindi dominare i confini e i legami di tali frammenti, non è così facile farlo quando l’essere in campo è un agente automatico, che deve distinguere perinde ac cadaver catene cognitive di un determinato dominio da altri aggregati non specificamente interessanti o appartenenti a diversa ontologia. È il problema posto da Pavel Dmitriev nella sua dissertazione PhD alla Cornell University nel gennaio 2008, As we may perceive: finding the boundaries of compound documents on the Web. Quasi in risposta a questa sfida, OAI (Open Archives Initiative) ha appena creato ORE (Object Reuse and Exchange), progetto di elaborazione normativa per definire e scoprire le aggregazioni di risorse Web mediante l’introduzione di un’apposita resource map, ReM, unità che descrive, appunto, confini e legami dei frammenti - per esempio, e tra le più famose: arXiv.org, ReM interna a un repository, mantenuta da un nutrito gruppo molto finanziato della Cornell.

Andiamo avanti: ma se la ReM fosse esterna all’archivio? In questo caso sarebbe sottoposta alle medesime transitorietà e fluttuazioni del Web: pagine scomparse, URL spostate, contenuti mutati nel tempo, a fronte di una gestione “democratica” e distribuita, tipica di questi tempi da 2.0. Soccorre qui Herbert van de Sompel, già di Ghent e ora dei Laboratori nazionali di Los Alamos e inventore dell’open URL link resolver, che con altri ha creato “ReMember”, ReM esterna che enumera le risorse aggregate (AR) che reintegrano un’aggregazione dispersa e includono metadati descrittivi per ogni AR:
«ReMember attempts to harness the collective abilities of the Web community for preservation purposes instead of solely placing the burden of curatorial responsibilities on a small number of experts».
Dando conto della sua invenzione nel recente OAI 6 di Ginevra (17-19 giugno 2009) con Everyone is a curator: human-assisted preservation for ORE aggregations, dove curator ed everyone sono le parole-chiave, de Sompel sostiene che l’applicazione a un insieme di citazioni bibliografiche online mescolate con semplici rinvii a siti web, ha consentito di separare correttamente le une dalle altre: un ausilio semi-automatico e di poca spesa ai servizi per la stabilità di cui sopra.

Il bello auspicato delle ReM è che potrebbero, si entusiasma de Sompel, essere efficacemente create da chiunque, con un minimo di organizzazione umana e quindi di costi, “alla Wikipedia”. Ancora una volta, l’identità (e l’individuazione e l’identificazione) dell’autore può passare in secondo piano a vantaggio non solo del lavoro collaborativo ma anche a vantaggio di prodotti “cresciuti” praticamente da soli, autocreati (autore, auctus, da augeo, aumentare - il diritto penale parlerebbe forse di “autore mediato”; ma: esistono davvero autori “unici”? e come la metteremmo, in questo caso, con la tutela del copyright, se perfino Dublin Core [1] dà definizioni abbastanza tautologiche e tutto sommato interscambiabili delle figure author, creator, contributor, curator, publisher)? Infatti, all’OAI 6 de Sompel non ha mai parlato, pur trattandone, di “articoli scientifici”, ma solo e sempre di dataset come parti integranti di un non meglio identificato “record scientifico”, per la qual cosa chiunque potrebbe essere il curatore di una pubblicazione scientifica.

Chiunque lavori su una ReM, ovviamente. Ciò impone un ripensamento delle funzioni tradizionali della stessa comunicazione scientifica, delle sue regole e della sua mappatura, che sta mettendo in discussione canoni di valutazione tradizionali come la metrica delle citazioni, per esempio e quindi delle funzioni del peer reviewing. Nemmeno sfuggono le riviste scientifiche tradizionali, in corso di trasformazione in enhanced journal: le “pubblicazioni liquide” proposte dal gruppo Casati-Giunchiglia-Marchese (vedi alla voce Liquefazione in «il Bibliotecario» 3/2008, p. 137-138).

Tra le prime applicazioni di OAI-ORE - a parte il felice esito del controllo delle citazioni in JSTOR, l’archivio storico in linea delle maggiori riviste accademiche a partire dal XVII secolo - è da tener d’occhio www.myexperiment.org, un ambiente collaborativo nel quale scienziati e ricercatori possono pubblicare in sicurezza i loro flussi di lavoro, i propri oggetti (o raccolte di oggetti) digitali e sperimentare progetti di ricerca, condividendoli con il proprio gruppo o trovando gruppi affini: un Facebook o un MySpace sì controllato e protetto e riservato ma per il quale la sostanzia della (nuova) relazione autoriale non cambia

2 commenti:

Anonimo ha detto...

Questo punto non mi convince:
"Ciò è possibile perché il sistema informativo del Web non intende più rappresentare la realtà “esterna” (come fa un documento tradizionale e come fa una base di dati) ma, in quanto sistema informativo oggettuale"

E' troppo vicino al concetto di autoreferenzialità, una definizione che stride con il significato stesso del web che, in quanto 'indeterminato' e potenzialmente infinito non può autoreferenziarsi. Ma la cosa che trovo debole è il concetto di separazione tra il web e la realtà. Il web è solo un modello iniziale di quella realtà aumentata che pervaderà tutti gli oggetti reali ridefinendo addirittura il documento e il suo supporto... non più di carta, non più digitale ma collocato nello spazio e nel tempo indifferentemente dai materiali che lo compongono

Francesco Carnera ha detto...

Ooooops...Il commento l'ho scritto io. Sperimentando l'open ID è uscito websapienza che è un blog multiautore...