lunedì 7 marzo 2011

Culturomica

O culturomics per chi ama gli originali, è il nuovo servizio infor-biblio-scientometrico che innova l’informatica umanistica - talché il NYT è pronto a parlare di «Humanities 2.0» -  appoggiato sull’inevitabile Google da parte di ricercatori di Harvard che hanno messo a punto il grafico di un n-gramma markoviano su una popolazione di dati estratti dal 4% di tutti i libri mai scritti in sei lingue per un totale di 500 miliardi di parole, presenti su Google Books: «scrivete una parola o una frase in una delle sette lingue (inglese, francese, tedesco, spagnolo, ebraico, russo, cinese) e guardate come la sua frequenza di utilizzo è cambiata nel corso dei secoli scorsi» invita l’home page di Culturomics.

Oggi la risorsa è però ancora ottimizzata per la sola lingua inglese del periodo 1800-2000. Scienziati di varie discipline dall’Università di Harvard hanno creato, così, un Google Books N-gram Viewer  che fornisce elementi statistici in campi diversi come la lessicografia, la grammatica, la memoria collettiva, l’uso della tecnologia, la fama, la censura, l’epidemiologia storica.

Per citare un esempio fornito da Patricia Cohen, scrivendo la parola “women” in confronto con “men” si può vedere l’evoluzione della frequenza dei due termini, stabile fino all’arrivo del femminismo degli anni ’70 che ha capovolto e incrementato il rapporto di frequenza.

La risorsa, sostengono ad Harvard, può accelerare, tra l’altro, lo studio dell’evoluzione del linguaggio per l’aggiornamento dei vocabolari.
[pre-print per "Il bibliotecario", III serie, ISSN 11250992, 1-2/2011]

1 commento:

Pellegrina ha detto...

http://files.splinder.com/0218529ef9f29f8590a7dd51d3265540.jpeg grazie, mi dice che non esiste nulla a questo link!