trial & error

Culturomics, per studiare l’evoluzione culturale

leave a comment »

Considerare la sfera culturale in una prospettiva evoluzionistica non è idea nuova. Karl Popper negli anni ’60 aveva parlato di mondo3, cioè la dimensione delle teorie e delle creazioni culturali, che si evolve, per tentativi ed errori interagendo con il mondo1 (l’ambiente fisico e biologico) e il mondo2 (gli stati mentali soggettivi). Richard Dawkins ne Il Gene Egoista (1976), illustrava la sua teoria dei “memi”: dopo i geni (pezzi di informazione codificati nel replicatore molecolare costituito dal Dna) si potrebbe dire che sul nostro pianeta sono comparsi questi nuovi replicatori, appunto, i memi, e cioè le idee, le teorie, le religioni, le tradizioni, codificate nel linguaggio orale e scritto e nei comportamenti e capaci di evolvere, replicandosi da un cervello ad un altro come delle specie di virus.

Anticipatori, forse visionari. Ma oggi l’approccio “evoluzionista” alla cultura potrebbe iniziare a produrre risultati concreti, mediante tecnologie per l’analisi quantitativa dei fatti culturali. Come l’applicazione lanciata il 16 dicembre da Google, sviluppata insieme ad un team dell’università di Harvard: The Google Books Ngram Viewer. Le caratteristiche e le potenzialità dello strumento sono state illustrate dai creatori in un articolo su Science.

Books Ngram Viewer permette di analizzare la frequenza di n-grammi tra 5,195,769 libri digitalizzati parte del database di Google Books, a partire dal 1500 (circa il 4% di tutti i libri pubblicati). Traduzione. Cos’è un n-gramma? E’ una sottosequenza di elementi in una data sequenza. Nel linguaggio naturale umano possono essere i fonemi in una sillaba, le sillabe in una parola, le parole in una frase. A seconda degli elementi della sequenza si chiamano unigramma, digramma, trigramma ecc. Per esempio una parola come “socialismo” è un unigramma, mentre “fine settimana” è un digramma. Il programma permette di analizzare la frequenza di questi elementi in un periodo di tempo.

Ad Harvard hanno chiamato questa analisi Culturomics, perchè, spiega Jean-Baptiste Michel (ricercatore del dipartimento di psicologia che ha partecipato al progetto) in questo articolo di Scientific American, “i fenomeni culturali possono essere studiati come l’evoluzione in biologia”. Per i ricercatori, come un gene o un fenotipo cambia nel tempo, così avviene con le sensibilità culturali.

A provarla, l’applicazione è divertente. Si scopre che “capitalism” e “socialism” si sono “evolute”, in modo quasi parallelo, dal 1840 (con una caduta del primo dal 1980, e del secondo dal 2000). La frequenza di “religion” è caduta di quasi il 60% (correggetemi se sbaglio) tra il 1800 e il 2000, attestandosi al pari con “science”. “Beatles” stravince su “Rolling Stones”: entrambe le queries producono trend sempre in crescita rapida fino al 2000, ma molto più accentuata per i primi, e un’interissante flessione per entrambe intorno al nuovo millennio. Si possono scoprire evidenze di censura, ad esempio inserendo “Marc Chagall” nel periodo del nazismo. Tanto per fare qualche esempio.

Le potenzialità di questo strumento sono molte, ma anche i rischi. Che cosa misura davvero n-grams? La frequenza delle parole deve tenere conto dei mutamenti semantici: il loro significato cambia nel tempo, producendo riferimenti diversi, e così la loro connotazione (la frequenza di capitalism non significa che il capitalismo fosse visto positivamente nei libri analizzati). la vera sfida, spiegano gli autori stessi, è l’interpretazione dei dati grezzi prodotti dal sistema: si deve tener conto del periodo scelto, delle accezioni dei termini, del focus della ricerca. In futuro, raccontano a SciAm, sperano di poter allargare il campo di ricerca a giornali e riviste, ed anche a oggetti non testuali, come dipinti e opere d’arte.

Annunci

Written by trial & error

dicembre 20, 2010 a 1:53 pm

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: