E’ possibile usare la statistica per definire quanto un libro sia “leggibile”?
Amazon.com, sfruttando il programma Search inside a book, ci offre qualche strumento, ovviamente senza pretese di valore estetico, ma solo relativo a una (presunta) “facilità di lettura”.
Per ogni libro del suo catalogo nel quale sia possibile effettuare la ricerca, da qualche settimana ci offre anche una serie di informazioni aggiuntive, basate su alcuni indicatori.
Per esempio, Se una notte in inverno un viaggiatore di Italo Calvino (ovviamente l’analisi statistica si riferisce alla traduzione inglese):
1) tre indici di *Leggibilità*, non chiari da interpretare – sono indici legati al livello di istruzione necessario per comprendere un certo libro; basta dire che “meno leggibili” del libro di Calvino ci sono, rispettivamente: il 29% dei libri in catalogo ad Amazon, secono l’indice Fog; il 52% secondo l’indice Flesch e il 27% secondo l’indice Flesch-Kinkaid: diciamo che il confronto fra il secondo indice e gli altri due ci dice parecchio sulla dubbia utilità del metodo.
2) *Complessità* Questo mi sembra già più utile, o almeno più divertente. Prevede:
Parole complesse: in Se una notte… sono il 12% (significa che il 12% delle parole usate da Calvino – meglio, delle parole tradotte – ha tre o più sillabe); il 61% dei libri di Amazon ha più parole complesse di questo di Calvino.
Sillabe per parola: 1,5: il 64% dei libri di Amazon è composto da parole con in media più di 1,5 sillabe.
Parole per frase: 26,1: solo il 9% dei libri di Amazon ne ha meno (Per essere rigorosi, dovremmo dire: dei libri di Amazon che sono nel programma Search inside).
A proposito di complessità, ecco come sta messo Pastorale americana di Philip Roth:
parole complesse: 9%
sillabe per parola: 1,5
parole per frase: 15,6
e Guerra e pace:
parole complesse: 11%
sillabe per parola: 1,5 (sì anche a me questo dato sembra più frutto della lingua inglese che degli sforzi degli autori)
parole per frase: 19,2
infine, Sorvegliare e punire di Michel Foucault
parole complesse: 19%
sillabe per parola: 1,7
parole per frase: 37,4
Trovo divertenti (e forse anche utili, non so bene per cosa) anche le concordanze – cioè le parole più frequenti in un libro (esclusi articoli, preposizioni ecc.): in Se una notte d’inverno, la parola più frequente è “libro”. E le Sip (Statistically improbable phrases): dovrebbero essere le frasi distintive di un certo libro, quelle che lo caratterizzano; sono “improbabili” rispetto agli altri libri ovviamente, non rispetto al libro di cui sono figlie, nel quale invece sono frequenti. Nel libro di Calvino sono: “scrittore tormentato”, “scrittore produttivo” (stanno nel capitolo ottavo, nel progetto di racconto) e “l’ombra s’addensa” (Che è dentro Guarda in basso dove l’ombra s’addensa, uno dei libri che il lettore legge dentro il libro di Calvino).
Ho scoperto poi che di questa cosa si è recentemente occupato anche Steven Berlin Johnson sul suo blog (ripreso da Internazionale), mettendo a confronto i suoi libri con quelli di altri due scrittori. Steven Berlin Johnson è quello che ha scritto Tutto quello che fa male ti fa bene. Perché la televisione, i videogiochi e il cinema ci rendono intelligenti, Mondadori, che non ho letto: insomma, non so se fidarmi ;).
Rispondi