Mentire con le statistiche [RECENSIONE]

Recentemente mi è capitato di leggere il libro “Mentire con le statistiche” scritto da Darrel Huff nel 1954. Si tratta di un libro divulgativo che aiuta a ragionare in maniera facile e immediata sul modo in cui talvolta le statistiche vengono usate in maniera ingannevole. Un libro molto scorrevole di c.a. 200 pagine, scritto in un linguaggio estremamente semplice ma al tempo stesso preciso.
Nonostante non sia stato scritto da uno statistico di professione, si tratta del libro di statistica più letto di tutti i tempi.
In questo articolo ho quindi deciso di fare una recensione di “Mentire con le statistiche” per illustrare cosa ho veramente apprezzato di questo testo e perché consiglio di leggerlo.
Cominciamo.

A chi è indirizzato “Mentire con le statistiche”

Contrariamente a quanto sembrerebbe suggerire il titolo, “Mentire con le statistiche” è un libro indirizzato alle persone comuni, costantemente bersaglio di statistiche più o meno precise. Il libro, infatti, non insegna come “abbellire” i numeri quanto, piuttosto, come leggere le statistiche con occhio critico al fine di verificarne l’attendibilità o la coerenza rispetto a ciò che si pretende di dimostrare. Attraverso una serie di esempi concreti, l’autore passa al vaglio tutte le tecniche più utilizzate per trarre in inganno il pubblico circa il reale significato di risultati statistici molto spesso utilizzati per secondi fini.
Va da sè che, parlando di statistica, ciò che apprenderete in questo libro è applicabile a tutti i campi della vita. Dalle statistiche sui risultati di un determinato dentifricio a quelle sui rendimenti dei mercati finanziari. Quale che sia, dunque, l’ambito di vostro interesse, questo testo vi fornirà uno strumento prezioso per evitare di cadere in facili inganni.

Quanto è ingannevole parlare di “media”

Spesso chi vuoi dimostrare una cosa al grande pubblico fa appello alla “media”. La retribuzione media in questa regione è X; la spesa media per famiglia è Y. E così via.
Ma è così affidabile parlare di media per dimostrare qualcosa?
Insomma, se facciamo una media del mio patrimonio, del tuo e di quello di Elon Musk probabilmente la media esce intorno a 70 miliardi di euro. Questo dato, per quanto corretto dal punto di vista matematico, rispecchia veramente la realtà?
Ecco, i primi capitoli di “Mentire con le statistiche” sono proprio dedicati a far capire come, talvolta, non solo parlare di media è inutile ma è addirittura fuorviante. Qui di seguito le parti che personalmente ho apprezzato di più.

L’importanza del campionamento

In primo luogo l’autore si sofferma sull’importanza del campionamento che deve essere quanto più fedele e casuale rispetto al parametro campionato. Nell’ambito di tutte le serie statistiche che si possono presentare con un campionamento ridotto o sbagliato, infatti, è molto facile ottenere risultati assolutamente non veritieri.
Ipotizziamo che io voglia verificare quale è il colore di auto più venduto in una certa zona. Se il campionamento che utilizzo per fare questa verifica è ridotto (ad es. 10 auto) può capitare che le unità che seleziono casualmente siano tutte bianche, oppure bianche o rosse. Ma è facile comprendere che questo non corrisponde alla realtà. Il punto è il seguente: se il campionamento è ridotto posso dimostrare praticamente qualsiasi cosa poiché, prima o poi, nella serie statistica si verificano tutte le opzioni possibili (auto tutte nere, auto metà nere e metà blu, e così via). La stessa cosa è possibile fare nel caso in cui il campionamento sia fatto su larga scala in modo errato. Se ad esempio io so che in una determinata zona abitano solo ragazzi giovani è probabile che il dato che viene fuori non rispecchia ciò che io intendevo dimostrare. A meno che il mio intento non fosse quello di dimostrare quale colore di auto preferiscono i giovani.
Di qui l’importanza del campionamento.

Il concetto (fuorviante) di “media”

Il termine media, genericamente inteso, può avere vari significati, tutti corretti. A seconda di ciò che si vuole dimostrare è sufficiente fare riferimento all’uno o all’altro. Ad esempio, la media aritmetica è molto diversa dalla mediana o dalla moda. Se ad esempio io e te guadagnano 1.500 euro al mese e una terza persona ne guadagna 60.000 possiamo dire, indifferentemente, che la media è 21.000 euro o 1.500 e in entrambi i casi il risultato sarebbe matematicamente corretto.
Come è possibile? Semplicemente perché non è stato specificato di che “media” si tratta. Leggendo “Mentire con le statistiche” imparerete a leggere mi maniera critica dati diffusi come dati in “media” e capirete l’importanza e la differenza tra media aritmetica, mediana e moda.

I grafici e la “distorsione ottica”

Altro “trucchetto” spesso utilizzato per edulcorare qualche statistica è quello di presentare statistiche sotto forma di grafico. Talvolta, infatti, l’effetto visivo che si può ottenere è molto più di impatto di qualche numeroso scritto. In questa parte del libro l’autore vi svelerà alcuni piccoli segreti per capire quando una statistica grafica è veramente attendibile o è solo il risultato di una manipolazione di valori. Giusto a titolo di esempio, la stessa identica statistica può essere presentata su due grafici diversi con un effetto ottico completamente diverso.
Come?
E’ sufficiente modificare la proporzione tra le ascisse e le ordinate ed ecco che il trucco è servito. Il tutto nella piena correttezza matematica.

L’ingannevole rapporto causa/effetto nelle relazioni statistiche

Questa è probabilmente la parte che ho preferito di questo libro. Qui l’autore si concentra sulla modalità con cui a volte alcuni dati vengono presentati per indurre il lettore a trarre una conclusione di causa/effetto tra gli stessi. Peggio ancora, a volte, la conclusione viene tratta (consapevolmente o inconsapevolmente) da chi presenta quei dati.
Mi sia consentito solo un esempio tratto dal libro di Huff. E’ stato “dimostrato” che esiste una relazione tra i dati sul fumo e i rendimenti scolastici. In sintesi, ciò che è venuto fuori è che, tendenzialmente, chi fuma ottiene voti più bassi all’università. Se ne trae, evidentemente, la conseguenza che il fumo contiene probabilmente qualche sostanza che incide sulla concentrazione (o che altro) e inficia il rendimento degli studenti.
Ma è davvero così? Ne siete certi?
Beh, secondo Huff è impossibile essere certi di una conclusione del genere semplicemente perché è il frutto di un ragionamento del tutto arbitrario. La tesi opposta, infatti, potrebbe essere altrettanto valida ed anzi ha le stesse identiche probabilità di essere vera. Con questi dati in mani potremmo infatti essere in grado di dimostrare che gli studenti che vanno peggio all’università si rifugiano nel fumo. Ciò potrebbe rivelarsi particolarmente utile per qualche comitato cittadino che intendesse proporre alle istituzioni la costruzione di centri ricreativi o la realizzazione di determinati eventi culturali per attirare l’attenzione dei giovani studenti.
Si tratta solo di un esempio (ma nel libro ne troverete molti altri) per far capire che a volte i dati andrebbero presi per quello che sono: mere relazioni senza alcun rapporto causa/effetto verificabile.

Conclusioni: perché leggere “Mentire con le statistiche”

“Mentire con le statistiche” è un libro che tutti dovrebbero leggere. Dagli appassionati di finanza a quelli di sport. Fornisce una lente di ingrandimento per vedere meglio cosa c’è dietro alle statistiche che troppo spesso sono presenti su tutti i mezzi di informazione. A volte queste sono intenzionalmente presentate con l’intento di fornire dati fuorvianti; altre volte sono inconsapevolmente presentate in maniera tale da indurre il pubblico a trarre conclusioni totalmente errate. Si tratta di un vero e proprio manuale per difendersi dal facile inganno dei numeri.
Se sei interessato a leggere “Mentire con le statistiche”, lo puoi acquistare direttamente da qua!



close

Hey, ciao 👋
Rimani aggiornato su tutti i nuovi contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.