Certe coincidenze
Questo articolo è stato pubblicato il 13 marzo 1998 nel numero 223 di Internazionale.
La scena è il circuito automobilistico di jerez, in Spagna, durante l’ultima corsa di Formula Uno della stagione 1997. Nella classifica del campionato Michael Schumacher distacca di un punto il rivale di sempre Jacques Villeneuve. Schumacher deve ringraziare in parte la brillante tattica di corsa del compagno di squadra in Ferrari, Eddie Irvine, nella gara precedente. A Jerez un ruolo analogo potrà giocarlo il compagno di Villeneuve in Williams, Heinz-Harold Frenzen. La conquista della pole position è ancora più determinante del solito.
Che succede? Nel loro giro più veloce, Villeneuve, Schumacher e Frentzen fanno tutti fermare il cronometro esattamente a un minuto, 21 secondi e 72 millesimi. Stupefatti, i commentatori parlano di coincidenza sbalorditiva. Di “coincidenza” sicuramente si tratta: i tempi del giro coincidono. Ma è davvero “sbalorditiva”?
Domande come questa non si applicano solo allo sport, si ripropongono spesso. Quanto c’è di sorprendente nell’avere incontrato la prozia svedese Lottie in uno strip bar di San Francisco? È davvero strano che al pranzo di Natale tre persone indossino lo stesso vestito? E nella scienza, che dire quando si presentano casi plurimi di leucemia? Una forte correlazione tra il cancro al polmone e l’avere in famiglia un fumatore prova davvero che il fumo passivo è pericoloso? Uno di noi due, Jack Cohen, è biologo.Lo scorso anno gli è stato chiesto di spiegare due statistiche molto curiose. Mentre era in Israele gli è stato fatto notare che l’84 per cento dei figli dei piloti di caccia israeliani sono femmine. “Che c’è nella vita di un pilota di caccia che determina questa netta prevalenza?”.
Alla lunga ogni numero del lotto ha la stessa probabilità di uscire. Ma la macchina del lotto non ha memoria
La seconda statistica aveva a che fare con la fecondazione in vitro. Nelle cliniche che la praticano, per controllare il processo di ovulazione si fa ricorso agli ultrasuoni e si può in questo modo determinare se un ovulo – e il risultante bambino – viene dall’ovaia destra o da quella sinistra. In una clinica si è scoperto che la maggior parte dei bambini maschi arrivava dall’ovaia destra, e la maggior parte delle femmine da quella sinistra. È la soluzione per scegliere il sesso dei vostri bambini? O semplicemente un capriccio statistico?
L’intuizione non aiuta
Non è facile decidere. La risposta istintiva è tutt’altro che utile, dato che l’intuizione umana è povera quando si tratta di eventi casuali. Molta gente crede che i numeri del lotto che non escono da parecchio tempo abbiano più probabilità di essere estratti. Danno come giustificazione la “legge dei grandi numeri”: sul lungo termine tutto si livella. Ma la verità è diversa, e per niente intuitiva. Sì, alla lunga ogni numero del lotto ha davvero le stesse probabilità di uscire degli altri. Ma la macchina del lotto non ha memoria. Le proporzioni sul lungo termine si livellano, ma non si può stabilire in anticipo quanto sarà lungo questo termine. Di fatto, se si decide di fare un determinato numero di tentativi, per quanto grande esso sia, la migliore previsione resta quella di dire che ogni squilibrio iniziale resterà immutato.
La nostra intuizione ci è ancor meno di aiuto di fronte alle coincidenze. Vai in piscina e il tizio alla cassa prende una chiave a caso da un cassetto pieno di chiavi. Arrivi allo spogliatoio e sei sollevato scoprendo che gli armadietti occupati sono pochi… poi salta fuori che tre persone hanno l’armadietto vicino al tuo, ed è tutto un “mi scusi!”, quando gli sportelli degli armadietti urtano l’uno contro l’altro. Oppure, sei alle Hawaii per la prima volta in vita tua e ti imbatti nell’ungherese con cui hai lavorato a Harvard. O ancora, sei in luna di miele, accampato in tenda in una zona remota dell’Irlanda ed ecco che spunta il capo dipartimento e la sua nuova moglie che vengono verso di te lungo una spiaggia altrimenti deserta. Tutte cose successe a Jack.
Lo spazio campionario
Queste coincidenze ci sembrano tutte sensazionali in quanto ci aspettiamo che gli eventi casuali siano distribuiti uniformemente, e siamo perciò sorpresi dalla loro concentrazione, da questi “grappoli” statistici. Pensiamo che una “tipica” estrazione del lotto britannico sia qualcosa come 5, 14, 27, 36, 39, 45, mentre riteniamo molto meno probabile una combinazione del tipo 1, 2, 3, 19, 20, 21. In realtà, queste due serie di numeri hanno la stessa probabilità di uscire: una su 13.983.816. Le sequenze di sei numeri a caso hanno, a dire il vero, più probabilità di presentarsi a grappoli che non il contrario.
Come facciamo a saperlo? La teoria della probabilità affronta questioni del genere introducendo il concetto di “spazio campionario” o “spazio dei campioni”. Uno spazio campionario contiene non solo l’evento che ci interessa, ma anche tutte le possibili alternative. Se stiamo lanciando un dado, per esempio, allora lo spazio campionario è dato da 1, 2, 3, 4, 5, 6. Nel caso del lotto britannico la spazio campionario è l’insieme di tutte le possibili sequenze di sei numeri tra 1 e 49. A ciascun evento dello spazio campionario è assegnato un valore, che chiamiamo la sua “probabilità” e che ci dice quanto sia probabile che quell’evento accada. Nel caso di un dado non truccato, ogni valore ha una pari probabilità di uscire, nello specifico uguale a 1/6. Lo stesso vale per il lotto, ma la probabilità è adesso di una su 13.983.816.
Riflettere sulla dimensione dello spazio campionario aiuta a determinare fino a che punto una coincidenza è davvero sbalorditiva. Prendiamo i tempi sul giro nella Formula Uno. I migliori piloti girano tutti più o meno alla stessa velocità, sicché è ragionevole supporre che i tre tempi migliori cadano tutti nello stesso intervallo di un decimo di secondo. Se si rilevano i tempi al millesimo di secondo, allora ci sono cento tempi sul giro da cui scegliere, e questo elenco determina lo spazio campionario. Assumiamo per semplicità che tutti i tempi nell’intervallo prefissato abbiano la stessa probabilità di essere raggiunti. Allora c’è una possibilità su cento che il secondo pilota faccia segnare lo stesso tempo del primo, e un’analoga possibilità su cento che il terzo faccia lo stesso, il che ci porta ragionevolmente a stimare la probabilità dei tempi coincidenti nella misura di uno su diecimila. Piccola abbastanza da essere sorprendente, ma non così tanto piccola da farci sbalordire. È più o meno come nel golf centrare una buca con un colpo solo.
Stime come questa contribuiscono a spiegare le incredibili coincidenze riportate sui giornali, come il caso di giocatori di bridge che si vedono servire una “mano perfetta”, con tutte e tredici le carte di un colore. In ogni partita le possibilità che questo accada sono straordinariamente basse. Ma è enorme il numero di partite di bridge giocate ogni settimana nel mondo. Così enorme che ogni tanto gli eventi reali esplorano tutto lo spazio campionario a disposizione.
In altre parole non è strano che da qualche parte siano servite delle mani perfette, con una frequenza determinata dalla loro probabilità, bassa ma non nulla.
L’uso dello spazio campionario, tuttavia, non è del tutto immediato. Gli studiosi di statistica tendono a lavorare con lo spazio campionario “ovvio”. Nel caso dei piloti di caccia israeliani, per esempio, sarebbe per loro naturale assumere come spazio campionario tutti i figli di questi piloti. Ma potrebbe essere la scelta sbagliata. Perché? Spesso noi tendiamo a sottostimare la dimensione dello spazio campionario, rendendo così le coincidenze più sorprendenti di quanto lo siano veramente. Si riduce tutto a un fattore cruciale che chiamiamo “attenzione selettiva” e che tende a essere ignorata nella maggior parte delle statistiche convenzionali.
L’evento che fa notizia
La mano perfetta al bridge, per esempio, è molto più probabile che finisca sulle pagine dei giornali locali o addirittura nazionali che non, ovviamente, una di quelle imperfette. Il cervello umano non può fare a meno di cercare dei modelli e si concentra su alcuni eventi che considera significativi, indipendentemente dal fatto che lo siano davvero. E, così facendo, esso ignora tutti gli eventi “vicini” che lo aiuterebbero a giudicare fino a che punto la coincidenza osservata è realmente probabile o improbabile.
L’attenzione selettiva modifica il significato dei nostri tempi della Formula Uno. Se non fossero stati loro a presentare un carattere insolito, forse avremmo avuto i punteggi tennistici agli Open degli Stati Uniti, o le serie ininterrotte di palle in buca al torneo settimanale di biliardo, o il golf… Tutti episodi di cui si sarebbe comunque parlato. Ma nessuna delle coincidenze mancate, quelle non perfettamente riuscite, avrebbe fatto notizia. Se si includono appena dieci importanti eventi sportivi nell’elenco di quelli che avrebbero potuto dare luogo a coincidenze strane ma non l’hanno fatto, quella possibilità di uno su diecimila di avere l’evento che fa notizia diventa di uno su mille.
I figli dei piloti
Ritornando al caso dei piloti di caccia israeliani, che c’è in gioco? Pura casualità o qualcos’altro? Per rispondere alla domanda, la statistica convenzionale prenderebbe in esame lo spazio campionario ovvio (i figli dei piloti di caccia), assegnerebbe le probabilità ai bambini maschi e femmine, e calcolerebbe la possibilità di ottenere un 84 per cento di femmine in un processo puramente casuale. Ma questa analisi ignora l’attenzione selettiva. Prima di tutto perché tanto interesse al sesso dei figli dei piloti di caccia israeliani? Presumibilmente un primo grappolo, una prima serie di casi con carattere di ricorrenza, deve avere attirato l’attenzione. Se a presentare questo carattere di ricorrenza fosse stata l’altezza dei figli dei fabbricanti di aerei israeliani, o l’attitudine alla musica delle mogli dei controllori aerei israeliani, allora l’attenzione delle persone a caccia di coincidenze si sarebbe concentrata su queste altre strane circostanze. L’approccio della statistica convenzionale esclude tacitamente molti altri fattori che non abbiano dato luogo a un grappolo, cioè ignora parte dello spazio campionario.
Il cervello umano filtra enormi quantità di dati, cercando le cose che gli sembrano inusuali, e solo dopo averne individuata una, invia un segnale con il quale dice: “Guarda là!”. Più grande è la rete con cui andiamo a pesca di modelli, più cresce la probabilità di imbattersi in un grappolo. Non c’è nulla di strano in questo. Ma se vogliamo sapere se questo grappolo è davvero significativo, non possiamo includere i dati che all’inizio hanno richiamato la nostra attenzione.
Poteri straordinari
È proprio l’errore commesso ai tempi dei primi esperimenti sulla percezione extrasensoriale. A migliaia di soggetti fu chiesto di indovinare le carte pescate da un mazzo speciale di cinque colori. Dopo alcune settimane di selezione coloro che avevano mostrato un tasso di successo superiore alla media furono richiamati e sottoposti a ulteriori prove. All’inizio questi “buoni indovini” sembrarono avere poteri straordinari. Ma andando avanti con il tempo, il loro tasso di successo lentamente si riportò al livello medio, come se i loro poteri stessero “scemando”. Ciò accadeva perché i loro alti punteggi iniziali – il grappolo per cui erano stati scelti – erano inclusi nel conteggio totale. Se questi risultati fortuiti fossero stati esclusi dalla seconda serie di test, allora il tasso di successo sarebbe sceso, immediatamente, vicino alla media.
E lo stesso ragionamento vale per i piloti di caccia e per le ovaie destra/sinistra. Le caratteristiche curiose che hanno attirato l’attenzione dei ricercatori su questi fenomeni particolari sono probabili conseguenze dell’attenzione selettiva. Se è così, allora possiamo fare una previsione semplice: “D’ora in avanti, i fenomeni osservati torneranno a bilanciarsi”. Se questa previsione dovesse rivelarsi errata e se i risultati confermassero invece la tendenza che ha rivelato il grappolo, allora i nuovi dati possono essere considerati significativi. Ma la scommessa vincente è puntare sul successo della previsione.
Lo stesso errore può verificarsi negli studi sperimentali convenzionali, come nel caso, ad esempio, si voglia stabilire se certi alimenti possono essere cancerogeni. Per risparmiare tempo, il modo usuale di procedere è osservare contemporaneamente molti diversi alimenti – fibre, grassi, carni rosse, verdure, e così via – e vedere come si comportano in rapporto ai tassi di tumore. Fin qui tutto bene. Ora, però, voi prendete la voce con il punteggio maggiore, cioè l’alimento che più di tutti sembra essere insolitamente correlato ai tassi di cancro. A meno di stare attenti, vi dimenticate di tutti gli altri fattori e pubblicate uno studio dicendo che mangiare le carni rosse aumenta i rischi di cancro. Siete comunque sicuri del fatto vostro; dopo tutto avete scelto l’alimento più significativo tra le centinaia che avete testato. Ma c’era da spettarsi che almeno uno di essi fosse significativo. Dal punto di vista statistico sarebbe stato strano se non fosse andata così, perfino se tutti gli alimenti fossero stati scelti a caso.
La presunta diminuzione del numero di spermatozoi umani è un altro esempio di attenzione selettiva
In questa trappola è caduto lo scorso anno uno studio condotto all’Institute of Child Health di Londra che affermava di avere scoperto un “gene della sensibilità”. I ricercatori hanno distribuito un questionario, correlato le risposte ottenute con le probabili influenze genetiche o culturali, e affermato che la sensibilità degli esseri umani – quanto siamo gentili nei rapporti con gli altri, quanto c’è di “femminile” nel nostro approccio al mondo – è determinata geneticamente. La previsione ragionevole è che negli studi futuri queste correlazioni non si ripeteranno. Se questa previsione dovesse invece rivelarsi errata, il gene in questione comincerebbe allora, ma solo allora, ad acquistare interesse.
La presunta diminuzione del numero degli spermatozoi umani è forse un altro esempio di attenzione selettiva. La responsabilità, comunque, non è dell’équipe di Niels Skakkebaek dell’Università danese di Copenaghen, che nel 1997 ha pubblicato la prima prova ampiamente accettata di una diminuzione.
L’attenzione selettiva è stata operata da ricercatori che avevano in mano prove contrarie ma che non le hanno pubblicate perché pensavano fossero errate; dalle commissioni delle riviste scientifiche che in genere hanno preferito gli studi che confermavano l’ipotesi; dalla stampa, che in un’unico articolo ha messo insieme difetti eterogenei collegati al sesso, presenti nel mondo animale, creando confusione.
Le quasi-coincidenze
In sintesi il concetto è: quando stimiamo la rilevanza statistica di qualcosa, la nostra scelta dello spazio campionario si deve adattare all’esperimento così come è stato effettivamente eseguito, e non essere influenzata dall’attenzione selettiva. Il modo più sicuro di procedere è scartare i dati che hanno portato al nostro risultato particolare, e ripetere l’esperimento per ricavare nuovi dati. Ma anche a questo punto non dobbiamo permettere che sia la coincidenza, il grappolo, a scegliere lo spazio campionario in vece nostra, nel qual caso tralasceremmo lo spazio circostante, affollato di quasi-coincidenze.
Abbiamo deciso di verificare questa teoria nel corso di un recente viaggio in Svezia. Sull’aereo Jack ha pronosticato che arrivati all’aeroporto di Stoccolma si sarebbe verificata una coincidenza. Il motivo? Volevamo vedere l’attenzione selettiva in azione. Dunque siamo usciti dall’aeroporto e ci siamo diretti verso la stazione degli autobus, e fin qui nessuna coincidenza. Ma poiché non riuscivamo a trovare l’autobus giusto, Jack è andato allo sportello informazioni. Mentre aspettava il suo turno, una persona gli si è avvicinata: era Stefano, un matematico che lavora nell’ufficio a fianco a quello di Jack alla Warwick University.
Pronostico rispettato. Ma ciò su cui noi volevamo veramente mettere le mani era una quasi-coincidenza; una non accaduta per poco, ma che se fosse successa avrebbe potuto essere oggetto di attenzione selettiva. Per esempio, se qualche altra persona di nostra conoscenza si fosse fatta viva esattamente nel momento del nostro arrivo all’aeroporto di Stoccolma, ma nel giorno sbagliato, o nell’aeroporto sbagliato, noi non ci avremmo mai fatto caso. Considerata la quantità di persone che conosciamo, la Svezia poteva essere piena di gente a noi nota, era quindi praticamente impossibile che non ci imbattessimo in qualcuno di loro. Per definizione le quasi-coincidenze sono difficili da osservare. Ma ci è capitato di accennare la questione a un amico di Ian, Ted, che è venuto a trovarci poco dopo il nostro ritorno in Inghilterra. “Stoccolma?”, ha detto Ted. “E quando?”. Glielo abbiamo detto, e allora lui ha continuato: “Quale albergo?”. “Il Birger Jarl”. “È buffo, ero al Birger Jarl il giorno dopo di voi”. Quindi se avessimo preso il volo del giorno dopo, non avremmo incontrato Stefano, ma in compenso avremmo incontrato Ted. L’attenzione selettiva avrebbe assicurato che avremmo riferito ai nostri amici solo la coincidenza che si è realmente verificata.
La teoria della probabilità stabilisce la probabilità che un evento si verifichi in rapporto ad altri che sarebbero potuti accadere. La nostra intuizione delle probabilità è povera perché il sistema di riconoscimento delle cose all’opera nel nostra cervello nota solo ciò che accade. Nel mondo che ci circonda ogni evento è unico. Ogni incontro, ogni rapporto di proporzione tra i sessi, ogni mano di bridge. “Cosa? il tuo numero di telefono è quasi identico a quello del libretto di circolazione della tua macchina? Ma è sbalorditivo!”. Ma quando poi vi rendete conto che il cittadino tipo porta con sé diverse decine di numeri significativi (indirizzo, codice postale, fax, telefonino, carte di credito), è chiaro che una possibilità di somiglianza tra due di essi è all’ordine del giorno.
Pioggia meravigliosa
Dobbiamo perciò evitare di esaminare gli eventi passati e cercare a tutti i costi qualcosa di significativo in quelli, inevitabilmente pochi, che ci sembrano strani. Ogni forma lasciata dalle gocce di pioggia sulla strada è unica. Noi non diciamo che se una di queste forme va a scrivere il nostro nome, non ci sia da meravigliarsene; ma che se il nostro nome fosse stato scritto sulla strada, a Pechino, durante la dinastia Ming, a mezzanotte, nessuno l’avrebbe notato.
Non è di nessuna utilità esaminare la storia passata se si vuole stabilire un qualcosa di significativo: bisogna considerare anche tutti gli altri eventi che sarebbero potuti accadere. Ogni evento reale è unico. Finché non lo collochiamo in una categoria, non abbiamo un contesto in cui esaminarlo. Finché non scegliamo un contesto, non possiamo stimare la probabilità dell’evento. D’altra parte se qualcosa che ci sembra misterioso rivela davvero di possedere uno spazio campionario piccolo, allora dovremmo essere veramente sorpresi.
(Traduzione di Nazzareno Mataldi)
Questo articolo è stato pubblicato il 13 marzo 1998 nel numero 223 di Internazionale. L’originale era uscito su New Scientist.