Le frequenze naturali

Dadi

Nel prendere le nostre decisioni, ci facciamo spesso condizionare dalle statistiche e dalle leggi della probabilità: quando votiamo, quando giochiamo al Casinò, quando decidiamo di sottoporci a una determinata operazione medica. Purtroppo, però, altrettanto spesso non ragioniamo a sufficienza sui dati che ci vengono propinati e rischiamo di fraintendere situazioni che, spiegate in maniera più chiara, risultano essere il contrario di quanto pensato fino a quel momento.

In particolare in questo post mi soffermerò sul metodo delle frequenze naturali, utilizzato per spiegare più efficientemente tutti quei casi in cui entra in gioco la cosiddetta probabilità condizionata: si tratta di frasi del tipo “quale è la probabilità che succeda una certa cosa sotto l’ipotesi che ne sia già accaduta un’altra”.

Aiutiamoci con un esempio.

Il test per stabilire che un determinato soggetto sia infetto o meno dal virus HIV sbaglia una volta su diecimila casi trattati. Immaginiamo ora di sottoporci a questo test e risultare positivi, ovvero malati. Quale è la probabilità di esserlo veramente?

Questo problema rientra nell’ambito della probabilità condizionale, in quanto stiamo cercando la probabilità che si verifichi l’evento A (sono malato) nell’ipotesi che si sia già verificato l’evento B (il mio test è positivo).

A un’occhiata superficiale si potrebbe pensare: visto che il test sbaglia solamente una volta su diecimila, posso essere ragionevolmente certo di avere il virus. Niente di più sbagliato!

Non solo: così come è posto, il problema non ha soluzione, in quanto la risposta al quesito dipende in modo diretto con la diffusione della malattia tra la popolazione di cui il soggetto fa parte. Il test sbaglia infatti molto più spesso se la malattia è meno diffusa percentualmente sulla popolazione.

Rivediamo l’esempio di prima usando le già citate frequenze naturali, e aggiungendo l’informazione mancante: poniamo che una persona su diecimile sia affetta dal virus dell’HIV. Faccio notare che sia questo valore sia il precedente sull’accuratezza del test sono verosimilmente quelli reali.

Prendiamo quindi un campione di 10.000 persone: una di esse sarà malata di HIV, 9.999 saranno sane. Se quindi il test fosse corretto al 100%, avremmo un positivo e 9.999 negativi. Poiché però sbaglia in un caso su 10.000, avremo due possibilità: 10.000 negativi (nel caso più improbabile che quello sbagliato sia il positivo diventato negativo) oppure 2 positivi e 9.998 negativi (situazione altamente probabile, in cui un negativo risulti positivo).

Ora, tornando alla domanda iniziale: quale è la probabilità che io sia effettivamente positivo dato il risutato positivo dell’esame? Uno su due, ovvero il 50%. Infatti nell’esempio il test forniva due esiti positivi, di cui solamente uno realmente affetto dal virus.

Stupefacente, vero?

(Spiegazioni molto più dettagliate ed esaurienti sul problema si trovano sul volume “Quando i numeri ingannano” di Gerd Gigerenzer, Raffaello Cortina Editore, 25,50 euro, ISBN 88-7078-843-1)

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.