Bugie, verità e Bayes
Moderatori: Gianfranco, Bruno
Questo forum è una sezione del PORTALE DI BASE CINQUE
-
- Supervisore del sito
- Messaggi: 1828
- Iscritto il: ven mag 20, 2005 9:51 pm
- Località: Sestri Levante
- Contatta:
Bugie, verità e Bayes
Ho trovato in rete un problema come questo, ma la soluzione data non mi convince.
---
Baldo dice la verità 4 volte su 5.
Baldo lancia un dado e afferma che è uscito il 6.
Qual è la probabilità che sia davvero uscito un 6?
---
Versione originale:
A speaks the truth 4 out of 5 times.
A die is tossed.
A reports that it is a 6.
What are the chances that there actually was a 6?
[La risposta data è 4/9]
http://math.tutorvista.com/statistics/b ... eorem.html
Voi che cosa ne pensate?
---
Baldo dice la verità 4 volte su 5.
Baldo lancia un dado e afferma che è uscito il 6.
Qual è la probabilità che sia davvero uscito un 6?
---
Versione originale:
A speaks the truth 4 out of 5 times.
A die is tossed.
A reports that it is a 6.
What are the chances that there actually was a 6?
[La risposta data è 4/9]
http://math.tutorvista.com/statistics/b ... eorem.html
Voi che cosa ne pensate?
Pace e bene a tutti.
Gianfranco
Gianfranco
Re: Bugie, verità e Bayes
Per prima cosa, la traduzione che non va!
A speaks the truth 4 out of 5 times. $\Rightarrow$ "A" dice la verità quattro volte su cinque.
A die is tossed. $\Rightarrow$ Viene lanciato un dado.
A reports that it is a 6. $\Rightarrow$ "A" dichiara che è uscito un sei
Abbiamo due proposizioni
$\displaystyle \begin{array}{lC}
6\,\equiv\,\text{“esce un sei”} \\
S\,\equiv\,\text{“A dichiara che è uscito un sei”}
\end{array}$
Assegnamo le probabilità
$\displaystyle \begin{array}{lC}
p\left(6\,\middle|\,I\right)\,=\,\frac16 \qquad
p\left(\overline{6}\,\middle|\,I\right)\,=\,\frac56 \\
p\left(S\,\middle|\,6\land I\right)\,=\,\frac45 \qquad
p\left(S\,\middle|\,\overline{6}\land I\right)\,=\,\frac15
\end{array}$
Le prime due sono le assegnazioni classiche per un dado (a sei facce); la terza è perché $S$ è la verità se è vera $6$ mentre la quarta è perché $S$ è una menzonga se $6$ è falsa.
Siamo interessati alla probabilità che $6$ sia vera se $S$ è vera (attenzione: “vera”, non “la verità”) cioè se $A$ ha fatto quella dichiarazione, $p\left(6\,\middle|\,S\land I\right)$, che possiamo trovare con il Teorema di Bayes
$\displaystyle p\left(6\,\middle|\,S\land I\right)\,=\,\frac{p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)}{p\left(S\,\middle|\,I\right)}$
L’unico ingrediente che ci manca è $p\left(S\,\middle|\,I\right)$.
Facciamo un piccolo esercizio di algebra booleana
$S\,=\,S\land\left(6\lor\overline{6}\right)\,=\,\left(S\land 6\right)\lor\left(S\land\overline{6}\right)$
Le due proposizioni $S\land 6$ e $S\land\overline{6}$ sono mutualmente esclusive per cui possiamo scrivere
$p\left(S\,\middle|\,I\right)\,=\,p\left(\left(S\land 6\right)\lor\left(S\land\overline{6}\right)\,\middle|\,I\right)\,=\,p\left(S\land 6\,\middle|\,I\right)\,+\,p\left(S\land\overline{6}\,\middle|\,I\right)\,=\,p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)\,+\,p\left(\overline{6}\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,\overline{6}\land I\right)$
l’ultimo passaggio è in base alla regola del prodotto.
Sostituiamo nel Teorema di Bayes
$\displaystyle p\left(6\,\middle|\,S\land I\right)\,=\,\frac{p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)}{ p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)\,+\,p\left(\overline{6}\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,\overline{6}\land I\right)}\,=\,\frac{\frac16\,\times\,\frac45}{\frac16\,\times\,\frac45\,+\,\frac56\,\times\,\frac15}\,=\,\frac49$

A speaks the truth 4 out of 5 times. $\Rightarrow$ "A" dice la verità quattro volte su cinque.
A die is tossed. $\Rightarrow$ Viene lanciato un dado.
A reports that it is a 6. $\Rightarrow$ "A" dichiara che è uscito un sei
Abbiamo due proposizioni
$\displaystyle \begin{array}{lC}
6\,\equiv\,\text{“esce un sei”} \\
S\,\equiv\,\text{“A dichiara che è uscito un sei”}
\end{array}$
Assegnamo le probabilità
$\displaystyle \begin{array}{lC}
p\left(6\,\middle|\,I\right)\,=\,\frac16 \qquad
p\left(\overline{6}\,\middle|\,I\right)\,=\,\frac56 \\
p\left(S\,\middle|\,6\land I\right)\,=\,\frac45 \qquad
p\left(S\,\middle|\,\overline{6}\land I\right)\,=\,\frac15
\end{array}$
Le prime due sono le assegnazioni classiche per un dado (a sei facce); la terza è perché $S$ è la verità se è vera $6$ mentre la quarta è perché $S$ è una menzonga se $6$ è falsa.
Siamo interessati alla probabilità che $6$ sia vera se $S$ è vera (attenzione: “vera”, non “la verità”) cioè se $A$ ha fatto quella dichiarazione, $p\left(6\,\middle|\,S\land I\right)$, che possiamo trovare con il Teorema di Bayes
$\displaystyle p\left(6\,\middle|\,S\land I\right)\,=\,\frac{p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)}{p\left(S\,\middle|\,I\right)}$
L’unico ingrediente che ci manca è $p\left(S\,\middle|\,I\right)$.
Facciamo un piccolo esercizio di algebra booleana
$S\,=\,S\land\left(6\lor\overline{6}\right)\,=\,\left(S\land 6\right)\lor\left(S\land\overline{6}\right)$
Le due proposizioni $S\land 6$ e $S\land\overline{6}$ sono mutualmente esclusive per cui possiamo scrivere
$p\left(S\,\middle|\,I\right)\,=\,p\left(\left(S\land 6\right)\lor\left(S\land\overline{6}\right)\,\middle|\,I\right)\,=\,p\left(S\land 6\,\middle|\,I\right)\,+\,p\left(S\land\overline{6}\,\middle|\,I\right)\,=\,p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)\,+\,p\left(\overline{6}\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,\overline{6}\land I\right)$
l’ultimo passaggio è in base alla regola del prodotto.
Sostituiamo nel Teorema di Bayes
$\displaystyle p\left(6\,\middle|\,S\land I\right)\,=\,\frac{p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)}{ p\left(6\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,6\land I\right)\,+\,p\left(\overline{6}\,\middle|\,I\right)\,\times\,p\left(S\,\middle|\,\overline{6}\land I\right)}\,=\,\frac{\frac16\,\times\,\frac45}{\frac16\,\times\,\frac45\,+\,\frac56\,\times\,\frac15}\,=\,\frac49$

il panurgo
Principio di Relatività: $\mathbb{m} \not \to \mathbb{M} \, \Longleftrightarrow \, \mathbb{M} \not \to \mathbb{m}$
"Se la montagna non va a Maometto, Maometto NON va alla montagna"
Principio di Relatività: $\mathbb{m} \not \to \mathbb{M} \, \Longleftrightarrow \, \mathbb{M} \not \to \mathbb{m}$
"Se la montagna non va a Maometto, Maometto NON va alla montagna"
-
- Supervisore del sito
- Messaggi: 1828
- Iscritto il: ven mag 20, 2005 9:51 pm
- Località: Sestri Levante
- Contatta:
Re: Bugie, verità e Bayes
Grazie Panurgo per la risposta dettagliata e veloce.
Sono un principiante di Bayes e ti spiego il mio dubbio (uso una notazione da principianti).
Dobbiamo calcolare la probabilità dell'ipotesi: "E' uscito 6" avendo l'informazione aggiuntiva che "A ha detto che è uscito 6".
Secondo me, quando non esce il 6, A, quando mente, può dichiarare qualunque dei 5 numeri escluso quello uscito. Quindi dichiarerà "E' uscito il 6" 1/5 delle volte.
Quindi il calcolo a me viene così:
$\Large P(\text{esce 6} \mid \text{dice "6"})=\frac{P(\text{esce 6} \text{ AND } \text{dice "6"})}{P(\text{dice "6")}}=\frac{\frac{1}{6} \cdot \frac{4}{5}}{\frac{1}{6} \cdot \frac{4}{5}+\frac{5}{6} \cdot \frac{1}{5}\cdot \frac{1}{5}}=\frac{4}{5}$
La mia soluzione differisce dalla tua solo per quel fattore 1/5.
Non capisco dove e perché sbaglio.
Comunque devo ancora studiare la tua notazione per capire meglio la tua soluzione.
Probabilmente c'è una diversa interpretazione della domanda o del testo.
P.S. Dovrei vergognarmi a dirlo pubblicamente, ma non ho neanche capito dov'è l'errore (matematicamente sostanziale) nella mia (libera) traduzione.
Sono un principiante di Bayes e ti spiego il mio dubbio (uso una notazione da principianti).
Dobbiamo calcolare la probabilità dell'ipotesi: "E' uscito 6" avendo l'informazione aggiuntiva che "A ha detto che è uscito 6".
Secondo me, quando non esce il 6, A, quando mente, può dichiarare qualunque dei 5 numeri escluso quello uscito. Quindi dichiarerà "E' uscito il 6" 1/5 delle volte.
Quindi il calcolo a me viene così:
$\Large P(\text{esce 6} \mid \text{dice "6"})=\frac{P(\text{esce 6} \text{ AND } \text{dice "6"})}{P(\text{dice "6")}}=\frac{\frac{1}{6} \cdot \frac{4}{5}}{\frac{1}{6} \cdot \frac{4}{5}+\frac{5}{6} \cdot \frac{1}{5}\cdot \frac{1}{5}}=\frac{4}{5}$
La mia soluzione differisce dalla tua solo per quel fattore 1/5.
Non capisco dove e perché sbaglio.
Comunque devo ancora studiare la tua notazione per capire meglio la tua soluzione.
Probabilmente c'è una diversa interpretazione della domanda o del testo.
P.S. Dovrei vergognarmi a dirlo pubblicamente, ma non ho neanche capito dov'è l'errore (matematicamente sostanziale) nella mia (libera) traduzione.
Pace e bene a tutti.
Gianfranco
Gianfranco
Re: Bugie, verità e Bayes
Scusa Gianfranco, non è matematicamente sostanziale ma mi era sembrato così in principio e, avendo io elaborato questa cosa durante la pausa pranzo, non ho fatto in tempo a riflettere.
Viceversa, quando non è uscito il 6 la menzogna è "è uscito il 6", e A mente 1 volta su 5 senza alcuna relazione con il risultato del dado.
P.S. la mattina dopo
Mi spiego meglio: il fatto che A avrebbe potuto mentire in cinque modi diversi è irrilevante perché se egli ha effettivamente mentito (prob. = 1/5) lo ha fatto dicendo "è uscito il sei" e la probabilità che egli abbia mentito dicendo "è uscito il sei" è 1: formalmente, $p\left(S\,\middle|\,S\land I\right)\,=\,1$.
P.P.S. anche in riferimento all'altro post sul Teorema di Bayes io ti consiglio caldamente la lettura di un bellissimo libro, Edwin T. Jaynes, Probability Theory. The Logic of Science, Cambridge University Press. Costicchia, ma ne vale la pena.
Viceversa, quando non è uscito il 6 la menzogna è "è uscito il 6", e A mente 1 volta su 5 senza alcuna relazione con il risultato del dado.
P.S. la mattina dopo
Mi spiego meglio: il fatto che A avrebbe potuto mentire in cinque modi diversi è irrilevante perché se egli ha effettivamente mentito (prob. = 1/5) lo ha fatto dicendo "è uscito il sei" e la probabilità che egli abbia mentito dicendo "è uscito il sei" è 1: formalmente, $p\left(S\,\middle|\,S\land I\right)\,=\,1$.
P.P.S. anche in riferimento all'altro post sul Teorema di Bayes io ti consiglio caldamente la lettura di un bellissimo libro, Edwin T. Jaynes, Probability Theory. The Logic of Science, Cambridge University Press. Costicchia, ma ne vale la pena.
il panurgo
Principio di Relatività: $\mathbb{m} \not \to \mathbb{M} \, \Longleftrightarrow \, \mathbb{M} \not \to \mathbb{m}$
"Se la montagna non va a Maometto, Maometto NON va alla montagna"
Principio di Relatività: $\mathbb{m} \not \to \mathbb{M} \, \Longleftrightarrow \, \mathbb{M} \not \to \mathbb{m}$
"Se la montagna non va a Maometto, Maometto NON va alla montagna"
-
- Supervisore del sito
- Messaggi: 1828
- Iscritto il: ven mag 20, 2005 9:51 pm
- Località: Sestri Levante
- Contatta:
Re: Bugie, verità e Bayes
Ciao Panurgo, credo di aver capito in cosa sono diverse le nostre interpretazioni. Spero che siano entrambe accettabili, portando a risultati diversi.
Hai scritto:
Questo è il grafo.
Rozzamente, dal grafo risulta:
$\Large P(\text{esce 6} \mid \text{dice "6"})=\frac{P(\text{esce 6} \text{ AND } \text{dice "6"})}{P(\text{dice "6")}}=\frac{\frac{4}{30}}{\frac{4}{30} +\frac{5}{150}}=\frac{4}{5}$
Comunque rifletterò ancora.
Grazie per il suggerimento bibliografico!
Hai scritto:
Secondo me, invece, quando NON esce il 6 ed egli mente, ha 5 possibilità equiprobabili fra le quali c'è sicuramente il 6....se egli ha effettivamente mentito (prob. = 1/5) lo ha fatto dicendo "è uscito il sei"...
Questo è il grafo.
Rozzamente, dal grafo risulta:
$\Large P(\text{esce 6} \mid \text{dice "6"})=\frac{P(\text{esce 6} \text{ AND } \text{dice "6"})}{P(\text{dice "6")}}=\frac{\frac{4}{30}}{\frac{4}{30} +\frac{5}{150}}=\frac{4}{5}$
Comunque rifletterò ancora.
Grazie per il suggerimento bibliografico!
Pace e bene a tutti.
Gianfranco
Gianfranco
Re: Bugie, verità e Bayes
Non è una questione di interpretazioni: tutti i rami in cui A non dice "esce 6" non ci sono perché A ha detto "esce sei". La probabilità di "esce 6" è $1$. La probabilità di "esce 5", "esce 4", "esce 3", "esce 2", e "esce 1" è $0$.
il panurgo
Principio di Relatività: $\mathbb{m} \not \to \mathbb{M} \, \Longleftrightarrow \, \mathbb{M} \not \to \mathbb{m}$
"Se la montagna non va a Maometto, Maometto NON va alla montagna"
Principio di Relatività: $\mathbb{m} \not \to \mathbb{M} \, \Longleftrightarrow \, \mathbb{M} \not \to \mathbb{m}$
"Se la montagna non va a Maometto, Maometto NON va alla montagna"
-
- Supervisore del sito
- Messaggi: 1828
- Iscritto il: ven mag 20, 2005 9:51 pm
- Località: Sestri Levante
- Contatta:
Re: Bugie, verità e Bayes
Ciao Panurgo, ti ringrazio di cuore per le spiegazioni e per il tempo che hai dedicato a questa mia domanda.
Se mi rimangono ancora dei dubbi, a questo punto è a causa della mia ottusità. Studierò ancora.
Se mi rimangono ancora dei dubbi, a questo punto è a causa della mia ottusità. Studierò ancora.
Pace e bene a tutti.
Gianfranco
Gianfranco
Re: Bugie, verità e Bayes
Ciao,
io credo che se Baldo dice la verità 4 volte su 5 ed afferma che è uscito un 6,
allora 4 volte su 5 sarà realmente uscito un 6.
Se la probabilità che fosse uscito un un 6 fosse di 4/9, significherebbe che Baldo dice la verità meno di 4 volte su 5.
Diego
io credo che se Baldo dice la verità 4 volte su 5 ed afferma che è uscito un 6,
allora 4 volte su 5 sarà realmente uscito un 6.
Se la probabilità che fosse uscito un un 6 fosse di 4/9, significherebbe che Baldo dice la verità meno di 4 volte su 5.
Diego
Re: Bugie, verità e Bayes
Bayes e tutti i problemi e le conseguenze correlate, sono la delizia, ma soprattutto la croce, per chi cerca di insegnare anche solo i rudimenti della statistica applicata alla medicina agli studenti e agli specializzandi.
E anche parlando con colleghi esperti e competenti, che conosco e ammiro da decenni, mi capita spesso (troppo spesso) di incontrare sacche di "ignoranza" che sono dure a morire.
In medicina, il tipo di problema che si deve spesso affrontare, è quello di interpretare il risultato di un test; magari uno screening per identificare tumori e altre patologie.
Ogni test ha due coefficienti: specificità e sensibilità. Con il primo termine si intende la percentuale dei casi che risultano positivi al test e che sono realmente affetti dalla patologia. Più alto è questo numero, minore è la percentuale di "falsi positivi".
La sensibilità, invece, esprime la percentuale dei casi realmente affetti che risultano positivi all'esame. Più alto è questo parametro, minore sarà il numero di "falsi negativi".
Purtroppo, i due parametri sono, in un certo senso, mutualmente escludenti. Se pretendiamo di massimizzarne uno, dobbiamo cedere qualcosa nel secondo. Un certo numero di falsi positivi e di falsi negativi sono ineliminabili.
Oggi, esistono molti test ed esami, che esibiscono valori di sensibilità e specificità apparentemente ottimi e rassicuranti: 90-95-98 %
Ma è giusto sentirsi rassicurati?
L'esempio classico che faccio ai giovani colleghi specializzandi è qualcosa del tipo:
Un certo test per identificare l'infezione da HIV ha una sensibilità del 99,5 % e una specificità del 98%.
Un paziente riceve un test positivo; qual è la probabilità che sia affetto dal morbo?
Messa in questi termini, la domanda...non ha risposta. Proprio perché (Bayes insegna), non conosciamo la probabilità a priori; ovvero, in termini clinici, non sappiamo a quale categoria di rischio appartenga il paziente.
Facciamo due esempi, estremi.
A: il paziente è un omosessuale cinquantenne tossicodipendente promiscuo, che vive in Sudafrica
B: una suora di clausura ottantenne che vive da oltre mezzo secolo in un convento abruzzese.
Senza cadere nel pecoreccio e nel cattivo gusto, possiamo prendere per ragionevole una stima di rischio "a priori" del 40% nel primo caso e dello 0,1% nel secondo.
Facciamo un paio di conti.
Su mille omosessuali, ce ne sono 400 che sono affetti; solo in 2 di questi (lo 0,5%) non verrà scoperto; per contro, dei seicento "sani", il 2%, cioè 12, risulterà erroneamente malato.
In totale vedremo 298+12=410 test positivi, per cui la probabilità che il paziente positivo sia davvero malato è 398/410, cioè oltre il 97%.
Passando alle suorine, abbiamo una sola persona realmente malata, che sarà identificata come positiva nel 99,5% dei casi; diciamo per semplicità che viene scoperta. Delle altre 999, ben 20 risulteranno invece falsamente positive.
Ricevere un referto positivo, significa ben poco: 20 volte su 21, si tratta di un errore di laboratorio.
Morale? Ogni test ha senso ed è utile se e solo se sappiamo a chi viene rivolto.
E' uno (non il solo) motivo per cui certi test di screening non vengo proposti "a tutti", ma solo a sottogruppi di popolazione. La mammografia, secondo gli epidemiologi più accorti, non dovrebbe essere proposta prima dei 45 anni (secondo alcuni, anche 50); e così la colonscopia per il tumore al colon, eccetera...
Spesso si sente dire che queste scelte sono stupide, sbagliate, che tengono conto solo dei costi... Non è così. Un eccessivo numero di falsi positivi, oltre ad essere un costo, espone un alto numero di persone a stress, esami anche invasivi e potenzialmente rischiosi, con un limitato aumento di casi identificati. Inoltre, e questo raramente viene preso in considerazione, c'è il problema della expertise e della possibile demotivazione del personale impiegato. Nessuno si augura di fare continuamente diagnosi di cancro, ma oggettivamente il problema esiste. Il radiologo che legge le mammografie, o l'endoscopista che fa la colonscopia, deve poter "contare" su un certo numero di casi positivi ogni mese, per mantenere la competenza e la bravura per identificare le lesioni anche più piccole e difficili. Nessuno può diventare mammografista esperto, vedendo un caso ogni 6-10-12 mesi.
Tornando al caso delle monache, per una popolazione a rischio così basso, sarebbe più conveniente un esame che fosse meno sensibile, ma molto più specifico.
Immaginiamo un test con solo l'80% di sensibilità, ma il 99,9% di specificità.
La suorina malata verrebbe, molto probabilmente, scoperta lo stesso, ma solo un'altra risulterà falsamente positiva. Cosicché, a posteriori, il test positivo sarà corretto nel 50%.
Un simile esame sarebbe molto meno ragionevole proporlo alla popolazione ad altissimo rischio; nel caso A, avremmo al massimo un falso positivo (forse nessuno; e sarebbe un ottimo risultato); ma 80 malati sfuggirebbero all'identificazione.
E anche parlando con colleghi esperti e competenti, che conosco e ammiro da decenni, mi capita spesso (troppo spesso) di incontrare sacche di "ignoranza" che sono dure a morire.
In medicina, il tipo di problema che si deve spesso affrontare, è quello di interpretare il risultato di un test; magari uno screening per identificare tumori e altre patologie.
Ogni test ha due coefficienti: specificità e sensibilità. Con il primo termine si intende la percentuale dei casi che risultano positivi al test e che sono realmente affetti dalla patologia. Più alto è questo numero, minore è la percentuale di "falsi positivi".
La sensibilità, invece, esprime la percentuale dei casi realmente affetti che risultano positivi all'esame. Più alto è questo parametro, minore sarà il numero di "falsi negativi".
Purtroppo, i due parametri sono, in un certo senso, mutualmente escludenti. Se pretendiamo di massimizzarne uno, dobbiamo cedere qualcosa nel secondo. Un certo numero di falsi positivi e di falsi negativi sono ineliminabili.
Oggi, esistono molti test ed esami, che esibiscono valori di sensibilità e specificità apparentemente ottimi e rassicuranti: 90-95-98 %
Ma è giusto sentirsi rassicurati?
L'esempio classico che faccio ai giovani colleghi specializzandi è qualcosa del tipo:
Un certo test per identificare l'infezione da HIV ha una sensibilità del 99,5 % e una specificità del 98%.
Un paziente riceve un test positivo; qual è la probabilità che sia affetto dal morbo?
Messa in questi termini, la domanda...non ha risposta. Proprio perché (Bayes insegna), non conosciamo la probabilità a priori; ovvero, in termini clinici, non sappiamo a quale categoria di rischio appartenga il paziente.
Facciamo due esempi, estremi.
A: il paziente è un omosessuale cinquantenne tossicodipendente promiscuo, che vive in Sudafrica
B: una suora di clausura ottantenne che vive da oltre mezzo secolo in un convento abruzzese.
Senza cadere nel pecoreccio e nel cattivo gusto, possiamo prendere per ragionevole una stima di rischio "a priori" del 40% nel primo caso e dello 0,1% nel secondo.
Facciamo un paio di conti.
Su mille omosessuali, ce ne sono 400 che sono affetti; solo in 2 di questi (lo 0,5%) non verrà scoperto; per contro, dei seicento "sani", il 2%, cioè 12, risulterà erroneamente malato.
In totale vedremo 298+12=410 test positivi, per cui la probabilità che il paziente positivo sia davvero malato è 398/410, cioè oltre il 97%.
Passando alle suorine, abbiamo una sola persona realmente malata, che sarà identificata come positiva nel 99,5% dei casi; diciamo per semplicità che viene scoperta. Delle altre 999, ben 20 risulteranno invece falsamente positive.
Ricevere un referto positivo, significa ben poco: 20 volte su 21, si tratta di un errore di laboratorio.
Morale? Ogni test ha senso ed è utile se e solo se sappiamo a chi viene rivolto.
E' uno (non il solo) motivo per cui certi test di screening non vengo proposti "a tutti", ma solo a sottogruppi di popolazione. La mammografia, secondo gli epidemiologi più accorti, non dovrebbe essere proposta prima dei 45 anni (secondo alcuni, anche 50); e così la colonscopia per il tumore al colon, eccetera...
Spesso si sente dire che queste scelte sono stupide, sbagliate, che tengono conto solo dei costi... Non è così. Un eccessivo numero di falsi positivi, oltre ad essere un costo, espone un alto numero di persone a stress, esami anche invasivi e potenzialmente rischiosi, con un limitato aumento di casi identificati. Inoltre, e questo raramente viene preso in considerazione, c'è il problema della expertise e della possibile demotivazione del personale impiegato. Nessuno si augura di fare continuamente diagnosi di cancro, ma oggettivamente il problema esiste. Il radiologo che legge le mammografie, o l'endoscopista che fa la colonscopia, deve poter "contare" su un certo numero di casi positivi ogni mese, per mantenere la competenza e la bravura per identificare le lesioni anche più piccole e difficili. Nessuno può diventare mammografista esperto, vedendo un caso ogni 6-10-12 mesi.
Tornando al caso delle monache, per una popolazione a rischio così basso, sarebbe più conveniente un esame che fosse meno sensibile, ma molto più specifico.
Immaginiamo un test con solo l'80% di sensibilità, ma il 99,9% di specificità.
La suorina malata verrebbe, molto probabilmente, scoperta lo stesso, ma solo un'altra risulterà falsamente positiva. Cosicché, a posteriori, il test positivo sarà corretto nel 50%.
Un simile esame sarebbe molto meno ragionevole proporlo alla popolazione ad altissimo rischio; nel caso A, avremmo al massimo un falso positivo (forse nessuno; e sarebbe un ottimo risultato); ma 80 malati sfuggirebbero all'identificazione.
Enrico
-
- Livello 4
- Messaggi: 154
- Iscritto il: mar apr 16, 2013 11:44 pm
Re: Bugie, verità e Bayes
Bravo Diego. Non conosci ancora il calcolo delle prob., non sai niente del Teorema di Bayes, ma hai buon senso e hai detto il giusto. Se si ripete milioni di volte il processo - si lancia un dado, Baldo dice che è venuto un certo numero- quante volte B. ha detto la verità? Ogni volta si può ripetere il ragionamento del Panurgo, e dimostrare che se Baldo dice la verità 4 volte su 5 vuol dire che la dice 4 volte su 9.... Vedi come è facile per un esperto (e Panurgo certamente lo è) sostenere matematicamente cose che non stanno in piedi...
Traduco in termini più semplici la "dimostrazione" di Panurgo.
Lanci un dado. La prob. che venga 6 è 1/6. La prob. che venga un altro numero è 5/6
B. dice che è un 6. La prob. che B. dica la verità (e quindi sia davvero un 6) è 4/5, La prob. che menta e quindi che sia un altro numero è 1/5.
La prob. composta che sia un 6 e B. abbia detto il vero allora è 1/6*4/5=4/30.
La prob. composta che non sia un 6 e B. abbia detto il falso è 5/6*1/5=5/30.
La somma di queste due prob. composte è 9/30; ma siccome o è l'una o è l'altra, si moltiplica ciascuna delle due per l'inverso del totale, cioè per 30/9, ottenendo:
Prob. che sia un 6 e B. abbia detto i vero: 4/9
Prob. che non sia un 6 e B. abbia detto il falso: 5/9.
Bella dimostrazione! Peccato solo che sia sballata.
Dani
Traduco in termini più semplici la "dimostrazione" di Panurgo.
Lanci un dado. La prob. che venga 6 è 1/6. La prob. che venga un altro numero è 5/6
B. dice che è un 6. La prob. che B. dica la verità (e quindi sia davvero un 6) è 4/5, La prob. che menta e quindi che sia un altro numero è 1/5.
La prob. composta che sia un 6 e B. abbia detto il vero allora è 1/6*4/5=4/30.
La prob. composta che non sia un 6 e B. abbia detto il falso è 5/6*1/5=5/30.
La somma di queste due prob. composte è 9/30; ma siccome o è l'una o è l'altra, si moltiplica ciascuna delle due per l'inverso del totale, cioè per 30/9, ottenendo:
Prob. che sia un 6 e B. abbia detto i vero: 4/9
Prob. che non sia un 6 e B. abbia detto il falso: 5/9.
Bella dimostrazione! Peccato solo che sia sballata.
Dani
-
- Supervisore del sito
- Messaggi: 1828
- Iscritto il: ven mag 20, 2005 9:51 pm
- Località: Sestri Levante
- Contatta:
Re: Bugie, verità e Bayes
Enrico,
ti ringrazio per la tua spiegazione.
Risponde precisamente proprio a una domanda che volevo farti.
Sto preparando una serie di esercizi ricreativi sulla regola di Bayes, fra i quali ce n'è uno sulla macchina della verità che introduce ai test diagnostici.
Ho pubblicato la pagina sul sito oggi.
Mi autorizzi a inserire il tuo post come commento finale a questo esercizio?
Diego e Dani,
vi propongo il problema del mentitore con un dato cambiato:
---
Baldo dice la verità 3 volte su 5.
Baldo lancia un dado e afferma che è uscito il 6.
Qual è la probabilità che sia davvero uscito un 6 | dato il fatto che Baldo ha detto "6"?
---
ti ringrazio per la tua spiegazione.
Risponde precisamente proprio a una domanda che volevo farti.
Sto preparando una serie di esercizi ricreativi sulla regola di Bayes, fra i quali ce n'è uno sulla macchina della verità che introduce ai test diagnostici.
Ho pubblicato la pagina sul sito oggi.
Mi autorizzi a inserire il tuo post come commento finale a questo esercizio?
Diego e Dani,
vi propongo il problema del mentitore con un dato cambiato:
---
Baldo dice la verità 3 volte su 5.
Baldo lancia un dado e afferma che è uscito il 6.
Qual è la probabilità che sia davvero uscito un 6 | dato il fatto che Baldo ha detto "6"?
---
Pace e bene a tutti.
Gianfranco
Gianfranco
-
- Livello 4
- Messaggi: 154
- Iscritto il: mar apr 16, 2013 11:44 pm
Re: Bugie, verità e Bayes
5/5.
Prova ora con questo:
Premessa: ci sono circa 38 milioni di auto in Italia, ovviamente ciascuna con targa diversa. Baldo possiede un'auto.
1- Baldo dice che il numero di targa della sua auto è AN763MW
2- Baldo dice la verità 9 volte su 10.
Quale è la prob. che la targa dell'auto di Balbo sia effettivamente AN763MW?
Dani
Prova ora con questo:
Premessa: ci sono circa 38 milioni di auto in Italia, ovviamente ciascuna con targa diversa. Baldo possiede un'auto.
1- Baldo dice che il numero di targa della sua auto è AN763MW
2- Baldo dice la verità 9 volte su 10.
Quale è la prob. che la targa dell'auto di Balbo sia effettivamente AN763MW?
Dani
-
- Livello 4
- Messaggi: 154
- Iscritto il: mar apr 16, 2013 11:44 pm
Re: Bugie, verità e Bayes
Uffa, errore di tasto: 3/5
Dani
Dani
-
- Supervisore del sito
- Messaggi: 1828
- Iscritto il: ven mag 20, 2005 9:51 pm
- Località: Sestri Levante
- Contatta:
Re: Bugie, verità e Bayes
Grazie Enrico e Dani,
sono in partenza e torno domani sera, rimando tutti gli aggiornamenti a lunedì.
Buon fine settimana ovvero week end.
sono in partenza e torno domani sera, rimando tutti gli aggiornamenti a lunedì.
Buon fine settimana ovvero week end.
Pace e bene a tutti.
Gianfranco
Gianfranco