franco ha scritto: ↑mar mar 11, 2025 11:24 am
Guardando il tuo grafico risulterebbe che avendo estratto cinquanta biglie rosse da un sacco a caso sia quasi sicuro di estrarre rossa anche la cinquantunesima.
A me sembra controintuitivo
Carissimo, la tua intuizione funziona bene all'inizio quando le informazioni in tuo possesso sono solo che ci sono $2025$ diverse possibilità e quindi assegni più o meno consciamente una distribuzione unforme sul numero di palline rosse contenute nell'urna da te scelta.
Immaginiamo che le urne siano tutte contenute in un'urnona gigante: scegliere un'urna e pescare una pallina equivale a pescare una pallina in una certa posizione all'interno dell'urnona gigante quindi possiamo smaterializzare le $2025$ urne e lasciare le palline lì, $2049300$ palline rosse e $2051325$ palline blu, con probabilità di estrarre una pallina rossa pari a $2049300/(2049300+2051325)=1012/2025$.
Nel momento in cui noi estraiamo la pallina rossa non possiamo più invocare il Principio di Indifferenza per assegnare la distribuzione sul numero di palline rosse contenute nell'urna perché è più probabile pescare una pallina rossa da un'urna con tante palline rosse piuttosto che da una con poche quindi l'estrazione di una pallina rossa rende più probabili le prime e meno le seconde.
Ti faccio un esempio, Supponiamo di aver estratto $1925$ palline rosse e ci prepariamo ad un'altra estrazione: davvero assegneresti pari probabilità al rosso e al blu? Restano $100$ urne (le altre hanno un numero di palline rosse inferiore a quelle già estratte) che contengono o $0$ palline rosse o $1$ o $2$ ecc. fino a $99$: se siamo con lo $0$ vorrebbe dire che per $1925$ volte abbiamo pescato una pallina rossa lasciando indietro ben $100$ palline blu.
La distribuzione di elezione per modellare un campionamento senza ripetizioni come il nostro è la brava vecchia Distribuzione Ipergeometrica
$\displaystyle\Pr\left(r,b\middle|R,B\right)=\frac{{{R}\choose{r}}{{B}\choose{b}}}{{{R+b}\choose{r+b}}}$
Nel nostro caso, numero di modi di pescare $1925$ palline rosse su $1925$ per numero di modi di pescare $0$ palline blu su $100$ diviso numero di modi di pescare $1925$ palline su $2025$
${\displaystyle\Pr\left(1925,0\middle|1925,100\right)=\frac{{{1925}\choose{1925}}{{100}\choose{0}}}{{{2025}\choose{1925}}}}=\frac1{3917982689252586220308018318245676611805417731205513408842877551004892307823253981787780342470913817059672577153751807936963134769312486039290311391593081369195802071852490}$
Ecco come, a furia di pescare palline rosse, il nostro modello ci porta ad assegnare probabilità sempre più alte alle urne con tante palline rosse.
La probabilità di estrarre $50$ rosse e $0$ blu dall'urna con una sola pallina blu è
${\displaystyle\Pr\left(50,0\middle|2024,1\right)=\frac{{{2024}\choose{50}}{{1}\choose{0}}}{{{2025}\choose{50}}}}=\frac{79}{81}$