Questioni di probabilità...

Il forum di Base5, dove è possibile postare problemi, quiz, indovinelli, rompicapo, enigmi e quant'altro riguardi la matematica ricreativa e oltre.

Moderatori: Gianfranco, Bruno

Admin
Amministratore del sito
Amministratore del sito
Messaggi: 870
Iscritto il: mer apr 20, 2005 3:47 pm
Località: Benevento

Messaggio da Admin »

Come promesso, ritorno sulla questione.

Non ho avuto tempo per fare una analisi decente del problema;
tuttavia ho ricavato una stima, basandomi sulla pagina javascript sulla distribuzione gaussiana di numeri, inserita da Gianfranco (http://utenti.quipo.it/base5/probabil/g ... erator.htm);

ecco le mie considerazioni:

concordo con panurgo che il caso più interessante si abbia se consideriamo anche persone di sesso diverso;

pertanto potremmo ridefinire il problema come segue:

"Due persone nate e residenti in Italia, si incontrano;
è più probabile che le due persone siano nate lo stesso giorno dello stesso mese,
oppure che abbiano lo stesso nome?
"

Volendo rendere il quesito puramente matematico la cosa potrebbe essere vista così:

"Supponiamo di avere un'urna gigantesca che contenga i dati anagrafici di ciascuna persona nata e residente in Italia, scritti su bigliettini diversi.
E' più probabile pescare dall'urna 2 biglietti relativi a persone con la stessa data di nascita o a persone con lo stesso nome?
"

il dato mancante per rispondere al problema è sempre la distribuzione di probabilità dei nomi sul territorio italiano;

a tal proposito, ho effettuato una stima supponendo gaussiana tale distribuzione (si dovrebbe verificare empiricamente se l'ipotesi di gaussianitò può essere accettata e con che fattore di rischio);
in particolare ho considerato gaussiane allo stesso modo le distribuzioni dei nomi maschili e femminili;

utilizzando lo javascript messo a disposizione da Gianfranco ho ricavato un elenco di numeri (che fanno le veci dei nomi) che hanno una distribuzione gaussiana;
dopo di chè ho utilizzato il seguente javascript per ricavare la probabilità di scegliere 2 numeri (i nostri nomi) uguali;
tale probabilità ci è data da:

$\frac{\text{casi favorevoli}}{\text{casi totali}}=\frac{\text{N^{\circle} coppie con numeri uguali}}{\text{N^{\circle} coppie totali}}$

ecco lo javascript:

[html]





Dati
Risultato


Inserire elenco di numeri:

Probabilità di scegliere
2 numeri uguali:


















[/html]

però per ricavare l'elenco con lo javascript di Gianfranco c'è bisogno di inserire media e varianza;
in particolare la varianza è importante;
la varianza indica la dispersione dei valori intorno alla media e quindi più è bassa e più si hanno valori vicini alla media, e quindi uguali o vicini tra loro.
il caso con varianza 1 è un caso estremo; la distribuzione dei nomi, se gaussiana, non può avere varianza 1;
quanto deve valere questa varianza?
non ho idea di come stimare questa varianza (escludendo elenco telefonico e simili: peraltro non sono riuscito a trovare un elenco telefonico nazionale online che mostri una lista di tutti i numeri; avete qualche link?) per cui ho calcolato le probabilità per alcuni valori della varianza:

1)
se i nomi hanno una distribuzione gaussiana con varianza 100, preso un campione di 1000 nomi, gaussiano, la probabilità di avere 2 nomi uguali è pari a:

$P_g\approx 2,79\, %$

(ho fatto varie prove con lo javascript di cui sopra)

2)
se i nomi hanno una distribuzione gaussiana con varianza 500, preso un campione di 1000 nomi, gaussiano, la probabilità di avere 2 nomi uguali è pari a:

$P_g\approx 1,27\, %$

3)
se i nomi hanno una distribuzione gaussiana con varianza 1000, preso un campione di 1000 nomi, gaussiano, la probabilità di avere 2 nomi uguali è pari a:

$P_g\approx 0,9\, %$

Però, come ho già scritto nel post precedente se consideriamo che le due persone possano avere sessi diversi, allora la probabilità che una persona A abbia lo stesso nome di un'altra B, $P_u$ è uguale a:

$P_u = P_g \cdot P_d$

dove $P_g$ = probabilità che B abbia lo stesso nome di A nel caso in cui A e B siano dello stesso sesso;ossia la probabilità che abbiamo calcolato poco sopra con lo javascript;
$P_d$ = probabilità che B sia dello stesso sesso di A;

In particolare considerando che il rapporto tra maschi e femmine in Italia è di circa 5 a 1, ossia approssimativamente $83\,%$ a $17\,%$, la probabilità che due persone italiane siano dello stesso sesso ci è data dal rapporto
$\frac{\text{coppie formate da persone dello stesso sesso}}{\text{coppie totali}}$
ossia, indicando con $x$ il numero di abitanti in Italia:

$P_d=\frac{\frac{\frac{17}{100}x\cdot(\frac{17}{100}x-1)}{2}+\frac{\frac{83}{100}x\cdot(\frac{83}{100}x-1)}{2}}{\frac{x\cdot\(x-1)}{2}}=\frac{7178x-10000}{10000\cdot (x-1)}$

essendo il numero di abitanti (ossia x) abbastanza alto possiamo considerare il limite del rapporto per x tendente ad infinito:

$\lim_{x\to\infty}\frac{7178x-10000}{10000\cdot(x-1)}=\frac{7178}{10000}=0,7178$

quindi la probabilità che 2 persone... possano avere lo stesso nome diventa:

1) varianza=100

$P_u = P_g \cdot P_d \approx0,0279\cdot 0,7178 \approx 2\,%$

2) varianza=500

$P_u = P_g \cdot P_d \approx0,0127\cdot 0,7178 \approx 0,92%$

3) varianza=1000

$P_u = P_g \cdot P_d \approx0,009\cdot 0,7178 \approx 0,64%$

Dunque, sembrerebbe che sia più probabile avere nomi uguali...

Purtroppo non è granchè come analisi;
aspetto opinioni e approfondimenti...

Il tutto SE&O.

Admin
Pietro Vitelli (Amministratore del Forum)
"Un matematico è una macchina che converte caffè in teoremi" Paul Erdös
www.pvitelli.net

Rispondi