Come promesso, ritorno sulla questione.
Non ho avuto tempo per fare una analisi decente del problema;
tuttavia ho ricavato una stima, basandomi sulla pagina javascript sulla distribuzione gaussiana di numeri, inserita da Gianfranco (http://utenti.quipo.it/base5/probabil/g ... erator.htm);
ecco le mie considerazioni:
concordo con panurgo che il caso più interessante si abbia se consideriamo anche persone di sesso diverso;
pertanto potremmo ridefinire il problema come segue:
"Due persone nate e residenti in Italia, si incontrano;
è più probabile che le due persone siano nate lo stesso giorno dello stesso mese,
oppure che abbiano lo stesso nome?"
Volendo rendere il quesito puramente matematico la cosa potrebbe essere vista così:
"Supponiamo di avere un'urna gigantesca che contenga i dati anagrafici di ciascuna persona nata e residente in Italia, scritti su bigliettini diversi.
E' più probabile pescare dall'urna 2 biglietti relativi a persone con la stessa data di nascita o a persone con lo stesso nome?"
il dato mancante per rispondere al problema è sempre la distribuzione di probabilità dei nomi sul territorio italiano;
a tal proposito, ho effettuato una stima supponendo gaussiana tale distribuzione (si dovrebbe verificare empiricamente se l'ipotesi di gaussianitò può essere accettata e con che fattore di rischio);
in particolare ho considerato gaussiane allo stesso modo le distribuzioni dei nomi maschili e femminili;
utilizzando lo javascript messo a disposizione da Gianfranco ho ricavato un elenco di numeri (che fanno le veci dei nomi) che hanno una distribuzione gaussiana;
dopo di chè ho utilizzato il seguente javascript per ricavare la probabilità di scegliere 2 numeri (i nostri nomi) uguali;
tale probabilità ci è data da:
$\frac{\text{casi favorevoli}}{\text{casi totali}}=\frac{\text{N^{\circle} coppie con numeri uguali}}{\text{N^{\circle} coppie totali}}$
ecco lo javascript:
[html]
Dati
Risultato
Inserire elenco di numeri:
Probabilità di scegliere
2 numeri uguali:
[/html]
però per ricavare l'elenco con lo javascript di Gianfranco c'è bisogno di inserire media e varianza;
in particolare la varianza è importante;
la varianza indica la dispersione dei valori intorno alla media e quindi più è bassa e più si hanno valori vicini alla media, e quindi uguali o vicini tra loro.
il caso con varianza 1 è un caso estremo; la distribuzione dei nomi, se gaussiana, non può avere varianza 1;
quanto deve valere questa varianza?
non ho idea di come stimare questa varianza (escludendo elenco telefonico e simili: peraltro non sono riuscito a trovare un elenco telefonico nazionale online che mostri una lista di tutti i numeri; avete qualche link?) per cui ho calcolato le probabilità per alcuni valori della varianza:
1)
se i nomi hanno una distribuzione gaussiana con varianza 100, preso un campione di 1000 nomi, gaussiano, la probabilità di avere 2 nomi uguali è pari a:
$P_g\approx 2,79\, %$
(ho fatto varie prove con lo javascript di cui sopra)
2)
se i nomi hanno una distribuzione gaussiana con varianza 500, preso un campione di 1000 nomi, gaussiano, la probabilità di avere 2 nomi uguali è pari a:
$P_g\approx 1,27\, %$
3)
se i nomi hanno una distribuzione gaussiana con varianza 1000, preso un campione di 1000 nomi, gaussiano, la probabilità di avere 2 nomi uguali è pari a:
$P_g\approx 0,9\, %$
Però, come ho già scritto nel post precedente se consideriamo che le due persone possano avere sessi diversi, allora la probabilità che una persona A abbia lo stesso nome di un'altra B, $P_u$ è uguale a:
$P_u = P_g \cdot P_d$
dove $P_g$ = probabilità che B abbia lo stesso nome di A nel caso in cui A e B siano dello stesso sesso;ossia la probabilità che abbiamo calcolato poco sopra con lo javascript;
$P_d$ = probabilità che B sia dello stesso sesso di A;
In particolare considerando che il rapporto tra maschi e femmine in Italia è di circa 5 a 1, ossia approssimativamente $83\,%$ a $17\,%$, la probabilità che due persone italiane siano dello stesso sesso ci è data dal rapporto
$\frac{\text{coppie formate da persone dello stesso sesso}}{\text{coppie totali}}$
ossia, indicando con $x$ il numero di abitanti in Italia:
$P_d=\frac{\frac{\frac{17}{100}x\cdot(\frac{17}{100}x-1)}{2}+\frac{\frac{83}{100}x\cdot(\frac{83}{100}x-1)}{2}}{\frac{x\cdot\(x-1)}{2}}=\frac{7178x-10000}{10000\cdot (x-1)}$
essendo il numero di abitanti (ossia x) abbastanza alto possiamo considerare il limite del rapporto per x tendente ad infinito:
$\lim_{x\to\infty}\frac{7178x-10000}{10000\cdot(x-1)}=\frac{7178}{10000}=0,7178$
quindi la probabilità che 2 persone... possano avere lo stesso nome diventa:
1) varianza=100
$P_u = P_g \cdot P_d \approx0,0279\cdot 0,7178 \approx 2\,%$
2) varianza=500
$P_u = P_g \cdot P_d \approx0,0127\cdot 0,7178 \approx 0,92%$
3) varianza=1000
$P_u = P_g \cdot P_d \approx0,009\cdot 0,7178 \approx 0,64%$
Dunque, sembrerebbe che sia più probabile avere nomi uguali...
Purtroppo non è granchè come analisi;
aspetto opinioni e approfondimenti...
Il tutto SE&O.
Admin
Questioni di probabilità...
Moderatori: Gianfranco, Bruno
Questo forum è una sezione del PORTALE DI BASE CINQUE
-
- Amministratore del sito
- Messaggi: 870
- Iscritto il: mer apr 20, 2005 3:47 pm
- Località: Benevento
Pietro Vitelli (Amministratore del Forum)
"Un matematico è una macchina che converte caffè in teoremi" Paul Erdös
www.pvitelli.net
"Un matematico è una macchina che converte caffè in teoremi" Paul Erdös
www.pvitelli.net