Een dag zonder verjaardagen

Hoe groot is de kans dat er op minstens één dag in het jaar niemand op Aarde jarig is? Ga ervanuit dat een jaar 365 dagen heeft en dat er acht miljard mensen op Aarde zijn.

Één dag in het jaar geen verjaardag...
Om dit probleem tot een goed einde te brengen ga ik het probleem eerst een heel stuk kleiner maken, ik stel simpelweg dat er maar drie dagen in een jaar zitten en dan ga ik later opschalen naar 365 dagen. Bovendien ga ik eerst uit van een zeer beperkt aantal mensen en dat ga ik dan later opschalen naar acht miljard.

Wanneer er drie dagen in een jaar zitten en er is maar één mens op Aarde dan is die ene mens uiteraard op één van die drie dagen jarig. Die drie mogelijkheden noem ik combinaties en ik nummer de dagen als 1, 2, 3. In een tabel ziet dat er als volgt uit:
Combinaties
1
2
3
Wanneer er twee mensen op Aarde zijn dan ontstaat er een mix van mogelijke dagen waarop ze jarig zijn.
Combinaties
11
12
13
21
22
23
31
32
33
De combinaties 11, 22 en 33 geven aan dat ze op dezelfde dag jarig zijn en in alle andere gevallen zijn ze op verschillende dagen jarig. De volgende stap is uiteraard dat er drie mensen op Aarde zijn.
Combinaties
111
112
113
121
122
123
131
132
133
211
212
213
221
222
223
231
232
233
311
312
313
321
322
323
331
332
333
Er zijn nu een aantal combinaties waarbij deze drie mensen precies verspreid over alle dagen van het jaar jarig zijn. Daarom ga ik aan de tabel drie kolommen toevoegen. In de eerste extra kolom geef ik aan wanneer er iedere dag iemand jarig is (dus dan zijn er nul dagen waarop er niemand jarig is), in de tweede extra kolom geef ik aan wanneer er op precies één dag niemand jarig is en in de derde extra kolom geef ik aan wanneer er twee dagen zijn waarop er niemand jarig is, en zo ga ik die kolommen ook benoemen. Op de onderste rij staan de totalen.
Combinaties Kolom0:
nul dagen
niemand jarig
Kolom1:
één dag
niemand jarig
Kolom2:
twee dagen
niemand jarig
1111
1121
1131
1211
1221
1231
1311
1321
1331
2111
2121
2131
2211
2221
2231
2311
2321
2331
3111
3121
3131
3211
3221
3231
3311
3321
3331
276183
De volgende stap is om weer een mens toe te voegen, het zijn er nu vier.
Combinaties Kolom0:
nul dagen
niemand jarig
Kolom1:
één dag
niemand jarig
Kolom2:
twee dagen
niemand jarig
11111
11121
11131
11211
11221
11231
11311
11321
11331
12111
12121
12131
12211
12221
12231
12311
12321
12331
13111
13121
13131
13211
13221
13231
13311
13321
13331
21111
21121
21131
21211
21221
21231
21311
21321
21331
22111
22121
22131
22211
22221
22231
22311
22321
22331
23111
23121
23131
23211
23221
23231
23311
23321
23331
31111
31121
31131
31211
31221
31231
31311
31321
31331
32111
32121
32131
32211
32221
32231
32311
32321
32331
33111
33121
33131
33211
33221
33231
33311
33321
33331
8136423
Vervolgens werk ik het ook nog uit voor vijf mensen.
Combinaties Kolom0:
nul dagen
niemand jarig
Kolom1:
één dag
niemand jarig
Kolom2:
twee dagen
niemand jarig
111111
111121
111131
111211
111221
111231
111311
111321
111331
112111
112121
112131
112211
112221
112231
112311
112321
112331
113111
113121
113131
113211
113221
113231
113311
113321
113331
121111
121121
121131
121211
121221
121231
121311
121321
121331
122111
122121
122131
122211
122221
122231
122311
122321
122331
123111
123121
123131
123211
123221
123231
123311
123321
123331
131111
131121
131131
131211
131221
131231
131311
131321
131331
132111
132121
132131
132211
132221
132231
132311
132321
132331
133111
133121
133131
133211
133221
133231
133311
133321
133331
211111
211121
211131
211211
211221
211231
211311
211321
211331
212111
212121
212131
212211
212221
212231
212311
212321
212331
213111
213121
213131
213211
213221
213231
213311
213321
213331
221111
221121
221131
221211
221221
221231
221311
221321
221331
222111
222121
222131
222211
222221
222231
222311
222321
222331
223111
223121
223131
223211
223221
223231
223311
223321
223331
231111
231121
231131
231211
231221
231231
231311
231321
231331
232111
232121
232131
232211
232221
232231
232311
232321
232331
233111
233121
233131
233211
233221
233231
233311
233321
233331
311111
311121
311131
311211
311221
311231
311311
311321
311331
312111
312121
312131
312211
312221
312231
312311
312321
312331
313111
313121
313131
313211
313221
313231
313311
313321
313331
321111
321121
321131
321211
321221
321231
321311
321321
321331
322111
322121
322131
322211
322221
322231
322311
322321
322331
323111
323121
323131
323211
323221
323231
323311
323321
323331
331111
331121
331131
331211
331221
331231
331311
331321
331331
332111
332121
332131
332211
332221
332231
332311
332321
332331
333111
333121
333131
333211
333221
333231
333311
333321
333331
243150903
Dit is een goed moment voor een samenvatting van het voorgaande.
Aantal
mensen
Aantal
combinaties
Kolom0:
nul dagen
niemand jarig
Kolom1:
één dag
niemand jarig
Kolom2:
twee dagen
niemand jarig
13003
29063
3276183
48136423
5243150903
Nu ga ik extrapoleren, wat variabelen invoeren en systematiek inbrengen. In woorden is de systematiek als volgt: voor iedere mens die erbij komt splitst iedere rij zich in drie rijen. Van die drie rijen:
Aantal
mensen
= n
Aantal
combinaties
= c
Kolom0:
nul dagen
niemand jarig
= k0
Kolom1:
één dag
niemand jarig
= k1
Kolom2:
twee dagen
niemand jarig
= k2
13 = 31003
29 = 32063
327 = 336183
481 = 3436423
5243 = 35150903
Met een rekenmachine in de hand kan ik de tabel nu heel gemakkelijk uitbreiden.
Aantal
mensen
= n
Aantal
combinaties
= c
Kolom0:
nul dagen
niemand jarig
= k0
Kolom1:
één dag
niemand jarig
= k1
Kolom2:
twee dagen
niemand jarig
= k2
13003
29063
3276183
48136423
5243150903
67295401863
7218718063783
8656157967623
9196831815015303
10590495598030663
Het ging om de kans dat er op minstens één dag in het jaar niemand op Aarde jarig is. Die kans is:
Dat zet ik ook in een tabel.
Aantal
mensen
= n
Aantal
combinaties
= c
Kolom0:
nul dagen
niemand jarig
= k0
Kans
= K
1301.00000
2901.00000
32760.77778
481360.55556
52431500.38272
67295400.25926
7218718060.17421
8656157960.11660
919683181500.07788
1059049559800.05197
Wanneer er nog maar één of twee mensen op de Aarde rondlopen is de kans op een verjaardagsloze dag één, maar die kans neemt snel af wanneer het drukker wordt.
Aantal
mensen
= n
Aantal
combinaties
= c
Kolom0:
nul dagen
niemand jarig
= k0
Kans
= K
1301.00000
2901.00000
32760.77778
481360.55556
52431500.38272
67295400.25926
7218718060.17421
8656157960.11660
919683181500.07788
1059049559800.05197
111771471710060.03467
125314415191560.02312
13159432315697500.01541
14478296947338200.01028
1514348907142506060.00685
1643046721428501160.00457
171291401631287469500.00304
183874204893866340600.00203
19116226146711606886060.00135
20348678440134836386760.00090
2110460353203104540617500.00060
2231381059609313684767000.00040
2394143178827941180130060.00027
242824295364812823792048360.00018
258472886094438471879461500.00012
26254186582832925416645017400.00008
27762559748498776251948318060.00005
2822876792454961228759871485960.00004
2968630377364883686287667521500.00002
302058911320946492058879108691800.00002
316176733962839476176669538330060.00001
32185302018885184118530073039499560.00001
33555906056655552355590347967517500.00000
Het aantal dagen in een jaar noem ik d, dan ziet de systematiek er als volgt uit (zie de laatste regel van de tabel).
Aantal
mensen
= n
Aantal
combinaties
= c
Kolom0:
nul dagen
niemand jarig
= k0
Kolom1:
één dag
niemand jarig
= k1
Kolom2:
twee dagen
niemand jarig
= k2
13003
29063
3276183
48136423
5243150903
67295401863
7218718063783
8656157967623
9196831815015303
10590495598030663
Vervolgens ga ik iedere nieuwe rij van de bovenstaande tabel delen door het aantal dagen, in dit geval drie, dus in de kolom “Aantal combinaties” komt telkens 1 te staan.
Aantal
mensen
= n
Aantal
combinaties
= c
Kolom0:
nul dagen
niemand jarig
= k0
Kolom1:
één dag
niemand jarig
= k1
Kolom2:
twee dagen
niemand jarig
= k2
110.000000.000001.00000
210.000000.666670.33333
310.222220.666670.11111
410.444440.518520.03704
510.617280.370370.01235
610.740740.255140.00412
710.825790.172840.00137
810.883400.116140.00046
910.922120.077730.00015
1010.948030.051920.00005
Zoals verwacht gaat Kolom0 richting één (terwijl die bij nul begint) en Kolom2 gaat richting nul (terwijl die bij één begint). Nu kan ik een grote stap maken en de tabel uitbreiden naar een jaar met 365 dagen. De kolom met het aantal combinaties laat ik vanaf nu weg, want daar staat toch telkens een één.
Aantal
mensen
= n
Kolom0:
nul dagen
niemand jarig
= k0
Kolom1:
één dag
niemand jarig
= k1
Kolom2:
twee dagen
niemand jarig
= k2
Kolom364:
364 dagen
niemand jarig
= k364
10.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 1.0000000000 ∙ 100
20.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 2.7397260274 ∙ 10−3
30.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 7.5060987052 ∙ 10−6
40.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 2.0564653987 ∙ 10−8
50.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 5.6341517772 ∙ 10−11
60.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 1.5436032266 ∙ 10−13
70.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 4.2290499360 ∙ 10−16
80.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 1.1586438181 ∙ 10−18
90.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 3.1743666249 ∙ 10−21
100.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 8.6968948627 ∙ 10−24
200.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 2.0722186370 ∙ 10−49
500.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 2.8031713233 ∙ 10−126
1000.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 2.1528135528 ∙ 10−254
2000.0000000000 ∙ 1000.0000000000 ∙ 1000.0000000000 ∙ 100 1.2697551214 ∙ 10−510
3640.0000000000 ∙ 1005.3105865370 ∙ 10−1551.7542460508 ∙ 10−150 7.7212960109 ∙ 10−931
3651.4549552156 ∙ 10−1579.6652674974 ∙ 10−1531.5934401628 ∙ 10−148 2.1154235646 ∙ 10−933
3662.6625680446 ∙ 10−1558.8275668473 ∙ 10−1519.6844619110 ∙ 10−147 5.7956809990 ∙ 10−936
5009.8026681438 ∙ 10−703.7393395217 ∙ 10−677.0234614296 ∙ 10−65 2.6053173774 ∙ 10−1279
10001.7123209304 ∙ 10−125.4431049243 ∙ 10−118.5445507611 ∙ 10−10 1.8596379827 ∙ 10−2560
20002.1611945163 ∙ 10−13.3566254507 ∙ 10−12.5596478898 ∙ 10−1 9.4746669229 ∙ 10−5123
50009.9959746387 ∙ 10−14.0245831990 ∙ 10−47.7804717399 ∙ 10−8 1.2530562935 ∙ 10−12809
100009.9999999956 ∙ 10−14.4410410763 ∙ 10−109.1194794422 ∙ 10−20 4.3017810263 ∙ 10−25621
200001.0000000000 ∙ 1005.4035194130 ∙ 10−221.2519178889 ∙ 10−43 5.0699506845 ∙ 10−51244
500001.0000000000 ∙ 1009.7331293159 ∙ 10−583.2388678928 ∙ 10−115 8.2998461226 ∙ 10−128113
999981.0000000000 ∙ 1002.6097270327 ∙ 10−1171.5965947434 ∙ 10−234 2.5143917665 ∙ 10−256222
999991.0000000000 ∙ 1002.6025770956 ∙ 10−1171.5878462790 ∙ 10−234 6.8887445658 ∙ 10−256225
1000001.0000000000 ∙ 1002.5954467474 ∙ 10−1171.5791457515 ∙ 10−234 1.8873272783 ∙ 10−256227
Wanneer ik deze tabel laat doorlopen tot en met n = acht miljard dan verschaft de laatste regel mij de informatie hoe groot de kans is dat er vandaag niemand op Aarde jarig is. Het probleem daarbij is dat daarvoor alle acht miljard regels uitgerekend moeten worden, omdat iedere regel voortborduurt op de vorige.

Echter, wanneer we goed kijken naar de bovenstaande tabel dan zien we dat in de laatste regel Kolom1 gigantisch veel kleiner is dan Kolom0, en Kolom2 is vervolgens gigantisch veel kleiner dan Kolom1, enzovoort. Kolom0 geeft de kans aan dat er iedere dag iemand jarig is, en de som van alle overige kolommen geeft de kans aan dat er op minstens één dag niemand jarig is. Maar als de kolommen Kolom2 tot en met Kolom364 in het niet vallen bij Kolom1, dan wordt de kans die we zoeken dus volledig bepaald door Kolom1 (tenzij je een nauwkeurigheid wilt van vele miljoenen significante cijfers, maar dat willen we niet). Het is wel boeiend om te zien hoe de kansverdeling zich door de kolommen verplaatst bij toenemende waarden van n. In onderstaande grafiek is horizontaal de nummering van de kolommen uitgezet, en verticaal de kans van die 365 verschillende kolommen voor verschillende waarden van n.

De grafiek van ki voor n = 1 (de rode lijn),
n = 10 (de lichtgroene lijn), n = 50 (de oranje lijn),
n = 100 (de paarse lijn), n = 200 (de blauwe lijn),
n = 365 (de grijze lijn), n = 500 (de bruine lijn),
n = 1000 (de lichtbruine lijn), n = 2000 (de donkergroene lijn),
n = 5000 (de gele lijn) en n = 10000 (de lichtblauwe lijn)
De stap van n = 99998 naar n = 99999 is voor Kolom1 (nagenoeg) exact gelijk aan vermenigvuldigen met 364/365 en dat geldt ook voor de stap van n = 99999 naar n = 100000. Vanaf 100000 zijn het vervolgens nog 8000000000 − 100000 = 7999900000 stappen naar acht miljard. Het probleem is vanaf hier een balletjesprobleem (met teruglegging), er zijn 365 balletjes waarvan er eentje bijzonder is en hoe groot is de kans dat dat bijzondere balletje (de groene in het plaatje hieronder) keer op keer niet gepakt wordt.

Het is vanaf hier een balletjesprobleem
Dit heb ik dus uit te rekenen:
Ik neem links en rechts de logaritme:
De waarde van k1 (100000) lees ik af uit de tabel en dan wordt het simpele sommetje:
Oftewel:
Hoe zou het gegaan zijn indien ik direct vanaf het begin met die verhouding 364/365 gerekend had? In dat geval was ik natuurlijk veel sneller klaar geweest. Het sommetje ziet er dan zo uit:
Het verschil tussen beide methodes is 9531846 − 9531843 = 3 nullen! Linksom of rechtsom is de kans uiteraard onvoorstelbaar klein, dat zag iedereen wel aankomen, maar het laatste sommetje kun je zo even maken op een kladblaadje voor een ruwe indicatie en dan zit je minder dan een factor duizend verkeerd. Om precies te zijn: een factor 365!

Laten we het blijven beschouwen als balletjesprobleem, dus één bijzonder balletje mag niet gepakt worden. Echter, aan het begin is er nog helemaal geen bijzonder balletje, dus dat bijzondere balletje kan op 365 manieren ontstaan. Daarom moet het laatste sommetje nog met 365 vermenigvuldigd worden om tot een goed antwoord te komen:
Dit nodigt natuurlijk uit om beide berekeningen met elkaar te vergelijken. De ene kans noem ik K1 en is de som van Kolom1 tot en met Kolom364:
De andere kans noem ik K2 en gaat volgens deze berekening:
Dat brengt ons bij de volgende vergelijkingstabel.
Aantal mensenK1K2
11.0000000000 ∙ 1003.6400000000 ∙ 102
21.0000000000 ∙ 1003.6300273973 ∙ 102
31.0000000000 ∙ 1003.6200821167 ∙ 102
41.0000000000 ∙ 1003.6101640835 ∙ 102
51.0000000000 ∙ 1003.6002732230 ∙ 102
61.0000000000 ∙ 1003.5904094608 ∙ 102
71.0000000000 ∙ 1003.5805727225 ∙ 102
81.0000000000 ∙ 1003.5707629342 ∙ 102
91.0000000000 ∙ 1003.5609800221 ∙ 102
101.0000000000 ∙ 1003.5512239124 ∙ 102
201.0000000000 ∙ 1003.4551208976 ∙ 102
501.0000000000 ∙ 1003.1821366393 ∙ 102
1001.0000000000 ∙ 1002.7742448194 ∙ 102
2001.0000000000 ∙ 1002.1086121420 ∙ 102
3641.0000000000 ∙ 1001.3446023023 ∙ 102
3651.0000000000 ∙ 1001.3409184604 ∙ 102
3661.0000000000 ∙ 1001.3372447112 ∙ 102
5001.0000000000 ∙ 1009.2587521977 ∙ 101
10001.0000000000 ∙ 1002.3486162263 ∙ 101
20007.8388054837 ∙ 10−11.5112323776 ∙ 100
50004.0253613424 ∙ 10−44.0261395822 ∙ 10−4
100004.4410410772 ∙ 10−104.4410410781 ∙ 10−10
Beide kansberekeningen naderen elkaar voor grotere waarden van n zoals onderstaande grafiek nog beter laat zien.

De grafiek van K1 (n) (de blauwe lijn)
en van K2 (n) (de rode lijn)
Voor de duidelijkheid zoom ik even in op het laatste deel.

De grafiek van K1 (n) (de blauwe lijn)
en van K2 (n) (de rode lijn)
En ik maak tenslotte een grafiek van de relatieve fout.

De grafiek van K2/K1 − 1,
logaritmische verticale schaalverdeling
De grafiek laat zien dat er per toename van ∆n ≈ 840 de nauwkeurigheid van K2 één decimaal toeneemt. Vanaf n = 10000 (het einde van de grafiek) tot n = acht miljard (het aantal mensen op Aarde) zal de nauwkeurigheid van K2 daarom nog met meer dan 9.5 miljoen decimalen toenemen, en dat geldt dan ook voor K1 omdat ik die vanaf n = 100000 op dezelfde manier bereken. Dus de berekeningen die ik hierboven heb uitgevoerd voor n = acht miljard zijn absoluut zeer nauwkeurig.

Voor hele grote waarden van n, zoals n = acht miljard, wordt de berekening van K1 nagenoeg ondoenlijk en zou mijn computer jaren rekentijd nodig hebben terwijl de berekening van K2 dan binnen een seconde is uitgevoerd. Voor lage waarden van n, ongeveer wanneer n < 5000, is de berekening van K2 veel te onnauwkeurig (en geeft zelfs uitkomsten groter dan één) en voldoet alleen de berekening van K1 (maar dat is dan ook binnen een paar minuten gefikst).

Dat allemaal ter harte nemend is de kans dat er op minstens één dag in het jaar niemand op Aarde jarig is, uitgaande van een jaar met 365 dagen en acht miljard mensen, dus: