R, Glücksspiel und Sterbetafeln

R ist 100px-Rlogo-simple.svg[1]eine freie Programmiersprache für stochastische und statistische Anwendungen. Die Lizenzvereinbarungen der Programmiersprache R haben ökonomisch weitreichende Implikationen, welche die Entscheidung, ob R oder alternativ ein vergleichbares proprietäres Produktpaket eingesetzt werden soll, manchmal durchaus erleichtern können. Nachfolgend seien einige wenige einfache Möglichkeiten von R erläutert – und da die Untersuchung des Würfelspiels die historische Keimzelle der modernen Stochastik darstellt, geschieht dies nachfolgend exemplarisch anhand der Simulation von Würfelwürfen:

Die Anfänge der modernen Stochastik fallen in das Interregnum zwischen der Regierungszeit Ludwig XIII von Frankreich (dieser dürfte den meisten von uns als Arbeitgeber des semi-fiktiven Gascogners d’Artagnan und seiner drei Musketierfreunde bekannt sein) und der absolutistischen Monarchie seines Sohns Ludwig XIV, genannt der Sonnenkönig. Dieser war als Vierjähriger zwar bereits König, dennoch überließ er zunächst seiner Mutter Anna von Österreich und Kardinal Mazarin die Staatsgeschäfte. Einer der wichtigsten Netzwerker seiner Zeit, zumindest in der Mathematik und in den Naturwissenschaften, war der Mathematiker, Theologe und ordinierte Priester Marine Mersenne: Dieser stand in persönlichem bzw. brieflichem Kontakt mit seinem ehemaligen Kommilitonen René Descartes, dessen Ratgeber in Buchlegungssachen Constantijn Huygens (Diplomat und Vater von Christiaan Huygens) war, mit Galileo Galilei (diesen hatte er 1623 in Italien besucht), mit Torricelli, sowie mit Pierre de Fermat und Blaise Pascal. Wenige Jahre nach Mersennes Tod regte der passionierte Glücksspieler Antoine Gombaud (genannt Chevalier de Mère) den Mathematiker Pascal an, sich mit Wahrscheinlichkeiten beim Glücksspiel zu beschäftigen: 1654 folgte dann ein Briefwechsel zwischen Pascale und Fermat, in dem einige Grundlagen der Wahrscheinlichkeitsrechnung aufgestellt wurden.

Christiaan Huygens
Christiaan Huygens

Als Christiaan Huygens 1655 in Paris weilte, hatte er Gelegenheit in diese Korrespondenz Einblick zu nehmen: Pascals und Fermats Überlegungen gingen 1657 in Huygens Abhandlung “De ratiociniis in ludo aleae” ein. Eine englische Übersetzung dieser Arbeit finden Sie auf den Seiten des Fachbereichs Statistik der University of California, Los Angeles unter http://www.stat.ucla.edu/history/huygens.pdf

Würfelwürfe mit R: Logische Vektoren und Tortendiagramme

Die für die Simulation herangezogene Funktion sample() ähnelt der Ziehung von Lottozahlen. 1 : 6 heißt, dass die 6 Kugeln im Ziehungsgerät von 1 bis 6 (nicht von 1 bis 49) nummeriert sind; size = 30 heißt, dass die Stichprobengröße 30 ist, also 30 mal gezogen wird; replace = TRUE ist ein Zufallsexperiment “mit Zurücklegen”, das bedeutet, dass eine einmal gezogene Kugel wieder in die Trommel zurückgelegt wird: Das ist hier wichtig, denn sonst wird sich R schnell beschweren “…cannot take a sample larger than the population when ´replace = FALSE´”.

x <- sample(1:6, size = 30, replace = TRUE)
x
## [1] 4 2 4 3 6 5 3 2 5 2 1 6 4 6 3 2 4 5 6 2 4 1 5 4 3 4 4 5 2 1

Das “zu Fuß” auszuzählen ist etwas mühselig, vor allem wenn die Stichprobe wesentlich größer als 30 wird; also lassen wir das R tun: ya <- x == a erzeugt einen gleich großen logischen Vektor, in dem an all den Stellen, an denen in x a steht, der Wert TRUE erscheint.

y6 <- x == 6
y6
## [1] FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## [12] TRUE FALSE TRUE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## [23] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

Wir benutzen den Umstand, dass in der internen Repräsentation in R der Ausdruck “TRUE” gleichbedeutend mit dem Wert 1 ist und FALSE in diesem Zusammenhang den Wert 0 hat. Die Summe über alle Einträge in y ergibt also die Anzahl der TRUE:

y5 <- x == 5
y4 <- x == 4
y3 <- x == 3
y2 <- x == 2
y1 <- x == 1
Verteilung30 <- c(sum(y1), sum(y2), sum(y3), sum(y4), sum(y5), sum(y6))

c("Häufigkeit der Würfelwürfe 1 bis 6:", Verteilung30 )

## [1] "Häufigkeit der Würfelwürfe 1 bis 6:"
 ## [2] "3"
 ## [3] "6"
 ## [4] "4"
 ## [5] "8"
 ## [6] "5"
 ## [7] "4"
 

Diese Häufigkeitsverteilung lässt sich in R mit Hilfe von pie() darstellen:

pie(Verteilung30)
 mtext("30 Würfelwürfe", side = 1)

 

Pie30Wuerfel

Das m in mtext steht für “margin” und der Parametereintrag “side = 1” bedeutet, dass hier die Beschriftung
unter der Graphik dargestellt wird.

x <- sample(1:6, size = 500, replace = TRUE)
y6 <- x == 6
y5 <- x == 5
y4 <- x == 4
y3 <- x == 3
y2 <- x == 2
y1 <- x == 1
Verteilung500 <- c(sum(y1), sum(y2), sum(y3), sum(y4), sum(y5), sum(y6))
c("Häufigkeit der Würfelwürfe 1 bis 6:", Verteilung500 )

## [1] "Häufigkeit der Würfelwürfe 1 bis 6:"
## [2] "87"
## [3] "87"
## [4] "88"
## [5] "74"
## [6] "88"
## [7] "76"

Man sieht, je größer die Zahl der Würfelwürfe ist, umso eher wird ein Würfelexperiment alle Zahlen mit
gleicher Häufigkeit zeigen: Die Unterschiede in den relativen Häufigkeiten der einzelnen Würfelergebnisse
werden immer kleiner:

PiWuerfelComparison

Sie konvergieren im stochastischen Sinne gegen Null, da die Wahrscheinlichkeit, dass jede der sechs Zahlen bei einem Würfelwurf fällt, gleich groß ist.
Genau das meint man, wenn man vom “Gesetz der großen Zahlen” spricht.

Noch deutlicher wird dieser Zusammenhang im Balkendiagramm. Balkendiagramme der gleichen Ergebnisverteilungen
können mit dem Befehl barplot() erzeugt werden: Der an barplot() übergebene vektorielle Parameter names.arg legt fest,
welche Bezeichnungen unter die einzelnen Balken geschrieben werden sollen:

par(mfrow=c(1,3))
barplot(Verteilung30, names.arg = c(1,2,3,4,5,6))
mtext("30 Würfelwürfe", side = 1)
barplot(Verteilung500, names.arg = c(1,2,3,4,5,6))
mtext("500 Würfelwürfe", side = 1)
barplot(Verteilung10000, names.arg = c(1,2,3,4,5,6))
mtext("10.000 Würfelwürfe", side = 1)

BalkenWuerfel

The Signal and the Noise

Eine (frei erfundene) Geschichte aus dieser Zeit: Es ist der  4. Dezember 1642 in Paris. D’Artagnon der bei den Mousquetaires de la garde nach wie vor den Rang eines Leutnants bekleidet, hat etwas zu feiern. Er hat von seinen Freunden seit Jahren nichts mehr gehört, und ist daher mehr als nur freudig überrascht den Chevalier du Vallon de Bracieux et de Pierrefonds (Porthos) in einem großen Saal beim Würfelspiel zu treffen. Das Spiel, das gespielt wird, nutzt 2 Würfel (die höchste zusammengesetzte Augenzahl gewinnt) und ist genauso fiktional wie unsere beiden Protagonisten (historisch authentische Würfelspiele mit 2 Würfeln haben vergleichsweise komplexe Regeln). Der Lärmpegel im Saal ist unangenehm hoch, denn in einer vollbesetzten Räumlichkeit, wie der nachstehend gezeigten, kommen pro Spielrunde 700 Würfelwürfe zusammen. Nehmen wir einmal an, dass die Spielrunden sich dynamisch immer wieder neu zusammensetzen, und es durchaus üblich ist, dass Spieler die Tische wechseln und dann ihren Gewinn und ihre Würfel mit sich nehmen.
Nehmen wir weiterhin an, dass an den einzelnen Tischen, die gefallenen Würfelaugen mitprotokolliert werden, um Betrügereien zu unterbinden….So überraschend das Wiedersehen der beiden Freunde war, so wenig überrascht es, dass der Abend in einer Saalschlägerei und das ganze vor einem Richter mündet.

Saal

Unter den von der herbeigeeilten Maréchaussée eingezogenen Würfeln kann leider keiner gefunden werden, der gezinkt ist.
Die Auswertung der Würfelprotokolle für die einzelnen Tische zeigt noch nicht,  dass an den Tischen einzelne Personen auffällig viel Glück gehabt haben.

Tische
Wegen des Untergrundrauschens (Noise) kann am Einzeltisch das  Signal  nur schwer erkannt werden. In der Gesamtbetrachtung aller Würfelergebnisse  wird hier deutlich, dass die 6 tatsächlich überproportional häufig gefallen ist: Faszinierend ist bei diesem Ergebnis, dass wir in einem Wust von 1540 Würfelwürfen und 77 Spielern Muster erkennen können, die nahelegen, dass möglicherweise nicht alles mit rechten Dingen zugegangen ist.

Wären entsprechende Betrachtungen nicht erst ein gutes Jahrzehnt später angestellt worden, hätten sie in der
Fortführung unserer frei erfundenen Geschichte zu einer Rehabilitation unserer handgemeinen
Romanfiguren herangezogen werden können.

Eine der ersten Anwendungen außerhalb des Glücksspiels fanden die Überlegungen von Pascal, Fermat und Huygens interessanterweise in der Demographie, wie Eisenmenger und Emmerling [1] berichten: Zu der Zeit als Huygens seine Abhandlungen veröffentlichte, war John Graunt in England mit der Auswertung der Sterbeverzeichnisse Londons befasst und veröffentlichte 1662 “Natural and Political Observations made upon the Bills of Mortality”. Ab 1669 begann ein Briefwechsel zwischen Huygens, Huygens Bruder Lodewijk und Graunt, in dem die Konzepte erarbeitet wurden, welche die Berechnung von Leibrenten auf der Basis mittlerer Lebenserwartungen möglich machen sollten.

[1] Eisenmenger, Emmerling: www.destatis.de/ Pfad → Publikationen → WISTA – Wirtschaft und Statistik → „Amtliche Sterbetafeln und Entwicklung der Sterblichkeit“

Bildnachweise: „R-Logo“: https://www.r-project.org/logo/ (GNU General Public License version 2 ); Christiaan Huygens, Porträt von Bernard Vaillant (gemeinfrei); Historischer Saaalbau in Rüttenscheid (Quelle: ekir)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.