Vorlesungsskript: Grundlagen des Entscheidens I

Eckhart Arnold

1 Techniken des Entscheidens
2 Zur Theorie der Kollektiven Entscheidungen
3 Wahrscheinlichkeitsrechnung
4 Neumann-Morgensternsche Nutzentheorie
5 Spieltheorie
    5.1 Spieltheorie I: Einführung
    5.2 Spieltheorie II: Vertiefung und Anwendung
        5.2.1 Nicht-Nullsummenspiele
        5.2.2 Wiederholte Spiele
            5.2.2.1 Wiederholte Spiele am Beispiel des wiederholten Gefangenendilemmas
            5.2.2.2 Das „Volkstheorem“ („folk theorem“)
        5.2.3 Evolutionäre Spieltheorie
        5.2.4 Ein Anwendungsbeispiel der Spieltheorie, das funktioniert: Vertrauen bei Internetauktionen
        5.2.5 Aufgaben
6 Kritische Reflexion
7 Beispielklausur
Literaturverzeichnis

5.2.2 Wiederholte Spiele

5.2.2.1 Wiederholte Spiele am Beispiel des wiederholten Gefangenendilemmas

Im einfachen Gefangenendilemma ist, wenn man davon ausgeht, dass jeder Spieler sich egoistisch-rational verhält, keine kooperative Lösung möglich. Aber wie verhält es sich, wenn man das Spiel mehrfach wiederholt? Dann können die Spieler darauf reagieren, wie sich ihr Gegenüber in der letzten Runde verhalten hat. So kann ein Spieler die Kooperation in der folgenden Runde davon abhängig machen, ob der andere in der gegenwärtigen Runde kooperiert oder nicht. Inwiefern ändert das die strategische Situation? Angenommen, es wird ein wiederholtes Gefangenendilemma von fünf Runden gespielt, und einer der Spieler spielt die Strategie „Wie Du mir, so ich Dir“ (englisch: „Tit for Tat“), d.h. er kooperiert in der ersten Runde und kooperiert in den folgenden Runden immer dann, wenn der Gegenüber in der vorhergehenden Runde ebenfalls kooperiert hat. Welches Verhalten ist die beste Antwort auf „Wie Du mir, so ich Dir“, d.h. wie kann man gegen „Wie Du mir, so ich Dir“ die höchste Auszahlung erhalten? Spielt man - analog zum einfachen Gefangenendilemma - immer unkooperativ, dann erhält man mit den Auszahlungsparametern der oben angegebenen Spielmatrix die Auszahlungen:

Runde: 1 2 3 4 5
Auszahlung: 5 1 1 1 1 9

Hätte man dagegen immer kooperativ gespielt, dann wären die Auszahlungen höher ausgefallen:

Runde: 1 2 3 4 5
Auszahlung: 3 3 3 3 3 15

Daraus wird deutlich, dass im wiederholten Gefangenendilemma unbedingte Defektion keine dominante Strategie ist. Ist aber umgekehrt eine Strategie, die gegen „Wie Du mir so ich Dir“ immer kooperiert eine beste Antwort auf „Wie Du mir, so ich Dir“. Sie ist es zumindest dann nicht, wenn man durch irgendeine Änderung der Zugfolge ein besseres Ergebnis gegen „Wie Du mir, so ich Dir“ erziehlen kann. Das ist aber in der Tat möglich, wenn man nur in der letzten Runde defektiert und bis dahin kooperiert. Dann ergibt sich:

Runde: 1 2 3 4 5
Auszahlung: 3 3 3 3 5 17

Es lohnt sich also immer, in der letzten Runde zu defektieren. Und dies gilt sogar nicht nur gegen die Strategie „Wie Du mir, so ich Dir“, sondern gegen schlechthin jede Strategie, denn auch gegen eine Strategie, die ihrerseits in der letzten Runde defektiert, ist es besser in der letzten Runde zu defektieren (und eine Auszahlung von 1 zu bekommen) als zu kooperieren (und eine Auszahlung von 0) zu erhalten. Das ist auch keineswegs verwunderlich, denn für sich betrachtet, stellt die letzte Runde ein einfaches Gefangenendilemma dar, und im einfachen Gefangenendilemma ist Defektion, wie wir gesehen haben, die dominante Strategie. Daraus ergibt sich aber eine wichtige Schlussfolgerung: Wenn in der letzten Runde Defektion die dominante Strategie ist, dann müssten beide Spieler, sofern sie sich strikt nutzenmaximierend verhalten, in der letzten Runde stets defektieren. Wenn sie aber in der letzten Runde stets defektieren, dann hat der Zug, den man in der vorletzten Runde spielt, keinen Einfluss mehr darauf, wie der Gegner in der letzten Runde antwortet (sofern der Gegner sich, wie gesagt, strikt nutzenmaximierend verhält). Mit anderen Worten man braucht in der vorletzten Runde keine Belohnung für Kooperation durch den Gegner in der folgenden Runde mehr zu erhoffen, man muss aber auch die Bestrafung für Defektion nicht mehr fürchten, da sie ohnehin eintritt. Dann befinden wir uns aber auch in der vorletzten Runde in genau derselben Situation wie in der letzten Runde, indem wir auf die zukünftige Reaktion des Gegners keine Rücksicht nehmen müssen. Dann ist es aber das beste, auch in der vorletzten Runde schon zu defektieren. Nun wiederholt sich dieselbe Überlegung auch für die vorvorletzte Runde. Auch in der vorvorletzten Runde sollte man also - wechselseitige strikte Rationalität vorausgesetzt! - defektieren usw., so dass schließlich jeder Spieler schon ab der ersten Runde defektieren müsste. Diese Art von Argumention bei wiederholten Spielen, bei der man von der letzten Runde rückwärts auf die vorletzte schließt, und von der vorletzten auf die vorvorletzte bis man schließlich bei der ersten Runde angekommen ist, bezeichnet man auch als Rückwärtsinduktion.

Die Rückwärtsinduktion zeigt uns also, dass strikt-rationale Spieler auch im wiederholten Gefangenendilemma schon ab der ersten Runde defektieren werden, sofern der Gegenüber sich ebenfalls strikt rational verhält und sofern beiden bekannt ist, dass sie sich beide strikt rational verhalten. Diese Bedingungen sind keine unwesentlichen Einschränkungen: Anders als im einfachen Gefangenendilemma ist ausschließliche Defektion keine dominante Strategie - dann wäre sie die beste Strategie, egal ob der Gegner sich rational verhält oder nicht, und unabhäbgig davon, was über das Verhalten des Gegners bekannt ist - sondern lediglich eine Gleichgewichtsstrategie. Gibt es auch nur geringen Anlass daran zu zweifeln, dass der Gegenspieler sich strikt rational verhält (z.B. indem er auch in der letzten Runde Kooperation noch kooperiert, wenn kein besonderer Grund dagegen spricht), dann greift das auf die Rückwärtsinduktion gestützte Argument schon nicht mehr.

Zudem setzt das Argument voraus, dass die Rundenzahl bekannt ist. Ist die Rundenzahl unbekannt (z.B. wenn das Spiel nicht durch die Anzahl der Wiederholungen, sondern durch eine Abbruchwahrscheinlichkeit nach jeder Runde begrenzt wird), so lässt sich die Argumentation ebenfalls nicht anwenden. Damit gilt aber insgesamt, dass es im wiederholten Gefangenendilemma nur im Ausnahmefall rational ist, von der ersten Runde an ausschließlich zu defektieren, nämlich dann, wenn entweder die Rundenzahl endlich und bekannt ist und der Gegenspieler sich strikt rational verhält und überdies auch seinerseits von der strikten Rationalität seines Gegenübers ausgeht, oder wenn die Gegnerstrategie zufällig eine solche ist, gegen die ausnahmslose Defektion die beste Antwort darstellt.

t g+ f @