Vorlesungsskript: Grundlagen des Entscheidens I

Eckhart Arnold

Inhalt

1 Vorwort

2 Techniken des Entscheidens

3 Zur Theorie der Kollektiven Entscheidungen

4 Wahrscheinlichkeitsrechnung

5 Neumann-Morgensternsche Nutzentheorie

6 Spieltheorie

6.1 Spieltheorie I: Einführung

6.2 Spieltheorie II: Vertiefung und Anwendung

6.2.1 Nicht-Nullsummenspiele

6.2.2 Wiederholte Spiele

6.2.2.1 Wiederholte Spiele am Beispiel des wiederholten Gefangenendilemmas

6.2.2.2 Das „Volkstheorem“ („folk theorem“)

6.2.3 Evolutionäre Spieltheorie

6.2.4 Ein Anwendungsbeispiel der Spieltheorie, das funktioniert: Vertrauen bei Internetauktionen

6.2.5 Aufgaben

7 Kritische Reflexion

8 Beispielklausur

Literaturverzeichnis

6.2.2.2 Das „Volkstheorem“ („folk theorem“)

Wenn ausnahmslose Defektion im wiederholten Gefangenendilemma in aller Regel nicht die beste Strategie ist, welches ist aber dann die beste Strategie? Die Antwort lautet: Es gibt keine beste Strategie. Wie gut eine Strategie abschneidet, hängt immer davon ab, auf welchen Gegner sie trifft. Dass es keine beste Strategie gibt, lässt sich sehr leicht beweisen, indem man zeigt, dass es zwei Strategien gibt, zu denen die besten Antwort-Strategien jeweils verschieden sind. Diese beiden Strategien sind die Strategien „Falke“ und „Unerbittlich“. Die Strategie „Falke“ defektiert ausnahmslos in allen Runden. (Das Gegenstück dazu ist übrigens die Strategie „Taube“, die ausnahmslos kooperiert.) Die Strategie „Unerbittlich“ kooperiert solange, bis der Gegner ein einziges mal defektiert. Wenn das geschieht, dann defektiert sie ab der folgenden Runde ausnahmslos für den gesamten Rest des Spiels.

Nun kann man sich überlegen, dass die beste Antwort auf die Strategie „Falke“ nur eine Strategie sein kann, die gegen „Falke“ ab der ersten Runde ausnahmslos defektiert. Das bedeutet nicht, dass sie auch gegen andere Strategien ausnahmslos defektieren muss. (Sie könnte, z.B. wenn die Gegnerstrategie ein Kooperationsangebot macht, ihrerseits auf Kooperation umschwenken.) Aber zumindest in der ersten Runde muss sie unbedingt defektieren, sonst würde sie in der ersten Runde gegen „Falke“ Punkte verschwenden, womit sie keine beste Antwort auf „Falke“ mehr wäre.

Gegen „Unerbittlich“ kann diese Strategie dann aber keine beste Antwort mehr sein. Den jede beste Antwort auf „Unerbittlich“ muss gegen „Unerbittlich“ ab der ersten Runde kooperieren. Damit ist gezeigt, dass es im wiederholten Gefangenendilemma keine stark oder schwach dominante Strategie gibt.

Wie sieht es aber mit Gleichgewichtsstrategien aus? Davon gibt es einem bekannten Theorem der Spieltheorie zufolge unüberschaubar viele. Das Theorem, um das es sich handelt, ist das sogennante Volkstheorem (englisch: „folk theorem“; „folk“, weil kein Erfinder des Theorems bekannt und es damit gewissermaßen Allgemeingut ist). Das Folk-Theorem sagt nun nicht unmittelbar etwas darüber aus, welche Strategien in wiederholten Spielen Gleichgewichtsstrategien sind, und welche nicht, aber es sagt etwas über die möglichen Durchschnittsauszahlungen von Gleichgewichten in wiederholten Spielen aus. In (vereinfachter Form) lautet das Folk-Theorem so:

Volkstheorem: In (unendlich oft) wiederholten Spielen ist jedes Resultat erzielbar, das den Spielern mindestens ihren Maximin-Wert bietet.
Dass ein Resultat „erzielbar“ ist heisst dabei, dass es ein Gleichgewicht gibt, bei dem das entsprechende Resultat heraus kommt. Unter dem „Resultat“ sind dabei die Durchschnittsauszahlungen zu verstehen, die die Spieler über das gesamte wiederholte Spiel erhalten. Der Maximin-Wert ist derjenige Wert, den ein Spieler erhält, wenn er „auf Nummer sicher“ geht und so spielt, das er seinen Verlust minimiert. (Vgl. dazu die Maximin-Regel bei Entscheidungen unter Unwissenheit, S. 2.2.4.1.) Im (wiederholten) Gefangenendilemma kann ein Spieler dadurch, dass er defektiert, sicherstellen, dass er mindestens die Auszahlung für wechselseitige Defektion erhält. (Mit unseren Zahlen also einen Nutzenwert von 1.)

Der Beweis der Volkstheorems lässt sich für den Sonderfall des wiederholten 2-Personen Gefangenendilemmas etwa so führen: Wenn jedem Spieler der Maximin-Wert garantiert werden soll, dann kann das Gleichgewichts-Resultat für jeden der Spieler nur Werte von $P$ bis $R$ haben. Andernfalls (bei Werten kleiner $P$ oder bei Werten größer $R$ ) müsste einer der Spieler freiwillig auf den Minimax-Wert verzichten, obwohl er diesen Wert notfalls immer durch Defektion erzwingen könnte. Sei $X$ nun irgendein Wert für den gilt: $P \leq X \leq S$ . Dann gibt es eine Zugfolge, die jedem Spieler die Auszahlung $X$ liefert. (Beispiel: Angenommen $P=1$ und $S=3$ und $X=2\frac{1}{3}$ , dann liefert die Zugfolge $Kooperation, Kooperation, Defektion$ wenn sie von beiden Spielern gespielt wird, jedem Spieler genau die Auszahlung $X=2\frac{1}{3}$ .) Dann lässt sich diese Zugfolge aber durch eine spezielle Variante der Strategie „Unerbittlich“ erzwingen, die selbst diese Zugfolge spielt und genau dann für den Rest des Spiels auf Bestrafung umschaltet, wenn der Gegenüber von dieser Zugfolge ein einziges Mal abweicht. Wenn wir diese Variante „Unerbittlich*“ nennen, dann bildet das Strategiepaar (Unerbittlich*, Unerbittlich*) ein Gleichgewicht, denn keiner der beiden Spieler kann von seiner Gleichgewichtsstrategie abweichen, ohne mit einer schlechteren Durchschnittsauszahlung rechnen zu müssen.