Vorlesungsskript: Grundlagen des Entscheidens I

Eckhart Arnold

Inhalt

1 Vorwort

2 Techniken des Entscheidens

2.1 Entscheidungstabellen und -bäume

2.2 Entscheidungen unter Unwissenheit I

2.3 Entscheidungen unter Unwissenheit II

2.3.1 Die Minimax-Bedauerns-Regel

2.3.2 Kardinaler Nutzen

2.3.3 Weitere Entscheidungsregeln auf Basis des kardinalen Nutzens

2.3.3.1 Die Optimismus-Pessimismus Regel

2.3.3.2 Das Prinzip der Indifferenz

2.3.3.3 Paradoxien des Indifferenzprinzips

2.3.4 Aufgaben

2.4 Entscheidungen unter Risiko

3 Zur Theorie der Kollektiven Entscheidungen

4 Wahrscheinlichkeitsrechnung

5 Neumann-Morgensternsche Nutzentheorie

6 Spieltheorie

7 Kritische Reflexion

8 Beispielklausur

Literaturverzeichnis

2.3.3 Weitere Entscheidungsregeln auf Basis des kardinalen Nutzens

2.3.3.1 Die Optimismus-Pessimismus Regel

Für die Theorie- und Modellbildung ist der kardinale Nutzen deshalb so vorteilhaft, weil er es erlaubt, in einem gewissen Rahmen mit Nutzenwerten zu rechnen. Mit Hilfe des kardinalen Nutzenbegriffs können wir daher nicht nur endlich guten Gewissens die Minimax-Bedauerns-Regel anwenden, sondern gleich auch eine ganze Reihe weiterer Entscheidungsregeln erfinden. Eine davon ist die „Optimismus-Pessimismus“-Regel. Diese Regel funktioniert folgendermaßen: Zunächst legen wir einen Optimismusindex $a$ fest, der zwischen 0 und 1 liegen muss. Dann wählen für jede Handlung (also aus jeder Zeile der Entscheidungstabelle) das beste und das schlechteste mögliche Ergebnis aus. Das beste Ergebnis können wir der Einfachheit halber mit $MAX$ bezeichnen, das schlechteste nennen wir $min$ . Nun berechnen wir für jede Handlung eine Bewertung $R_a$ („R“ wie „rating“) nach folgender Formel: $\begin{eqnarray}R_a = aMAX + (1-a)min \end{eqnarray}$

Schließlich wählen wir diejenige Handlung aus, für die $R_a$ am größten ist. Welche Handlung gewählt wird hängt dabei ganz wesentlich von der Wahl des Optimismusindex $a$ ab. Aber das ist auch gewollt, denn bei dieser Entscheidungsregel geht es darum zuerst festzulegen, wie „optimistisch“ man sein möchte, und dann auf dieser Grundlage die eigentliche Entscheidung zu treffen. Die beiden Grenzfälle $a=0$ und $a=1$ entsprechen übrigens haargenau der letzte Woche besprochenen Maximin ( $a=0$ ) und Maximax-Regel ( $a=1$ ). Die Anwendung der Regel kann an folgendem Beispiel verdeutlicht werden:

	S1	S2	S3
A1	9	1	2
A2	5	6	3

Für a = 0.5 ergibt sich:

$\begin{eqnarray*}& R_{A1} = 0.5 \cdot 9 + 0.5 \cdot 1 = 5.0 & \\ & R_{A2} = 0.5 \cdot 6 + 0.5 \cdot 3 = 4.5 & \\ \end{eqnarray*}$

Bei einem Optimismus-Index von 0.5 sollte also die Handlung A1 gewählt werden.

Für a = 0.2 ergibt sich dagegen:

$\begin{eqnarray*}& R_{A1} = 0.2 \cdot 9 + 0.8 \cdot 1 = 2.6 & \\ & R_{A2} = 0.2 \cdot 6 + 0.8 \cdot 3 = 3.6 & \\ \end{eqnarray*}$

In diesem Fall sollte die Handlung A2 gewählt werden.

Die Handlungsempfehlung, die sich aus der Anwendung der Optimismus-Pessimismus-Regel ergibt, hängt wie zu erwarten von der Wahl des Optimismusindex ab. Auch wenn diese Wahl willkürlich ist, stellt sich doch die Frage, ob es ein Verfahren gibt, um die Wahl wenigstens sinnvoll zu treffen, oder anders formuliert: Woher weiss ich eigentlich wie optimistisch ich sein will? Ein Verfahren, das zu Bestimmung des Index vorgeschlagen worden ist, ist dieses (vgl. (Resnik 1987, S. 33)): Man nehme die folgende einfache Entscheidungstabelle, in welcher in der ersten Zeile die Nutzenwerte 0 und 1 (einer beliebigen kardinalen Nutzenskala) und in der zweiten Zeile in beiden Spalten ein unbekanntes Ergebnis x eingetragen worden ist:

	S1	S2
A1	0	1
A2	x	x

Dabei soll diesmal die Frage nicht lauten, welche Handlung gewählt werden soll (um ein möglichst gutes Ergebnis zu erzielen), sondern es soll vielmehr schon vorgegeben sein, dass wir zwischen den Handlungen A1 und A2 indifferent sind. Nun müssen wir x genau so groß wählen, dass wir zwischen A1 und A2 tatsächlich indifferent sind. Haben wir x entsprechend gewählt, dann können wir daraus den Optimismus-Pessimismusindex ableiten, denn auf Grund der Indifferenz gilt:

$\begin{eqnarray*}R_{A1} & = & R_{A2} \\ a \cdot 1 + (1-a) \cdot 0 & = & a \cdot x + (1-a) \cdot x \\ a & = & x \end{eqnarray*}$

Was ist damit gewonnen? Wir haben auf diese Weise die Wahl des Optimismusindex aus der Wahl (bzw. Entscheidung im dezisionistischen Sinne) über die Indifferenz zwischen zwei Handlungsalternativen abgeleitet. Wenn man annimmt, dass es leichter ist, anzugeben, ob man zwischen zwei Alternativen indifferent ist, als die Frage zu beantworten, wie hoch man den eigenen Optimismus auf einer Skala zwischen 0 und 1 einschätzt, dann vereinfacht das die Wahl des Optimusmusindex. Wir hätten dann eine Willkürentscheidung auf eine andere zurückgeführt, die zu treffen uns möglicherweise leichter fällt.

Allerdings wirkt dieses Verfahren etwas gezwungen. Vor allem gibt es einen gravierenden Einwand: Die Frage wie optimistisch oder pessimistisch man entscheiden sollte, oder, was auf dasselbe hinausläuft, wie risikofreudig oder risikoavers man sich verhält, dürfte von den meisten Menschen hochgradig situationsspezifisch beantwortet werden. Insofern erscheint es äußerst fragwürdig, einen Optimismusindex, den man durch ein abstraktes Gedankenexperiment bestimmt hat, auf irgendeine konkrete Entscheidungssituation zu übertragen, der man möglicherweise ein ganz anderes Risikoverhalten zu Grunde legen möchte. Dann kann man sich das Gedankenexperiment besser gleich sparen und willkürlich bleibt die Entscheidung über den Optimismusindex ohnehin.

Dieses Willkürelement ist noch aus einem anderen Grund als dem der Schwierigkeit der Festlegung des Optimismusindex problematisch: Wenn eine Entscheidungsregel derartige Willkürelemente enthält, dann lädt sie geradezu dazu ein, zuerst die Entscheidung vollkommen intuitiv zu treffen, und sie erst im Nachhinein durch die Wahl eines geeigneten Index zu „rationalisieren“. Das könnte besonders dann problematisch werden, wenn die entscheidungtreffenden Personen anderen für ihre Entscheidung rechenschaftspflichtig sind, denn es lässt sich dann nicht mehr nachvollziehen, ob die Entscheidung tatsächlich „verantwortlich“ getroffen wurde.

Daneben ist die Optimismus-Pessimismus-Regel mit ähnlichen Schwierigkeiten behaftet, wie die Maximin und die Minimax-Bedauerns-Regel. Da sie jeweils nur zwei Werte jeder Zeile in das Kalkül einbezieht, lassen sich leicht Fälle konstruieren, in denen sie unplausibel erscheint:

	$S_1$	$S_2$	$S_3$		$S_{99}$	$S_{100}$
$A_1$	2	1	1	$\cdots$	1	0
$A_2$	2	0	0	$\cdots$	0	0

In diesem Fall würde die Optimismus-Pessimismus-Regel immer zur Indifferenz zwischen beiden Handlungen führen, obwohl intuitiv die Handlung A1 sicherlich als die bessere beurteilt werden müsste.

Schließlich existiert noch ein weiterer Einwand, der auf einer etwas raffinierteren Konstruktion beruht, nämlich auf der sogenannten „Mischungsbedingung“ (mixture-condition), die - leicht vereinfacht - besagt: Wenn eine Person indifferent zwischen zwei Handlungsalternativen ist, dann ist sie auch indifferent zwischen diesen beiden Handlungen und einer dritten Handlung, die darin besteht, eine Münze zu werfen und bei „Kopf“ die erste Handlung und bei „Zahl“ die zweite Handlung zu wählen. Betrachten wir die folgende Tabelle:

	S1	S2
A1	0	1
A2	1	0

Nach der Optimismus-Pessimismus-Regel herrscht zwischen beiden Handlunsalternativen völlige Indifferenz, und zwar unabhängig von der Wahl des Optimismusindex a. Fügt man nun die Münzwurfalternative hinzu, dann ergibt sich folgende Entscheidungstabelle:[15]

	S1	S2
A1	0	1
A2	1	0
A3	$\frac{1}{2}$	$\frac{1}{2}$

Angenommen der Optimismus-Pessimismus-Index wäre $a = \frac{2}{3}$ . Dann ergibt sich daraus:

$\begin{eqnarray*}R_{A1} & = \frac{1}{3} \cdot 0 + \frac{2}{3} \cdot 1 = & 2/3 \\ R_{A2} & = \frac{2}{3} \cdot 1 + \frac{1}{3} \cdot 0 = & 2/3 \\ R_{A3} & = \frac{2}{3} \cdot \frac{1}{2} + \frac{1}{3} \cdot \frac{1}{2} = \frac{1}{2} \end{eqnarray*}$

Nach der Optimismus-Pessimismus-Regel müssten die Handlungen A1 und A2 der „Münzwurfalternative“ vorgezogen werden, unter Verletzung der Mischungsbedingung. Die Mischungsbedingung lässt sich nur erfüllen, wenn das beste und das schlechteste mögliche Ergebnis genau gleich gewichtet werden, d.h. bei einem Optimismusindex von $a=\frac{1}{2}$ .

Wie auch bei den denkbaren Einwänden gegen die anderen Entscheidungsregeln, lässt sich darüber streiten, ob die Verletzung der „Mischungsbedingung“ ein Nachteil oder, eher im Gegenteil, eine besondere Eigenschaft der Optimismus-Pessimismus-Regel ist. („It's not a bug, it's a feature!“) Wenn jemand optimistisch ist, dann besagt das ja gerade, dass die Person eher geneigt ist, an den Erfolg zu glauben als an eine 50:50 Chance von Erfolg und Misserfolg, so dass es nicht verwunderlich ist, dass sie eine Handlung, an deren Erfolg sie glaubt, einem Münzwurf vorzieht, von dem sie weiß, dass die Chancen gleichverteilt sind. Widersprüchlich wäre das optimistische (oder pessimistische) Verhalten bei der gegebenen Entscheidungstabelle aber immer noch insofern, als die Person eigentlich nur entweder an den mehr als 50%-igen Erfolg von S1 oder von S2 glauben dürfte, aber - sofern die Zustände S1 und S2 von den Handlungen unabhängig sind - nicht daran, dass sie in jedem Fall die höheren Erfolgschancen hat.

[15] Bei der Nutzenbewertung der Ergebnisse der Münzwurfhandlung wurde implizit bereits die Erwartungsnutzenhpyothese zugrunde gelegt, die besagt, dass der Erwartungsnutzen gleich dem erwarteten Nutzen multipliziert mit der Eintrittswahrscheinlichkeit ist. Strenggenommen kann auch das Ergebnis der Münzwurfhandlung nur 0 oder 1 sein.