Vorlesungsskript: Grundlagen des Entscheidens I

Eckhart Arnold

Inhalt

1 Vorwort

2 Techniken des Entscheidens

2.1 Entscheidungstabellen und -bäume

2.2 Entscheidungen unter Unwissenheit I

2.3 Entscheidungen unter Unwissenheit II

2.3.1 Die Minimax-Bedauerns-Regel

2.3.2 Kardinaler Nutzen

2.3.3 Weitere Entscheidungsregeln auf Basis des kardinalen Nutzens

2.3.4 Aufgaben

2.4 Entscheidungen unter Risiko

3 Zur Theorie der Kollektiven Entscheidungen

4 Wahrscheinlichkeitsrechnung

5 Neumann-Morgensternsche Nutzentheorie

6 Spieltheorie

7 Kritische Reflexion

8 Beispielklausur

Literaturverzeichnis

2.3.1 Die Minimax-Bedauerns-Regel

Von den bisher besprochenen Entscheidungsregeln ist die Maximin-Regel wahrscheinlich die einleuchtendste und sinnvollste, aber wir haben auch schon ein Beispiel kennen gelernt, bei dem ihre Anwendung möglicherweise nicht sinnvoll wäre, und man kann weitere Beispiele konstruieren, bei denen das noch deutlicher der Fall ist, z.B. das folgende:

	$S_1$	$S_2$
$A_1$	€ 1,25	€ 1,50
$A_2$	€ 1,00	€ 50.000

Nach der Maximin-Regel müsste die Entscheidung zugunsten der Handlung $A_1$ ausfallen. Aber ist es sinnvoll, sich die Chance auf € 50.000 entgehen zu lassen, nur um einen möglichen Verlust von 25 Cent zu vermeiden? Wenn man nicht gerade eine Geschichte erfindet, bei der von diesen 25 Cent Leben und Tod abhängen, erscheint das mehr als zweifelhaft. Um Situationen wie dieser gerecht zu werden, gibt es eine Regel, die darauf zielt, „verpasste Chancen“ zu vermeiden. Diese Regel ist die Minimax-Bedauerns-Regel (wohlbemerkt: diesmal heißt es „Minimax“ nicht „Maximin“!). Bei dieser Regel leitet man von der ursprünglichen Tabelle zunächst eine Bedauernstabelle ab, die für jede Entscheidung und jedes möglicherweise eintretende Ereignis (bzw. jeden möglichen Weltzustand) die Größe der verpassten Chance beziffert. Dann wählt man diejenige Entscheidung aus, bei der die größtmögliche verpasste Chance am kleinsten ist. Die Einträge in der Bedauernstabelle erhält man, indem man jeden Wert in der Tabelle vom Maximalwert derselben Spalte abzieht. Für das Beispiel von eben würde die Bedauernstabelle dann so aussehen:

	$S_1$	$S_2$
$A_1$	€ 0	€ 49.998,50
$A_2$	€ 0,25	€ 0

Das maximale Bedauern für die Handlung $A_1$ würde also mit € 49.998,50 zu beziffern sein, während bei der Wahl von $A_2$ schlimmstenfalls ein Verlust von 25 Cent verschmerzt werden müsste. Um das maximale Bedauern zu minimieren, muss nach der Minimax-Bedauernsregel also die Handlung $A_2$ gewählt werden.

Ähnlich wie die die Maximin-Regel kann man die Minimax-Bedauernsregel auch lexikalisch mehrfach hintereinander anwenden, wenn nicht gleich bei der ersten Anwendung eine eindeutige Entscheidung getroffen werden kann.

An dieser Stelle könnte jedoch ein Einwand erhoben werden: Beim Übergang von der Entscheidungstabelle zur Bedauernstabelle haben wir bestimmte Einträge in der Tabelle voneinander subtrahiert. Da es sich um Geldbeträge handelte, war das denkbar unproblematisch, denn jeder wird zugeben, dass man mit Geldbeträgen rechnen kann, und dass man sinnvollerweise davon sprechen kann dass € 3 dreimal so viel Wert sind wie € 1. Aber was ist, wenn wir es nicht mit Geldbeträgen, sondern wie zuvor mit ordinalen Nutzenwerten zu tun? Den vergleichsweise voraussetzungsarmen Begriff des ordinalen Nutzens haben wir ja gerade deshalb eingeführt, weil man mit anderen Werten als Geldbeträgen nicht unbedingt Rechnungen durchführen kann, selbst wenn sich die Größe des Wertes noch unterscheiden lässt. (Beispiel: Die meisten Menschen würden wohl zustimmen, dass Bier und Würstchen leckerer sind als Brot und Wasser, aber es wäre Unsinn zu sagen, sie sind genau dreimal so lecker.) Wenn wir eine Bedauernstabelle mit ordinalen Nutzenwerten berechnen würden, dann würde sich das Ergebnis, das bei der Anwendung der Minimax-Bedauerns-Regel herauskäme ändern, wenn wir die Nutzenwerte durch ordinal transformierte Nutzenwerte ersetzen, was bei einer robusten Entscheidungsregel nicht vorkommen sollte. Daher müssen wir entweder auf die Anwendung der Minimax-Bedauerns-Regel verzichten, oder wir dürfen sie nur dort anwenden, wo wir einen stärkeren Nutzenbegriff vorausetzen dürfen, wie er z.B. implizit den in den vorhergehenden Beispielen verwendeten Geldwerten zu Grunde liegt. Der schwächstmögliche stärkere Nutzenbegriff (stärker im Vergleich zum ordinalen Nutzen), der es uns erlaubt die Minimax-Bedauerns-Regel anzuwenden, ist der Begriff des kardinalen Nutzens.

Bevor wir jedoch auf den Begriff des kardinalen Nutzens eingehen, soll aber noch auf eine besondere Eigenschaft der Minimax-Bedauerns-Regel hingewiesen werden, die unter Umständen auch als ein Einwand gegen diese Regel begriffen werden kann: Die Minimax-Bedauerns-Regel verletzt nämlich - ebenso wie übrigens auf die Rangordnungsregel aus Kapitel 2.2.4.3 - das Prinzip der paarweisen Unabhängigkeit oder auch „Unabhängigkeit von dritten Alternativen“.[13] Fügt man den bestehenden Handlungsalternativen eine Handlungsalternative hinzu, so kann das selbst dann zu einer Änderung der Entscheidung führen, wenn die neu hinzugefügte Alternative nach der Minimax-Bedauerns-Regel sowieso nicht gewählt werden würde. Beispiel:

	Entscheidungstabelle							bdquo;Bedauerns“-tabelle
$A_1$	0	10	4	$A_1$	5	0	6
$A_2$	5	2	10	$A_2$	0	8	0

$A_1$	0	10	4	$A_1$	10	0	6
$A_2$	5	2	10	$A_2$	5	8	0
$A_3$	10	5	1	$A_3$	0	5	9

Quelle: Michael D. Resnik: Choices. An Introduction to Decision Theory, Minnesota 2000, S. 31.

Die Alternative A3 hat nach der Minimax-Bedauerns-Regel keine Chance gewählt zu werden. Dennoch übt ihre Präsenz Einfluss darauf aus, welche der beiden anderen Handlungsalternativen nach der Minimax-Bedauerns-Regel gewählt wird. Ist die Alternative A3 abwesend, so ist die Handlung A1 nach der Minimax-Bedauerns-Regel die beste Handlung. Fügt man die Alternative A3 hinzu, so ist A2 die beste Handlung.

Sollte man die Abhängigkeit von dritten Alternativen als eine Schwäche der Minimax-Bedauerns-Regel ansehen? Das hängt wiederum sehr davon ab, in welchem Zusammenhang die Entscheidungsregel angewandt wird. Da das Prinzip besonders in der Sozialwahltheorie eine große Rolle spielt, dazu einige Beispiele:

Resnik erzählt dazu in etwa die folgende Geschichte (Resnik 1987, S. 40): Stellen Sie sich vor, Sie sitzen in einem Restaurant und überlegen, ob Sie lieber ein Steak oder ein vegetarisches Gericht bestellen wollen. Eigentlich mögen Sie lieber Steak, aber da das Restaurant einen etwas heruntergekommenen Eindruck macht, haben Sie wegen der Fleischzubereitung so ihre Bedenken und tendieren eher zu einer vegetarischen Speise. Nun erzählt Ihnen die Dame vom Nebentisch, dass sie gerade ein vorzügliches Schnitzel gegessen hat. Sie selbst - nehmen wir an - mögen zwar kein Schnitzel, aber obwohl diese Alternative für Sie „irrelevant“ ist, wissen Sie nun, dass Sie der Fleischzubereitung in diesem Restaurant vertrauen können, und bestellen doch das Steak.
Frau Schmidt möchte ein Auto kaufen. Sie legt Wert darauf, dass es das teuerste und, wenn nicht das teuerste, dann doch wenigstens dass schnellste Auto von der ganzen Stadt ist. Also entscheidet sie sich gegen einen Porsche und für einen S-Klasse Mercedes, weil der teurer ist. Jetzt efährt sie aber, dass ihre Nachbarin Frau Klein sich kürzlich einen Rolls-Royce zugelegt hat. Einen Rolls-Royce kann sich Frau Schmitt aber sowieso nicht leisten. Da sie dann aber statt des teuersten wenigstens das schnellste Auto haben will, kauft sie sich nun doch nicht den Mercedes, sondern lieber den Porsche.
Ihre Wahl zwischen Porsche und Mercedes ist also nicht unabhängig von dritten Alternativen, auch diese für Frau Schmitt sowieso nicht in Frage kommen, wie in diesem Fall der Rolls Royce.
Machinas Paradox: Angenommen, eine Person habe die Wahl zwischen zwei Lotterien:
1. Lotterie: 99% Chance eine Reise nach Venedig zu gewinnen, 1% Chance eine Filmvorführung über Venedig zu gewinnen.
2. Lotterie: 99% Chance eine Reise nach Venedig zu gewinnen, 1% Chance zu Hause zu bleiben.
Im Sinne der Theorie müsste die erste Lotterie eindeutig bevorzugt werden, wenn man annimmt, dass einen Film über Venedig anzuschauen allemal interessanter ist, als zu Hause zu sitzen. Andererseits ist es durchaus plausibel sich vorzustellen, dass angesichts der sehr großen Chance eine Reise nach Venedig zu gewinnen, es doch noch erträglicher ist zu Hause zu bleiben, wenn man die Chance verpasst, als sich dann auch noch einen herrlichen Film über Venedig anschauen zu müssen.

Wenn man diese Argumentation akzeptiert, dann zeigt das Beispiel einmal mehr, dass die Annahme der Unabhängigkeit von dritten Alternativen, z.B. auf Grund solcher psychologischen Faktoren wie des Bedauerns, nicht immer zwingend oder auch nur glaubwürdig ist. Oder gäbe es vielleicht eine Möglichkeit, das Beispiel durch eine entsprechende Problemspezifikation, z.B. durch Einbeziehen des Bedauernsfaktors in die Konsequenz der Entscheidung, doch noch mit der Theorie zu vereinbaren? (Aufgabe 2.3.4!)
Mögliche Bedeutung der Rangordnung (Mackie 2003, S. 81): Wie bereits erwähnt ist auch die Rangordnungsregel nicht mit dem Prinzip der paarweisen Unabhängigkeit vereinbar. Hält man Entscheidungsregeln wie die Minimax-Bedauernsregel oder die Rangordnugnsregel für sinnvoll, so kann man diese Unvereinbarkeit statt gegen bestimmte Entscheidungsregeln umgekehrt auch gegen das Prinzip der paarweisen Unabhängigkeit ausspielen.
Vorgreifend auf die Sozialwahltheorie sei zur Illustration der möglichen Relevanz der Rangordnung von Präferenzen und damit auch der Relevanz von dritten Alternativen folgendes Beispiel diskutiert: Angenommen Napoleon habe die Präferenzen $b \succ a \succ c \succ d \succ e$ und Josephine $a \succ b \succ c \succ d \succ e$ . Es sei weiterhin angenommen, dass Napoleon und Josephine sich darauf einigen müssten, ob sie gemeinsam $a$ oder $b$ wählen wollen, und dass Napoleon sich nach langwierigen Diskussionen schließlich durchgestezt habe sie gemeinasm $b$ wählen.

Nun erhält Josephine eine Nachricht, die dazu führt, dass sie ihre Präferenzen dergestalt abändert, dass die Alternative $b$ nun für sie an die letzte Stelle rückt, so dass sie nun die Präferenzen $a \succ c \succ d \succ e \succ b$ hat.

Josephine teilt dies Napoleon mit, und bittet darum, auf Grund der geänderten Umstände die gemeinsame Entscheidung noch einmal zu überdenken. Napoleon antwortet ihr jedoch mit dem Hinweis auf das Prinzip der Unabhängikeit von „irrelevanten“ Alternativen, dass dies nicht erforderlich sei, da sich Josephines Präferenzen bezüglich $a$ und $b$ duch die neu eingetretenen Umstände nicht geändert hätten, so dass sie die Entscheidung zwischen $a$ und $b$ gar nicht beeinflussen dürften.

Sofern man Napoleons Antwort als unverschämt empfindet, ist dieses Beispiel ein Gegenbeispiel gegen die generelle Gültigkeit des „Prinzips des Unabhängigkeit von dritten Alternativen“. Das Beispiel zeigt, dass das Prinzip der Unabhängkeit von dritten Alternativen uns zwingt, von der Information über die Rangordnung der beiden zur Entscheidung anstehenden Alternativen innerhalb einer größeren Menge von Alternativen zu abstrahieren. Aber unter Umständen könnte diese Information wichtig sein, z.B. indem sie die Intensität einer Präferenz ausdrückt und sofern man der Ansicht ist, dass die Intensität der individuellen Präferenzen bei der Diskussion über gemeinsame Entscheidungen wie der von Napoleon und Josephine mitberücksichtigt werden sollte.

Man kann es auch so formulieren: Eine dogmatische Festlegung auf das Prinzip der Unabhängikeit von dritten Alternativen würde Entscheidungsprobleme wie das von Napoleon und Josephine aus dem Anwendungsbereich der Entscheidungstheorie ausschließen.

Wie man sieht können dritte Alternativen sehr wohl relevant für die relative Bewertung der anderen Alternativen sein. Insofern muss die Abhängigkeit von dritten („irrelevanten“) Alternativen nicht unbedingt als eine Schwäche der Entscheidungsregel aufgefasst werden. Aber es gibt andere Situationen, wo das durchaus der Fall sein kann, etwa bei Wahlen oder Abstimmungen, deren Ergebnis unter Umständen dadurch manipuliert werden könnte, dass man weitere, scheinbar irrelevante Alternativen zur Abstimmung stellt.[14] Insgesamt kann man sagen, dass das Prinzip der Unabhängigkeit von dritten Alternativen bzw. der paarweisen Unabhängigkeit nur dann aufgestellt werden sollte, wenn man zuvor sichergestellt hat, dass für die Entscheidung zwischen jedem Paar von Alternativen (bzw. für die relative Bewertung von jedem Paar von Alternativen) die Verfügbarkeit der anderen Alternativen tatsächlich irrelevant ist. In einer Entscheidungssituation, wo dies nicht der Fall ist, kann eine Theorie, die dieses Prinzip als Axiom einführt, nicht ohne Einschränkungen angewendet werden.

[13] Die dafür häufig auch verwendete Bezeichnung „Unabhängigkeit von irrelevanten Alternativen“ ist wegen ihrer Suggestivität irreführend. Es ist nämlich keineswegs immer so, dass dritte Alternativen grundsätzlich irrelevant sind.

[14] Theoretische Beispiele findet man in der entsprechenden Fachliteratur unter den Stichworten „Paradox of Voting“ und „Agenda Setting“ in Fülle (Mueller 2003, S. 112ff.). Die empirische Relevanz des vermeintlichen Problems zyklischer Mehrheiten wird jedoch inzwischen sehr stark in Zweifel gezogen (Green/Shapiro 1994, S. 147ff.). Praktisch spielen die Formen der Abstimmungsmanipulation, die in der Public Choice Literatur so ausführlich erörtert werden, keine Rolle, während andere, die womöglich viel wichtiger sind, von den Autoren der Public Choice Literatur nicht beachtet werden.