Vorlesungsskript: Grundlagen des Entscheidens I |
Inhalt |
Von den bisher besprochenen Entscheidungsregeln ist die Maximin-Regel wahrscheinlich die einleuchtendste und sinnvollste, aber wir haben auch schon ein Beispiel kennen gelernt, bei dem ihre Anwendung möglicherweise nicht sinnvoll wäre, und man kann weitere Beispiele konstruieren, bei denen das noch deutlicher der Fall ist, z.B. das folgende:
€ 1,25 | € 1,50 | |
€ 1,00 | € 50.000 | |
Nach der Maximin-Regel müsste die Entscheidung zugunsten der Handlung ausfallen. Aber ist es sinnvoll, sich die Chance auf € 50.000 entgehen zu lassen, nur um einen möglichen Verlust von 25 Cent zu vermeiden? Wenn man nicht gerade eine Geschichte erfindet, bei der von diesen 25 Cent Leben und Tod abhängen, erscheint das mehr als zweifelhaft. Um Situationen wie dieser gerecht zu werden, gibt es eine Regel, die darauf zielt, „verpasste Chancen“ zu vermeiden. Diese Regel ist die Minimax-Bedauerns-Regel (wohlbemerkt: diesmal heißt es „Minimax“ nicht „Maximin“!). Bei dieser Regel leitet man von der ursprünglichen Tabelle zunächst eine Bedauernstabelle ab, die für jede Entscheidung und jedes möglicherweise eintretende Ereignis (bzw. jeden möglichen Weltzustand) die Größe der verpassten Chance beziffert. Dann wählt man diejenige Entscheidung aus, bei der die größtmögliche verpasste Chance am kleinsten ist. Die Einträge in der Bedauernstabelle erhält man, indem man jeden Wert in der Tabelle vom Maximalwert derselben Spalte abzieht. Für das Beispiel von eben würde die Bedauernstabelle dann so aussehen:
€ 0 | € 49.998,50 | |
€ 0,25 | € 0 | |
Das maximale Bedauern für die Handlung würde also mit € 49.998,50 zu beziffern sein, während bei der Wahl von schlimmstenfalls ein Verlust von 25 Cent verschmerzt werden müsste. Um das maximale Bedauern zu minimieren, muss nach der Minimax-Bedauernsregel also die Handlung gewählt werden.
Ähnlich wie die die Maximin-Regel kann man die Minimax-Bedauernsregel auch lexikalisch mehrfach hintereinander anwenden, wenn nicht gleich bei der ersten Anwendung eine eindeutige Entscheidung getroffen werden kann.
An dieser Stelle könnte jedoch ein Einwand erhoben werden: Beim Übergang von der Entscheidungstabelle zur Bedauernstabelle haben wir bestimmte Einträge in der Tabelle voneinander subtrahiert. Da es sich um Geldbeträge handelte, war das denkbar unproblematisch, denn jeder wird zugeben, dass man mit Geldbeträgen rechnen kann, und dass man sinnvollerweise davon sprechen kann dass € 3 dreimal so viel Wert sind wie € 1. Aber was ist, wenn wir es nicht mit Geldbeträgen, sondern wie zuvor mit ordinalen Nutzenwerten zu tun? Den vergleichsweise voraussetzungsarmen Begriff des ordinalen Nutzens haben wir ja gerade deshalb eingeführt, weil man mit anderen Werten als Geldbeträgen nicht unbedingt Rechnungen durchführen kann, selbst wenn sich die Größe des Wertes noch unterscheiden lässt. (Beispiel: Die meisten Menschen würden wohl zustimmen, dass Bier und Würstchen leckerer sind als Brot und Wasser, aber es wäre Unsinn zu sagen, sie sind genau dreimal so lecker.) Wenn wir eine Bedauernstabelle mit ordinalen Nutzenwerten berechnen würden, dann würde sich das Ergebnis, das bei der Anwendung der Minimax-Bedauerns-Regel herauskäme ändern, wenn wir die Nutzenwerte durch ordinal transformierte Nutzenwerte ersetzen, was bei einer robusten Entscheidungsregel nicht vorkommen sollte. Daher müssen wir entweder auf die Anwendung der Minimax-Bedauerns-Regel verzichten, oder wir dürfen sie nur dort anwenden, wo wir einen stärkeren Nutzenbegriff vorausetzen dürfen, wie er z.B. implizit den in den vorhergehenden Beispielen verwendeten Geldwerten zu Grunde liegt. Der schwächstmögliche stärkere Nutzenbegriff (stärker im Vergleich zum ordinalen Nutzen), der es uns erlaubt die Minimax-Bedauerns-Regel anzuwenden, ist der Begriff des kardinalen Nutzens.
Bevor wir jedoch auf den Begriff des kardinalen Nutzens eingehen, soll aber noch auf eine besondere Eigenschaft der Minimax-Bedauerns-Regel hingewiesen werden, die unter Umständen auch als ein Einwand gegen diese Regel begriffen werden kann: Die Minimax-Bedauerns-Regel verletzt nämlich - ebenso wie übrigens auf die Rangordnungsregel aus Kapitel 2.2.4.3 - das Prinzip der paarweisen Unabhängigkeit oder auch „Unabhängigkeit von dritten Alternativen“.[13] Fügt man den bestehenden Handlungsalternativen eine Handlungsalternative hinzu, so kann das selbst dann zu einer Änderung der Entscheidung führen, wenn die neu hinzugefügte Alternative nach der Minimax-Bedauerns-Regel sowieso nicht gewählt werden würde. Beispiel:
Entscheidungstabelle | bdquo;Bedauerns“-tabelle | ||||||||
0 | 10 | 4 | 5 | 0 | 6 | ||||
5 | 2 | 10 | 0 | 8 | 0 | ||||
0 | 10 | 4 | 10 | 0 | 6 | |||
5 | 2 | 10 | 5 | 8 | 0 | |||
10 | 5 | 1 | 0 | 5 | 9 | |||
Quelle: Michael D. Resnik: Choices. An Introduction to Decision Theory, Minnesota 2000, S. 31.
Die Alternative A3 hat nach der Minimax-Bedauerns-Regel keine Chance gewählt zu werden. Dennoch übt ihre Präsenz Einfluss darauf aus, welche der beiden anderen Handlungsalternativen nach der Minimax-Bedauerns-Regel gewählt wird. Ist die Alternative A3 abwesend, so ist die Handlung A1 nach der Minimax-Bedauerns-Regel die beste Handlung. Fügt man die Alternative A3 hinzu, so ist A2 die beste Handlung.
Sollte man die Abhängigkeit von dritten Alternativen als eine Schwäche der Minimax-Bedauerns-Regel ansehen? Das hängt wiederum sehr davon ab, in welchem Zusammenhang die Entscheidungsregel angewandt wird. Da das Prinzip besonders in der Sozialwahltheorie eine große Rolle spielt, dazu einige Beispiele:
Ihre Wahl zwischen Porsche und Mercedes ist also nicht unabhängig von dritten Alternativen, auch diese für Frau Schmitt sowieso nicht in Frage kommen, wie in diesem Fall der Rolls Royce.
Im Sinne der Theorie müsste die erste Lotterie eindeutig bevorzugt werden, wenn man annimmt, dass einen Film über Venedig anzuschauen allemal interessanter ist, als zu Hause zu sitzen. Andererseits ist es durchaus plausibel sich vorzustellen, dass angesichts der sehr großen Chance eine Reise nach Venedig zu gewinnen, es doch noch erträglicher ist zu Hause zu bleiben, wenn man die Chance verpasst, als sich dann auch noch einen herrlichen Film über Venedig anschauen zu müssen.
Wenn man diese Argumentation akzeptiert, dann zeigt das Beispiel einmal mehr, dass die Annahme der Unabhängigkeit von dritten Alternativen, z.B. auf Grund solcher psychologischen Faktoren wie des Bedauerns, nicht immer zwingend oder auch nur glaubwürdig ist. Oder gäbe es vielleicht eine Möglichkeit, das Beispiel durch eine entsprechende Problemspezifikation, z.B. durch Einbeziehen des Bedauernsfaktors in die Konsequenz der Entscheidung, doch noch mit der Theorie zu vereinbaren? (Aufgabe 2.3.4!)
Vorgreifend auf die Sozialwahltheorie sei zur Illustration der möglichen Relevanz der Rangordnung von Präferenzen und damit auch der Relevanz von dritten Alternativen folgendes Beispiel diskutiert: Angenommen Napoleon habe die Präferenzen und Josephine . Es sei weiterhin angenommen, dass Napoleon und Josephine sich darauf einigen müssten, ob sie gemeinsam oder wählen wollen, und dass Napoleon sich nach langwierigen Diskussionen schließlich durchgestezt habe sie gemeinasm wählen.
Nun erhält Josephine eine Nachricht, die dazu führt, dass sie ihre Präferenzen dergestalt abändert, dass die Alternative nun für sie an die letzte Stelle rückt, so dass sie nun die Präferenzen hat.
Josephine teilt dies Napoleon mit, und bittet darum, auf Grund der geänderten Umstände die gemeinsame Entscheidung noch einmal zu überdenken. Napoleon antwortet ihr jedoch mit dem Hinweis auf das Prinzip der Unabhängikeit von „irrelevanten“ Alternativen, dass dies nicht erforderlich sei, da sich Josephines Präferenzen bezüglich und duch die neu eingetretenen Umstände nicht geändert hätten, so dass sie die Entscheidung zwischen und gar nicht beeinflussen dürften.
Sofern man Napoleons Antwort als unverschämt empfindet, ist dieses Beispiel ein Gegenbeispiel gegen die generelle Gültigkeit des „Prinzips des Unabhängigkeit von dritten Alternativen“. Das Beispiel zeigt, dass das Prinzip der Unabhängkeit von dritten Alternativen uns zwingt, von der Information über die Rangordnung der beiden zur Entscheidung anstehenden Alternativen innerhalb einer größeren Menge von Alternativen zu abstrahieren. Aber unter Umständen könnte diese Information wichtig sein, z.B. indem sie die Intensität einer Präferenz ausdrückt und sofern man der Ansicht ist, dass die Intensität der individuellen Präferenzen bei der Diskussion über gemeinsame Entscheidungen wie der von Napoleon und Josephine mitberücksichtigt werden sollte.
Man kann es auch so formulieren: Eine dogmatische Festlegung auf das Prinzip der Unabhängikeit von dritten Alternativen würde Entscheidungsprobleme wie das von Napoleon und Josephine aus dem Anwendungsbereich der Entscheidungstheorie ausschließen.
Wie man sieht können dritte Alternativen sehr wohl relevant für die relative Bewertung der anderen Alternativen sein. Insofern muss die Abhängigkeit von dritten („irrelevanten“) Alternativen nicht unbedingt als eine Schwäche der Entscheidungsregel aufgefasst werden. Aber es gibt andere Situationen, wo das durchaus der Fall sein kann, etwa bei Wahlen oder Abstimmungen, deren Ergebnis unter Umständen dadurch manipuliert werden könnte, dass man weitere, scheinbar irrelevante Alternativen zur Abstimmung stellt.[14] Insgesamt kann man sagen, dass das Prinzip der Unabhängigkeit von dritten Alternativen bzw. der paarweisen Unabhängigkeit nur dann aufgestellt werden sollte, wenn man zuvor sichergestellt hat, dass für die Entscheidung zwischen jedem Paar von Alternativen (bzw. für die relative Bewertung von jedem Paar von Alternativen) die Verfügbarkeit der anderen Alternativen tatsächlich irrelevant ist. In einer Entscheidungssituation, wo dies nicht der Fall ist, kann eine Theorie, die dieses Prinzip als Axiom einführt, nicht ohne Einschränkungen angewendet werden.
[13] Die dafür häufig auch verwendete Bezeichnung „Unabhängigkeit von irrelevanten Alternativen“ ist wegen ihrer Suggestivität irreführend. Es ist nämlich keineswegs immer so, dass dritte Alternativen grundsätzlich irrelevant sind.
[14] Theoretische Beispiele findet man in der entsprechenden Fachliteratur unter den Stichworten „Paradox of Voting“ und „Agenda Setting“ in Fülle (Mueller 2003, S. 112ff.). Die empirische Relevanz des vermeintlichen Problems zyklischer Mehrheiten wird jedoch inzwischen sehr stark in Zweifel gezogen (Green/Shapiro 1994, S. 147ff.). Praktisch spielen die Formen der Abstimmungsmanipulation, die in der Public Choice Literatur so ausführlich erörtert werden, keine Rolle, während andere, die womöglich viel wichtiger sind, von den Autoren der Public Choice Literatur nicht beachtet werden.