Vorlesungsskript: Grundlagen des Entscheidens I

Eckhart Arnold

Inhalt

1 Vorwort

2 Techniken des Entscheidens

2.1 Entscheidungstabellen und -bäume

2.2 Entscheidungen unter Unwissenheit I

2.2.1 Die einfachste Entscheidungsregel: Das Prinzip der Dominanz

2.2.2 Präferenzen

2.2.3 Ordinale Nutzenfunktionen

2.2.4 Entscheidungsregeln auf Basis des ordinalen Nutzens

2.2.5 Aufgaben

2.3 Entscheidungen unter Unwissenheit II

2.4 Entscheidungen unter Risiko

3 Zur Theorie der Kollektiven Entscheidungen

4 Wahrscheinlichkeitsrechnung

5 Neumann-Morgensternsche Nutzentheorie

6 Spieltheorie

7 Kritische Reflexion

8 Beispielklausur

Literaturverzeichnis

2.2.2 Präferenzen

In der letzten Vorlesungsstunde wurde als Beispiel für ein mögliches Entscheidungsproblem, bei dem uns die Entscheidungstheorie nicht weiterhelfen kann, die Frage angeführt, ob der nächste Urlaub lieber in den Bergen oder an der See gebucht werden sollte. Der Grund, weshalb uns die Entscheidungstheorie hier nicht weiterhelfen kann, besteht darin, dass es bei diesem Entscheidungsproblem noch darum geht, wie die verschiedenen Ergebnisse der Entscheidung zu bewerten sind. Grundsätzlich setzt die Entscheidungstheorie voraus, dass wir uns über die Bewertung der möglichen Ergebnisse, sprich über unsere Präferenzen schon im Klaren sind. Im Folgenden ist daher zunächst einiges über Präferenzen zu sagen, insbesondere welche Anforderungen an die Präferenzen gestellt werden müssen, damit sie im Sinne der Entscheidungstheorie wohlgeformt sind.

Unter Präferenz ist im Zusammenhang der Entscheidungstheorie eine Relation zu verstehen, die festlegt, wann ein mögliches Resultat[6] eines Entscheidungsprozesses einem anderen vorgezogen wird. (Da wir es mit Entscheidungsproblemen zu tun haben, bezieht sich unsere Präferenzrelation auf die möglichen Resultate von Entscheidungsprozessen. In der Ökonomie würde man die Präferenzrelation dagegen eher auf der Menge möglicher „Güterbündel“ oder dergleichen definieren. Der Einfachtheit halber wird daher im Folgenden auch oft von „Gütern“ anstelle von „Resultaten“ oder „Ergebnissen“ die Rede sein.) Wenn $x$ und $y$ zwei mögliche Resultate eines Entscheidungsprozesses sind, dann schreiben wir $x \succ y$ , um auszudrücken, dass $x$ gegenüber $y$ vorgezogen wird. Und wir schreiben $x \sim y$ , wenn $x$ und $y$ gleich gut bewertet werden bzw. wenn diejenige Person, die die Entscheidung trifft, zwischen $x$ und $y$ indifferent ist. Eine wohlgeformte Präferenzrelation muss folgende fundamentale Eigenschaften erfüllen:

Antisymmetrie: Wenn $x \succ y$ , dann nicht $y \succ x$ und auch nicht $x \sim y$
Zusammenhang: Für jedes Paar $x, y$ aus der Menge der möglichen Resultate gilt entweder $x \succ y$ oder $y \succ x$ oder $x \sim y$
Transitivität: Wenn $x \succ y$ und $y \succ z$ , dann auch $x \succ z$ . (In analoger Weise gilt: $x \sim y \wedge y \sim z \Rightarrow x \sim z$ , sowie weiterhin: $x \sim y \wedge y \succ z \Rightarrow x \succ z$ und: $x \succ y \wedge y \sim z \Rightarrow x \succ z$ )

Mit welchem Recht können wir fordern, dass eine Präferenzrelation diese Eigenschaften erfüllen muss? Man kann diese Frage von zwei Seiten aus betrachten: 1) von der Seite des entscheidungstheoretischen Formalismus aus und 2) von der empirischen und normativen Seite aus. Von der Seite des entscheidungstheoretischen Formalismus stellt sich die Situation so dar, dass z.B. bestimmte Lösungsverfahren nur dann tatsächlich richtige (d.h. die Präferenzen optimal erfüllende) Entscheidungen liefern, wenn die Präferenzrelation in dem oben beschriebenen Sinne wohlgeformt ist; und zwar schon deshalb, weil die entsprechenden Lösungsverfahren unter genau dieser Voraussetzung entwickelt worden sind. Anderseits gilt aber auch, dass die Entscheidungstheorie beansprucht unser Handeln beschreiben (empirische Anwendung der Entscheidungstheorie) und richtig anleiten (normative Anwendung der Entscheidungstheorie) zu können. Dann sollten diese Eigenschaften auch den Eigenschaften von Präferenzen von Menschen in empirischen Entscheidungssituationen mehr oder weniger entsprechen.[7] Kann man das ungeprüft voraussetzen? Wenigstens bei den Eigenschaften der Transitivität und des Zusammenhangs sind in dieser Hinsicht erhebliche Abstriche zu machen.

Zur Tansitivität: Wie könnte man zunächst einmal die Eigenschaft der Transitivität rechtfertigen? Ein beliebtes Argument zur Rechtfertigung dieser Eigenschaft ist das sogenannte Geldpumpenargument. Angenommen, es gibt jemanden, dessen Präferenzen nicht transitiv sind. Dann gibt es drei Weltzustände (bzw. „Resultate“ oder „Güterbündel“) $a, b, c$ , für die für diese Person gilt: $a \prec b \prec c \prec a$ . Wenn diese Person aber b gegen über a vorzieht, so bedeutet dass (wie die Ökonomen glauben), dass sie gegebenenfalls bereit wäre, für den Übergang von a zu b einen bestimmten Geldbetrag zu zahlen. Dann wäre sie aber wiederum bereit einen Geldbetrag für den Übergang von b zu c bezahlen. Ist sie aber erst einmal bei c angekommen, dann würde sie wegen $c \prec a$ nochmals bereit sein für den Übergang zu a in die Tasche zu greifen, und das ganze Spiel fängt von vorne an und könnte beliebig oft wiederholt werden. Die Überlegung zeigt, dass intransitive Präferenzen in gewisser Weise unplausibel bzw. inkonsequent sind.

Allerdings gibt es ebenso Beispiele dafür, dass Präferenzen auf ganz natürliche Wese transitiv sein können, z.B. das folgende (Delong 1991, S. 20): Frau Schmidt möchte einen Schachcomputer kaufen. Es gibt drei Modelle, A, B und C. Einem Testbericht kann sie entnehmen, dass Modell A in einem Probespiel Modell B geschlagen hat. Modell B hat wiederum Modell C geschlagen, aber Modell C hat Modell A geschlagen. (Man kann sich überlegen, dass diese Situation sehr wohl möglich ist, denn es ist denkbar, dass der Algorithmus von Modell A mit dem von Modell B sehr gut „klarkommt“, aber nicht mit dem von Modell C, auch wenn Modell C schlechter als Modell B ist.) Die einzig sinnvollen Präferenzen, die Frau Schmidt in Bezug auf die Schachcomputer haben kann, sind in diesem Fall intransitiv, nämlich $A \succ B \succ C \succ A$ . Man kann leicht andere Beispiele dieser Art konstruieren. Der Grund für die, in diesem Fall, sinnvolle Intransitivität von Präferenzen liegt darin, dass sich unsere Präferenzen häufig an objektive Beziehungen wie „stärker als“, „besser als“, „Sieger über“ etc. knüpfen, die ihrerseits oftmals nicht transitiv sind. (So ist ja auch z.B. von der Fussballmanschaft an der Spitze der Liga keineswegs gesagt, dass sie alle anderen Mannschaften besiegt oder mindestens unentschieden gespielt hat.)

Wenn es aber sinnvolle transitive Präferen gibt, was wird dann aus dem Geldpumpenargument, könnte man nun fragen. Die Antwort darauf ist, dass man dann, wenn intransitive Präferenzen auftreten, verschiedene Mechanismus anwenden kann, um mit den möglicherweise daraus resultierenden Problemen fertig zu werden. In dem Beispiel von eben könnte Frau Schmidt sich einfach beliebig für irgendeinen der Schachcomputer entscheiden oder ein Los werfen. (Dass es einem raffinierten Verkäufer tatsächlich gelingen könnte, eine Geldpumpe aus ihr zu machen, ist wohl eher unrealistisch[8] )

Ganz besonders stellt sich das Problem intransitiver oder, ganz allgemein gesprochen, inkonsistenter Präferenzn im Zusammenhang von Kollektivpräferenzen (d.h. den gemeinsamen Präferenzen eines Kollektivs von Menschen). Wie wir gesehen haben, sind schon die Präferenzen einzelner Menschen nicht immer transitiv geordnet (und zwar nicht bloß auf Grund von Inkonsequenz oder menschlicher Unvollkommenheit, sondern weil es manchmal durchaus Sinn hat, wenn Präferenzen nicht transitiv sind!). Diese Situation tritt nocht viel leichter auf, wenn wir vor dem Problem stehen, aus den Einzelpräferenzen einer Vielzahl von Individuuen eine sinnvolle kollektive Präferenz abzuleiten. Denn dazu müsste irgendein geeigneter Abstimmungsmechanismus vorhanden sein, der es erlaubt aus den vielfältigen und möglicherweise höchst disparaten Interessen der Einzelnen eine gemeinsame Zielvorstellung zu bilden. Es gehört nun aber zu den interessantesten Theoremen der Social-Choice Theory, die unter Stichworten wie „Paradox des Liberalismus“ und „Satz von Arrow“ bekannt geworden sind, dass einen solchen Abstimmungsmechanismus zu finden nicht immer leicht und manchmal sogar unmöglich ist, sofern bestimmte Anforderungen an die Fairness und die Vernunft eines solchen Abstimmungsmechanismus gestellt werden. (Inwiefern diese Anforderungen notwendig sind oder variiert werden können, so dass die „Probleme“ nicht mehr auftreten, ist dann Gegenstand der Diskussion.) Wir werden auf diese Theoreme im Laufe dieses Semesters noch ausführlich eingehen (Kapitel 3.1.2 und 3.1.3 dieses Skripts).

Eine weitere Einschränkung der Gültigkeit der Annahme transitiver Präferenzen ergibt sich aus folgender Überlegung (Resnik 1987, p. 23/24): Man stelle sich zwei Tassen Kaffe vor, eine ohne Zucker und eine, die eine sehr kleine Menge Zucker enthält, gerade so viel, dass man den Zucker beim Trinken noch nicht bemerkt. Jemand, der entscheiden sollte, welche Tasse Kaffee er vorzieht, würde also indifferent zwischen diesen beiden Kaffeetassen sein, auch wenn er vielleicht gezuckerten Kaffee bevorzugt. Nun denken wir uns eine dritte Kaffeetasse, die wiederum ein klein wenig mehr Zucker enthält als die zweite, aber nicht so viel mehr, als dass man den Unterschied bemerken könnte. Dann, eine vierte Kaffeetasse, die sich wiederum von der dritten durch einen nur marginal größeren Zuckergehalt unterscheidet usw. Irgendwann haben wir dann eine Kaffeetasse, die soviel Zucker enthält, dass sich der Geschmack von dem der allerersten Kaffeetasse deutlich unterscheidet. Dann würde jemand, der gezuckerten Kaffee bevorzugt, diese letzte Tasse unseres Gedankenexperiments der ersten Tasse sicherlich vorziehen, was aber im Widerspruch zur Transitivität der Indifferenzbeziehung steht. Das Gedankenexperiment ist zudem so konstruiert, dass es sich in diesem Fall nicht um ein Beispiel von Inkonsequenz oder Irrationalität handelt, sondern dass sich die Transitivität der Präferenzrelation „beim besten Willen“ nicht aufrecht erhalten lässt. Wenn wir das Gedankenexperiment als glaubhaft ansehen, dann bleibt uns nichts weiter übrig als zuzugestehen, dass wir in der Wirklichkeit nicht immer von transitiven Präferenzen ausgehen können, und dass die Präferenzrelation, so wie sie hier definiert ist, lediglich eine bessere oder manchmal auch schlechtere Annhährung an die Wirklichkeit darstellt. Man kann bereits an dieser Stelle antizipieren, dass unsere Modelle und Theorien spätestens dann in Schwierigkeiten geraten, wenn sie irgendwann einmal, und möglicherweise völlig unbemerkt (!), innerhalb einer komplizierten mathematischen Beweisführung allzu starke Anforderungen an die Gültigkeit von Indifferenzbeziehungen stellen.[9]

Der tiefere Grund für das eben beschriebene Problem besteht darin, dass Relationen vom Typ „ungefähr gleich wie“ im Gegensatz zu Relationen vom Typ „gleich wie“ nicht (vollkommen) transitiv sind. Da wir es in der Empirie aber schon auf Grund von Messungenauigkeiten fast immer mit dem ersteren Typ zu tun haben, kann das zu Problemen führen, wenn man vollständige (d.h. über eine beliebig große Anzahl von Zwischengliedern erhalten bleibende) Transitivität voraussetzt.

Neben der Transitivität, lässt sich aber auch in Zweifel ziehen, ob man stets davon ausgehen kann, dass unsere Präferenzen zusammenhängend sind. Zumindest wenn wir eine größere und nicht mehr ohne Weiteres überschaubare Menge von Gütern (oder möglichen Entscheidungsresultaten) betrachten, kann man sich leicht vorstellen, dass es nicht mehr so ohne Weiteres möglich ist, von jedem Paar aus dieser Menge eindeutig zu sagen, welche der Relationen $\succ$ , $\prec$ oder $\sim$ zwischen den beiden Gliedern des Paars besteht. Einige Autoren wie z.B. (Kaplan 1996), die die Voraussetzung durchgehend zusammenhängender Präferenzen für allzu artifiziell halten, führen deshalb neben der Beziehung der Indifferenz, die besteht, wenn wir zwei Güter gleich hoch schätzen, eine davon deutlich zu unterscheidende Beziehung der Unentschiedenheit oder auch „Unentschlossenheit“ ein, die dann besteht, wenn wir nicht sicher sind, ob wir eine Sache einer anderen vorziehen oder nicht, was ja etwas anderes ist, als wenn wir eine Sache als genauso gut bewerten wie eine andere. Dieser Unterschied ist recht subtil, denn man kann sowohl hinsichtlich der Indifferenz als auch hinsichtlich der Unentschiedenheit mit Recht sagen, dass wir weder den einen noch den anderen der beiden Gegenstände, zwischen denen wir indifferent bzw. unentschieden sind, dem anderen vorziehen. Trotzdem ist es noch etwas anderes, wenn wir es deshalb nicht tun, weil sie uns beide gleich lieb sind, oder deshalb, weil wir unentschieden zwischen beiden sind.

Die Annahme, dass es so etwas wie Unentscheidenheit gibt, erscheint besonders bei unüberschaubar großen Gegenstandsmengen oder bei solchen Gegenstandsmengen, die Güter von sehr unterschiedlicher Art enthalten, sehr viel realistischer, denn anderenfalls würde man voraussetzen, dass die Frage, welches von zwei Gütern man vorzieht, oder ob man sie beide als gleichwertig beurteilt, immer schon entschieden ist, selbst wenn wir sie uns im konkreten Fall noch gar nicht vorgelegt haben. Aber es ist immerhin möglich, eine Entscheidungstheorie auch auf der Grundlage zu konstruieren, dass es neben Bevorzugung und Indifferenz auch so etwas wie Untschlossenheit gibt. In diesem Fall muss man die Forderung, dass die Präferenzen „zusammenhängend“ sind, zu der Eigenschaft des beschränkten Zusammenhangs abschwächen (Kaplan 1996, S. 13, 24). Noch weiter geht der Ansatz, die Entscheidungstheorie nicht „präferenzbasiert“, sondern „wahlbasiert“ aufzubauen (Mascolell/Whinston/Green 1995, SEITE???). Dabei wird statt einer Präferenzrelation über einer Menge von Alternativen (präferenzbasierter Ansatz) eine Wahlfunktion definiert, die aus Teilmengen einer Menge von Alternative die bevorzugte Alternative innerhalb dieser Teilmenge auswählt (wahlbasierter Ansatz). Die Formulierung der Entscheidungstheorie gestaltet sich dadurch technisch etwas komplizierter. Wir werden im Folgenden daher nur den präferenzzentrierten Ansatz zu Grunde legen und der Einfachheit halber davon ausgehen, dass es keine Unentschiedenheit gibt bzw. dass alle denkbaren Unentscheidenheiten im Vorfeld der Entscheidungsfindung geklärt worden sind. Rechtfertigen lässt sich das auf jeden Fall solange, wie wir uns auf Anwendungsfälle nur mit sehr begrenzten und überschaubaren Zielmengen beschränken. Zudem setzen wir eine gültige Präferenzrelation nur jeweils lokal für das in Frage stehende Entscheidungsproblem voraus. Wir unterstellen nicht, dass irgendjemand „global“ (d.h. bezüglich aller Ziele und Wünsche, die man im Leben haben kann) über wohlgeordnete (d.h. transitive und durchgängig zusammenhängende) Präferenzen verfügt.

[6] Die Resultate eines Entscheidungsprzesses sind nicht zu verwechseln mit der Entscheidung selbst. Das Resultat ist vielmehr das, was bei einer Entscheidung heraus kommt, die Entscheidung selbst ist die Wahl, die man trifft, um dann ggf. ein bestimmtes Resultat zu erzielen. Die Präferenzen, von denen hier die Rede ist beziehen sich zunächst auf die Resultate, auch wenn man im übertragenen Sinne ebenfalls davon sprechen könnten, dass eine Entscheidung einer anderen vorgezogen wird, weil man sich von ihr ein besseres Resultat erhofft.

[7] Insgesamt haben wir es hier mit drei Perspektiven auf die Entscheidungstheorie zu tun: 1. der logischen; 2. der empirischen; 3. der normativen. Häufig wird nur zwischen den letzteren beiden unterschieden. Dabei wird dann in der Regel eingeräumt, dass die Entscheidungstheorie zwar das empirisch beobachtbare Verhalten von Menschen nicht richtig beschreibt. Aber meistens wird dennoch darauf bestanden, dass sie in normativer Hinsicht dennoch zu richtigen Entscheidungen anleitet. Das stimmt insofern, als die normative Anwendung vergelichsweise schwächere erkenntnistheoretische Rechtfertigungsprobleme aufwirft als die empirische, aber auch die normative Anwendung beruht immer noch auf bestimmten empirischen Voraussetzungen, wie z.B. der, dass wohlgeformte Präferenzrelationen die empirischen Phänomene der Präferenz (d.i. des Vorziehens, des Beabsichtigens, des Wertschätzens etc.) halbwegs richtig erfassen. Vgl. dazu die klassische Darstellung von Savage (Savage 1954, S. 7ff.), der hinsichtlich solcher subtiler Unterscheidungen im Übrigen sehr umsichtig und genau verfährt.

[8] Rabin und Thaler formulieren es sehr treffend: „It does not seem to us obvious that if you can take some of a fool’s money from him some of the time then you can take all of his money all of the time“. (Rabin/Thaler 2001, S. 227) Den Hinweis auf den Artikel von Rabin und Thaler verdanke ich Matthias Brinkmann.

[9] An diesem Problem leidet ganz wesentlich die mathematische Rückführung kardinaler auf ordinale Präferenzen, die in Kapitel 5.1 und 5.2 vorgestellt und diskutiert wird.