[...] Als Beispiel sind zwei Radfahrer bei der Tour de France zu nennen. Beide führen vor der letzten
und entscheidenden Etappe das Feld klar an. Einen Tag vor der letzten Etappe erfahren beide, dass
ein neues Dopingmittel entwickelt wurde, welches bei einer Dopingkontrolle nicht nachgewiesen
werden kann. Beide ziehen nun in Erwägung dieses zu konsumieren, da es einem Fahrer unter der
Vorraussetzung, dass der andere nicht dopt, einen wesentlichen Vorteil verschaffen würde. Sie sind
sich allerdings auch der gesundheitlichen Nebenwirkungen des Mittels bewusst, welche sie aber für
einen Vorteil gerne in Kauf nehmen würden. Greifen jedoch beide zum Doping, so ändert sich
nichts an der Ausgangssituation, da beide wieder die gleichen Gewinnchancen wie vorher haben.
Durch den zusätzlichen negativen Gesundheitseffekt ist diese Situation allerdings weniger
wünschenswert als die Ausgangsposition. Das Dilemma ist nun, dass sich die Situation, in der beide
zum Doping greifen, in jedem Fall einstellen wird. Beide haben einerseits den Anreiz einen Vorteil
zu erlangen und befürchten andererseits, dass der Gegner dopen könnte, wodurch die eigenen
Chancen geschmälert würden. Selbst wenn beiden das Dilemma im Vornhinein bewusst ist und sie
versuchen sich vorher abzusprechen, nicht zum Doping zu greifen, ist dies nutzlos, da sie dem Wort
des anderen nicht trauen können.
Die Frage, die sich nun stellt ist: Gibt es einen Weg aus diesem Dilemma? Mit dieser Frage setzen
sich schon seit den fünfziger Jahren eine Reihe von Wissenschaftlern auseinander. Diese Arbeit soll
einen groben Überblick über die Ergebnisse der Frage geben, wie man im Gefangenendilemma
Kooperation erreicht. Als erstes wird der Fall des einmaligen Spiels mit zwei Akteuren betrachtet.
Wie im vorliegenden Beispiel bereits erläutert gibt es hier keine Lösung, wenn das Spiel als solches
nicht verändert wird1. Im Anschluss daran soll auf den wiederholten Fall des Gefangenendilemmas
eingegangen. Es wird beschrieben, dass es unter bestimmten Bedingungen eine Lösung geben kann
und welche diese darstellen könnte. Der letzte Teil der Arbeit beinhaltet einen Ausblick und
wichtige Erkenntnisse aus dem wiederholten Gefangenendilemma mit mehr als zwei Personen.
Inhaltsverzeichnis
1 Einleitung
2 Kooperation im einperiodigen Gefangenendilemma
3 Kooperation im wiederholten Gefangenendilemma
3.1 Das Gefangenendilemma mit endlichem Zeithorizont
3.2 Das Gefangenendilemma mit unendlichem Zeithorizont
3.3 Tit For Tat: Die optimale Strategie?
3.4 Kritik an Tit for Tat
3.5 Kritik an der Entscheidungsregel für den „Schatten der Zukunft“
4 Ausblick: Kooperation im wiederholten Gefangenendilemma mit mehreren Spielern
5 Zusammenfassung
Literaturverzeichnis
1 Einleitung
Das Gefangenendilemma ist ein Problem, welches in sehr vielen Bereichen der Wissenschaft Anwendung findet. Sowohl in der Biologie, in der Psychologie, Informatik, Soziologie, in den Politikwissenschaften und der Wirtschaft taucht das Problem auf, dass sich in einer bestimmten Situation zwischen miteinander interagierenden Individuen bzw. Tieren, Programmen etc. aufgrund von Anreizproblemen eine Situation einstellt, welche für alle Beteiligten schlechter ist, als die Paretooptimale.
Als Beispiel sind zwei Radfahrer bei der Tour de France zu nennen. Beide führen vor der letzten und entscheidenden Etappe das Feld klar an. Einen Tag vor der letzten Etappe erfahren beide, dass ein neues Dopingmittel entwickelt wurde, welches bei einer Dopingkontrolle nicht nachgewiesen werden kann. Beide ziehen nun in Erwägung dieses zu konsumieren, da es einem Fahrer unter der Vorraussetzung, dass der andere nicht dopt, einen wesentlichen Vorteil verschaffen würde. Sie sind sich allerdings auch der gesundheitlichen Nebenwirkungen des Mittels bewusst, welche sie aber für einen Vorteil gerne in Kauf nehmen würden. Greifen jedoch beide zum Doping, so ändert sich nichts an der Ausgangssituation, da beide wieder die gleichen Gewinnchancen wie vorher haben. Durch den zusätzlichen negativen Gesundheitseffekt ist diese Situation allerdings weniger wünschenswert als die Ausgangsposition. Das Dilemma ist nun, dass sich die Situation, in der beide zum Doping greifen, in jedem Fall einstellen wird. Beide haben einerseits den Anreiz einen Vorteil zu erlangen und befürchten andererseits, dass der Gegner dopen könnte, wodurch die eigenen Chancen geschmälert würden. Selbst wenn beiden das Dilemma im Vornhinein bewusst ist und sie versuchen sich vorher abzusprechen, nicht zum Doping zu greifen, ist dies nutzlos, da sie dem Wort des anderen nicht trauen können.
Die Frage, die sich nun stellt ist: Gibt es einen Weg aus diesem Dilemma? Mit dieser Frage setzen sich schon seit den fünfziger Jahren eine Reihe von Wissenschaftlern auseinander. Diese Arbeit soll einen groben Überblick über die Ergebnisse der Frage geben, wie man im Gefangenendilemma Kooperation erreicht. Als erstes wird der Fall des einmaligen Spiels mit zwei Akteuren betrachtet. Wie im vorliegenden Beispiel bereits erläutert gibt es hier keine Lösung, wenn das Spiel als solches nicht verändert wird1. Im Anschluss daran soll auf den wiederholten Fall des Gefangenendilemmas eingegangen. Es wird beschrieben, dass es unter bestimmten Bedingungen eine Lösung geben kann und welche diese darstellen könnte. Der letzte Teil der Arbeit beinhaltet einen Ausblick und wichtige Erkenntnisse aus dem wiederholten Gefangenendilemma mit mehr als zwei Personen.
2 Kooperation im einperiodigen Gefangenendilemma
Das klassische Gefangenendilemma ist charakterisiert durch die folgenden Bedingungen:
Abbildung in dieser Leseprobe nicht enthalten
Wobei c die Auszahlung bei beidseitiger Kooperation darstellt, d die Auszahlung beidseitiger Defektion, b die Auszahlung für den Spieler, wenn dieser bei Kooperation des Mitspielers defektiert und a wenn er selbst “ausgenutzt” wird. Die zweite Bedingung sagt aus, dass beidseitige Kooperation ein besseres Ergebnis darstellen muss, als ein wechselseitiges Ausnutzen und ausgenutzt werden. Die Auszahlungsmatrix ist wie folgt gegeben:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Auszahlungsmatrix im Gefangenendilemma
Geht man nun von rationalen, nutzenmaximierenden Spielern aus, so besteht das Dilemma darin, dass für beide Individuen die schlechtere Lösung beidseitiger Defektion (D/D) resultiert, obwohl die Lösung beidseitiger Kooperation (C/C) paretooptimal ist. Beideseitige Defektion ist das einzige Nash Gleichgewicht, da auf jede Aktion des Mitspielers defektieren die beste Antwort darstellt. Kooperiert mein Mitspieler, so kann ich mich besser stellen indem ich defektiere. Defektiert mein Mitspieler, so ist ebenfalls defektieren die beste Antwort.
Bonacich (1970) zeigt nun, dass die Wahrscheinlichkeit für eine kooperative Lösung von der Größe der Parameter abhängt. Sie hängt positiv vom zusätzlichen Gewinn einer kooperativen Lösung
gegenüber der defekiven Lösung c − d und negativ vom Risiko bzw. dem möglichen Verlust wenn man selbst kooperiert − ( c − a ) = a − c ab. Weiter hängt sie negativ von der Versuchung selbst zu
defektieren, also dem möglichen Gewinn gegenüber der kooperativen Lösung b − c ab2. Es ist offensichtlich, dass eine Veränderung bestimmter Auszahlungen, zum Beispiel durch Strafandrohungen3 die Auszahlungsmatrix so stark verändern kann, dass die Bedingungen des Gefangenendilemmas nicht mehr zutreffen und Kooperation zum Nash Gleichgewicht wird. Solche Lösungsansätze sollen jedoch nicht den Inhalt dieser Arbeit darstellen. Es wird vielmehr auf Lösungsansätze eingegangen, welche die Grundannahmen des Spiels nicht verletzen.
Einen solchen stellt der sogenannte Metaansatz von Howard (1971) dar. Dieser erweitert die Denkweise der Spieler dahingehend, dass die eigene Entscheidung nicht mehr von der eindimensionalen Entscheidung des Mitspielers abhängig ist. Die Entscheidungsregel lautet also nicht mehr, mit welcher Aktion ich auf eine bestimmte Aktion meines Mitspielers reagiere, sondern: Welche Alternativen bestehen für meinen Mitspieler auf meine Aktion zu antworten (vier Alternativen) und gegeben dieser Information, welche Aktion spiele ich jeweils selbst.4 Dieser Ansatz sollte eine Lösung für das einmalige Gefangenendilemma darstellen. Jedoch stellt sich die Frage: Woher soll ich wissen, wie mein Mitspieler auf eine meiner Aktionen reagiert, wenn ich ihm noch nie begegnet bin? Der Ansatz ist also zumindest für das einmalige Gefangenendilemma „unbrauchbar“. Wie sich aber später noch zeigen wird, liefert er eine sehr interessante Erkenntnis für das wiederholte Gefangenendilemma. Eines der beiden Nash Gleichgewichte, die sich im Metaansatz einstellen (beide resultieren in einer kooperativen Lösung) entspricht der so genannten Strategie „Tit for Tat“ (TFT), das heisst kopiere immer die Handlung deines Mitspielers aus der vorigen Periode.
3 Kooperation im wiederholten Gefangenendilemma
Betrachtet man das einperiodige 2 Personen-Gefangenendilemma, so kommt man schnell zu dem Schluss, dass es gegeben den Annahmen rationaler nutzenmaximierender Spieler nur ein mögliches Nash-Gleichgewicht gibt, in dem beide Individuen defektieren. In der Realität beobachtet man jedoch selten Gefangenendilemmaspiele, welche sich auf eine einzige Periode beschränken. Selbst das wohl berühmteste Beispiel des einperiodigen Gefangenendilemmas ist in Wirklichkeit ein Mehrperiodiges gewesen. Die früheren Großmächte im kalten Krieg haben weder ihr gesamtes Waffenarsenal an einem einzigen Tag aufgebaut, noch fiel die Entscheidung über den gesamten Stock an nuklearen Sprengkörpern an einem einzigen Tag. Unter Anbetracht der Tatsache, dass bei konkurrierenden Unternehmen die Entscheidung ob eine Preisschlacht stattfinden soll oder nicht immer wieder auftritt, dass ein Fahrer (bzw. sein Arzt) bei der Tour de France vor jeder Etappe neu entscheiden kann, ob er zum Doping greift oder nicht oder dass sich eine kleine Kommune immer wieder Gedanken über die Bereitstellung eines öffentlichen Gutes für die gleiche Zielgruppe Gedanken machen muss (bzw. immer wieder anfallende Instandhaltungskosten des Gutes ein wiederholtes Spiel implizieren), erscheint die Suche nach Wegen aus dem mehrperiodigen Gefangenendilemmaspiels als wesentlich interessanter, als sich zu sehr auf das One-Shot Gefangenendilemma zu versteifen. So ist auch der Fall aus dem vorherigen Kapitel eher als Extremfall zu betrachten. Denn das Dopingproblem erstreckt sich doch eher über einen längeren Zeitraum, als nur über eine einzige Etappe.
3.1 Das Gefangenendilemma mit endlichem Zeithorizont
Einen Ansatz das mehrperiodige Gefangenendilemma zu lösen beschreibt Shubik (1970). In einem ersten Schritt zeigt Shubik anhand der extensiven Form des Gefangenendilemmas, dass sich ein Individuum in der letzten Runde unabhängig von seinem Gegenüber immer für Defektion entscheiden wird5. Aus Abbildung 2 wird deutlich, dass sich Spieler 2 in einem zweiperiodigen Spiel in der zweiten Runde unabhängig von der Aktion seines Gegners immer für Defektion entscheiden wird, denn die aufsummierten Auszahlungen aus Runde eins und zwei sind für ihn immer höher, wenn er in der letzten Runde defektiert. Das gleiche gilt immer für die jeweils letzte Runde wenn man den Baum entsprechend erweitert. In der letzten Runde wird also immer defektiert. Da dies aber jeder Spieler antizipiert, wird die vorletzte Runde zur letzten, in welcher dann wieder defektiert wird etc. Das Ergebnis ist somit, dass auch im mehrperiodigen klassischen Gefangenendilemma beiderseitige Defektion das einzige Gleichgewicht darstellt.
Abbildung 2: Extensive Form des zweiperidigen Gefangenendilemmas.
Abbildung in dieser Leseprobe nicht enthalten
3.2 Das Gefangenendilemma mit unendlichem Zeithorizont
Shubik schlägt nun einen Lösungsansatz vor, bei dem die Ausgangssituation des Spiels so verändert wird, dass eine gleichgewichtige kooperative Lösung möglich wird. Sein Vorschlag ist, die Annahme der Endlichkeit des Spiels durch Unendlichkeit zu ersetzen. Auf diese Weise kann der Effekt umgangen werden, durch welchen ausgehend von der letzten Runde für das gesamte Spiel ein nicht kooperatives Gleichgewicht resultiert. Zusätzlich führt er eine Variable ∂ (0 < ∂ < 1) ein, welche sich aus der Wahrscheinlichkeit, dass sich die Spielpartner in einer nächsten Periode wieder gegenüberstehen und einem Diskontierungssatz, welcher frühere Auszahlungen stärker gewichtet als spätere, zusammensetzt.
[...]
1 Vgl. Kapitel 2
2 Bonacich, P. (1970): “Putting the Dilemma Back into Prisoner’s Dilemma”, The Journal of Conflict Resolution, No. 14, S. 379-387.
3 Hierdurch wird sowohl die Auszahlung d als auch a geringer.
4 16 Alternativen: z.B. kooperiere bzw. kooperiere nicht, wenn er kooperiert falls ich kooperiere etc. Alle möglichen Resultate (16 * 4 = 64) können nun wieder wie im obigen Fall mithilfe einer Matrix veranschaulicht werden.
5 Die Tatsache, dass die Entscheidung in der jeweils letzten Runde unabhängig von der Entscheidung des Mitspielers ist, lässt eine Veranschaulichung des SIMULTANEN Gefangendilemmaspiels überhaupt erst in der extensiven Form zu. Ansonsten würde man die Regeln des Spiels völlig verändern und aus dem simultanen ein wechselseitiges Spiel machen.
- Citar trabajo
- Florian Kalbassi (Autor), 2007, Kooperation durch Tit For Tat im wiederholten Gefangenendilemma, Múnich, GRIN Verlag, https://www.grin.com/document/125707
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.