Hoofd- » algoritmische handel » Prisoner's Dilemma

Prisoner's Dilemma

algoritmische handel : Prisoner's Dilemma
Wat is het Prisoner's Dilemma?

Het dilemma van de gevangene is een paradox in de besluitanalyse waarin twee individuen die handelen in hun eigen belang niet het optimale resultaat opleveren. Het dilemma van de typische gevangene is zo opgezet dat beide partijen ervoor kiezen zichzelf te beschermen ten koste van de andere deelnemer. Als gevolg hiervan bevinden beide deelnemers zich in een slechtere staat dan wanneer zij met elkaar hadden samengewerkt in het besluitvormingsproces. Het dilemma van de gevangene is een van de meest bekende concepten in de moderne speltheorie.

Belangrijkste leerpunten

  • Het dilemma van een gevangene is een situatie waarin individuele besluitvormers altijd een stimulans hebben om te kiezen op een manier die een minder dan optimale uitkomst voor de individuen als groep creëert.
  • Gevangenisdilemma's komen in veel aspecten van de economie voor.
  • Mensen hebben veel methoden ontwikkeld om dilemma's van gevangenen te overwinnen om betere collectieve resultaten te kiezen, ondanks schijnbaar ongunstige individuele prikkels.
01:46

Prisoner's Dilemma

Inzicht in het Prisoner's Dilemma

Het dilemma van de gevangene presenteert een situatie waarin twee partijen, gescheiden en niet in staat om te communiceren, elk moeten kiezen tussen samenwerking met de andere of niet. De hoogste beloning voor elke partij komt voor wanneer beide partijen ervoor kiezen samen te werken.

Het dilemma van de klassieke gevangene luidt als volgt: twee leden van een bende bankrovers, Dave en Henry, zijn gearresteerd en worden in afzonderlijke kamers ondervraagd. De autoriteiten hebben geen andere getuigen en kunnen de zaak alleen tegen hen bewijzen als ze ten minste een van de overvallers kunnen overtuigen om zijn medeplichtige te verraden en te getuigen van de misdaad. Elke bankrover staat voor de keuze om samen te werken met zijn medeplichtige en te zwijgen of om van de bende af te wijken en te getuigen voor de vervolging. Als ze allebei samenwerken en zwijgen, kunnen de autoriteiten hen alleen maar veroordelen voor een mindere aanklacht wegens rondhangen, wat elk een jaar gevangenisstraf betekent (1 jaar voor Dave + 1 jaar voor Henry = 2 jaar totale gevangenisstraf tijd). Als de ene getuigt en de andere niet, dan zal degene die getuigt gratis gaan en de andere krijgt drie jaar (0 jaar voor degene die defecten + 3 voor de veroordeelde = 3 jaar in totaal). Als beide echter tegen elkaar getuigen, krijgen ze elk twee jaar gevangenisstraf omdat ze gedeeltelijk verantwoordelijk zijn voor de overval (2 jaar voor Dave + 2 jaar voor Henry = 4 jaar totale gevangenisstraf).

In dit geval heeft elke overvaller altijd een stimulans om te defecten, ongeacht de keuze die de andere maakt. Vanuit het oogpunt van Dave kan Dave, als Henry zwijgt, ofwel samenwerken met Henry en een jaar in de gevangenis zitten, of overlopen en vrijuit gaan. Het is duidelijk dat hij in dit geval beter Henry en de rest van de bende zou kunnen verraden. Aan de andere kant, als Henry gebreken vertoont en tegen Dave getuigt, dan wordt Dave's keuze om te zwijgen en drie jaar te doen of om te praten en twee jaar gevangenisstraf te doen. Nogmaals, hij zou duidelijk liever twee jaar over drie willen doen.

In beide gevallen, of Henry samenwerkt met Dave of gebreken aan de vervolging, zal Dave beter af zijn als hij zelf gebreken vertoont en getuigt. Nu Henry met exact dezelfde reeks keuzes wordt geconfronteerd, zal hij ook altijd beter af zijn als hij ook defect raakt. De paradox van het dilemma van de gevangene is dit: beide overvallers kunnen de totale gevangenisstraf minimaliseren die ze alleen zullen doen als ze allebei samenwerken (2 jaar in totaal), maar de prikkels die ze elk afzonderlijk onder ogen zien, zullen hen altijd elk drijven defect raken en uiteindelijk de maximale totale gevangenisstraf tussen beide doen (in totaal 4 jaar).

Voorbeelden van het Prisoner's Dilemma

De economie staat vol met voorbeelden van dilemma's van gevangenen met uitkomsten die gunstig of schadelijk zijn voor de economie en de samenleving als geheel. De rode draad is situaties waarin de prikkels waarmee elke individuele beslisser die te kiezen krijgt, hen ertoe zouden brengen zich te gedragen op een manier die hen allemaal collectief slechter maakt, terwijl ze individueel keuzes vermijden die hen allemaal collectief beter af zouden maken als iedereen zou kunnen sommigen kiezen op de een of andere manier coöperatief.

Een voorbeeld hiervan is de tragedie van de commons. Het kan in het collectieve voordeel van iedereen zijn om de verspreiding van een gemeenschappelijke natuurlijke bron te behouden en opnieuw te investeren om het te kunnen blijven consumeren, maar elk individu heeft altijd een stimulans om in plaats daarvan zoveel mogelijk zo snel mogelijk te consumeren, wat dan raakt de bron leeg. Een manier vinden om samen te werken, zou hier duidelijk beter af zijn.

Anderzijds kan het gedrag van kartels ook worden beschouwd als het dilemma van een gevangene. Alle leden van een kartel kunnen zich collectief verrijken door de productie te beperken om de prijs te houden die elk hoog genoeg ontvangt om economische huurgelden van consumenten te ontvangen, maar elk kartellid heeft individueel een stimulans om het kartel te bedriegen en de productie te verhogen om ook huurinkomsten weg te houden van de andere kartelleden. In termen van het welzijn van de samenleving waarin het kartel opereert, is dit een voorbeeld van hoe een dilemma van een gevangene dat het kartel afbreekt, de samenleving als geheel soms zelfs beter kan maken.

Ontsnap aan het Prisoner's Dilemma

In de loop van de tijd hebben mensen verschillende oplossingen voor dilemma's van gevangenen uitgewerkt om individuele prikkels voor het algemeen belang te overwinnen.

Ten eerste worden in de echte wereld de meeste economische en andere menselijke interacties meer dan eens herhaald. Het dilemma van een echte gevangene wordt meestal maar één keer gespeeld of anders wordt het geclassificeerd als een herhaald dilemma. In een herhaald dilemma van de gevangene kunnen de spelers strategieën kiezen die samenwerking belonen of over tijd straffen. Door herhaaldelijk met dezelfde personen om te gaan, kunnen we zelfs opzettelijk van een dilemma van een eenmalige gevangene naar een dilemma van een herhaald gevangene gaan.

Ten tweede hebben mensen formele institutionele strategieën ontwikkeld om de prikkels te veranderen waarmee individuele besluitvormers worden geconfronteerd. Collectieve actie om coöperatief gedrag af te dwingen door middel van reputatie, regels, wetten, democratische of andere collectieve besluitvorming en expliciete sociale bestraffing voor defecten transformeert de dilemma's van veel gevangenen in de richting van de meer collectief voordelige coöperatieve resultaten.

Ten slotte hebben sommige mensen en groepen mensen in de loop van de tijd psychische en gedragsmatige vooroordelen ontwikkeld, zoals een groter vertrouwen in elkaar, langdurige toekomstige oriëntatie bij herhaalde interacties en neigingen naar positieve wederkerigheid van coöperatief gedrag of negatieve wederkerigheid van afwijkend gedrag. Deze neigingen kunnen evolueren door een soort natuurlijke selectie in een samenleving in de loop van de tijd, of groepsselectie in verschillende concurrerende samenlevingen. In feite leiden zij groepen individuen ertoe om "irrationeel" uitkomsten te kiezen die eigenlijk het meest voordelig voor hen allemaal zijn.

Deze drie factoren samen (de herhaalde dilemma's van gevangenen, formele instellingen die dilemma's van gevangenen afbreken en gedragsvooroordelen die de 'rationele' individuele keuze in dilemma's van gevangenen ondermijnen) helpen de vele dilemma's van gevangenen op te lossen waarmee we anders allemaal geconfronteerd zouden worden.

Vergelijk beleggingsrekeningen Aanbieder Naam Beschrijving Adverteerder Openbaarmaking × De aanbiedingen die in deze tabel worden weergegeven, zijn afkomstig van samenwerkingsverbanden waarvan Investopedia een vergoeding ontvangt.

Gerelateerde termen

Iterated Prisoner's Dilemma Definitie Het herhaalde dilemma van de gevangene wordt herhaaldelijk gespeeld door dezelfde deelnemers en helpt spelers meer te weten te komen over de gedragstendensen van hun tegenpartij. meer Hoe speltheorie werkt Speltheorie is een raamwerk voor het modelleren van scenario's waarin belangenconflicten tussen de spelers bestaan. meer Tit voor Tat Definitie Tit voor tat is een strategie voor speltheorie waarin een speler de actie kiest die de tegenstander in de vorige speelronde heeft gekozen. meer Nash Equilibrium Nash Equilibrium is een concept binnen de speltheorie waarbij het optimale resultaat van een game is waarbij er geen reden is om af te wijken van hun oorspronkelijke strategie. meer Definitie dollarveiling Een dollarveiling is een opeenvolgend spel zonder nul waarbij de hoogste bieder een dollar ontvangt en de verliezer het bedrag dat hij biedt ook moet betalen. meer Oligopoly Definitie Oligopoly is een marktstructuur met een klein aantal bedrijven, waarvan geen enkele de anderen kan weerhouden invloed van betekenis te hebben. meer partnerlinks
Aanbevolen
Laat Een Reactie Achter