Co to jest dylemat więźniów?

W samej grze kary (i nagrody, w stosownych przypadkach) są reprezentowane przez użyteczność liczby. Liczby dodatnie reprezentują dobre wyniki, liczby ujemne reprezentują złe wyniki, a jeden wynik jest lepszy od drugiego, jeśli liczba z nim związana jest większa. (Uważaj jednak, jak to działa dla liczb ujemnych, ponieważ na przykład -5 jest większe niż -20!)

W powyższej tabeli pierwsza liczba w każdym polu odnosi się do wyniku dla gracza 1, a druga liczba reprezentuje wynik dla gracza 2. Liczby te reprezentują tylko jeden z wielu zestawów liczb zgodnych z ustawieniem dylematu więźniów.

Po zdefiniowaniu gry kolejnym etapem analizy gry jest ocena strategii graczy i próba zrozumienia, w jaki sposób gracze będą się zachowywać. Podczas analizy gier ekonomiści przyjmują kilka założeń - po pierwsze zakładają, że obaj gracze są tego świadomi wypłaty zarówno dla siebie, jak i dla drugiego gracza, a po drugie, zakładają, że obaj gracze patrzą do racjonalnie zmaksymalizować własną wypłatę z gry.

Jednym łatwym początkowym podejściem jest poszukiwanie tzw

instagram viewer

dominujące strategie- strategie, które są najlepsze niezależnie od strategii wybranej przez innego gracza. W powyższym przykładzie wybranie spowiedzi jest dominującą strategią dla obu graczy:

Biorąc pod uwagę, że spowiedź jest najlepsza dla obu graczy, nic dziwnego, że wynik, w którym obaj gracze się przyznają, jest wynikiem równowagi gry. To powiedziawszy, ważne jest, aby być bardziej precyzyjnym z naszą definicją.

Pojęcie Równowaga Nasha został skodyfikowany przez matematyka i teoretyka gier Johna Nasha. Mówiąc najprościej, Nash Equilibrium to zestaw strategii zapewniających najlepszą reakcję. W grze dwuosobowej równowaga Nasha jest wynikiem, w którym strategia gracza 2 jest najlepszą odpowiedzią na strategię gracza 1, a strategia gracza 1 jest najlepszą odpowiedzią na strategię gracza 2.

Znalezienie równowagi Nasha za pomocą tej zasady można zilustrować w tabeli wyników. W tym przykładzie najlepsze odpowiedzi gracza 2 na gracza pierwszego są zaznaczone na zielono. Jeśli gracz 1 wyznaje, najlepszą odpowiedzią gracza 2 jest spowiedź, ponieważ -6 jest lepsze niż -10. Jeśli gracz 1 nie przyzna się, najlepszą odpowiedzią gracza 2 jest wyznanie, ponieważ 0 jest lepsze niż -1. (Uwaga: to rozumowanie jest bardzo podobne do rozumowania stosowanego do identyfikacji dominujących strategii).

Najlepsze odpowiedzi Gracza 1 są zaznaczone na niebiesko. Jeśli gracz 2 wyznaje, najlepszą odpowiedzią 1 jest spowiedź, ponieważ -6 jest lepsze niż -10. Jeśli gracz 2 nie przyzna się, najlepszą odpowiedzią gracza 1 jest wyznanie, ponieważ 0 jest lepsze niż -1.

Równowaga Nasha jest wynikiem, w którym występuje zarówno zielony, jak i niebieski okrąg, ponieważ stanowi to zestaw najlepszych strategii reakcji dla obu graczy. Zasadniczo możliwe jest posiadanie wielu równowag Nasha lub ich brak (przynajmniej w czystych strategiach opisanych tutaj).

Być może zauważyłeś, że równowaga Nasha w tym przykładzie wydaje się w pewien sposób nieoptymalna (w szczególności dlatego, że nie jest to optymalne Pareto), ponieważ obaj gracze mogą uzyskać -1 zamiast -6. Jest to naturalny wynik interakcji występującej w grze - w teorii nie byłoby spowiedzi optymalna strategia dla grupy zbiorowo, ale indywidualne zachęty uniemożliwiają taki wynik osiągnięty. Na przykład, jeśli gracz 1 myślał, że gracz 2 pozostanie cicho, będzie miał motywację, aby go wyrzucić, a nie milczeć i odwrotnie.

Z tego powodu równowagę Nasha można również traktować jako wynik, w którym żaden gracz nie ma motywacji do jednostronnego (tj. Przez siebie) odejścia od strategii, która doprowadziła do tego wyniku. W powyższym przykładzie, gdy gracze zdecydują się przyznać, żaden z nich nie może zrobić lepiej, zmieniając zdanie samodzielnie.