Home - Rasfoiesc.com
Educatie Sanatate Inginerie Business Familie Hobby Legal
Doar rabdarea si perseverenta in invatare aduce rezultate bune.stiinta, numere naturale, teoreme, multimi, calcule, ecuatii, sisteme




Biologie Chimie Didactica Fizica Geografie Informatica
Istorie Literatura Matematica Psihologie

Psihologie


Index » educatie » Psihologie
» TEORIA JOCURILOR - Strategii dominante si strategii dominate


TEORIA JOCURILOR - Strategii dominante si strategii dominate


Teoria jocurilor

1. Ce este un joc?

Am studiat in capitolul precedent cateva modalitati posibile de interactiune intre firme. Am vazut ca, in general, firmele interactioneaza si nu asista in mod pasiv la actiunile concurentilor. Interactiunile dintre firme vor fi mai bine intelese cu ajutorul teoriei jocurilor.

Principalele caracteristici ale unui joc sunt:



Un numar finit de jucatori (adesea, pentru simplificare vom considera numai doi jucatori X si Y). De exemplu, sa presupunem ca Ana si Dan doresc sa iasa sambata in oras. Cei doi jucatori sunt Ana si Dan.

Un set de strategii, astfel incat fiecare jucator sa poata alege din setul respectiv o anumita actiune. Continuand exemplul, Ana si Dan pot merge la un film sau la un restaurant. Strategiile sunt pentru fiecare jucator

Un set de rezultate posibile in functie de actiunile alese. In exemplul nostru, rezultatele posibile sunt:

Ana si Dan merg la film: (Film, Film);

Ana si Dan merg la restaurant: (Restaurant, Restaurant);

Ana merge la film si Dan merge la restaurant: (Film, Restaurant);

Ana merge la restaurant si Dan merge la film: (Restaurant, Film).

Se observa ca rezultatele posibile sunt: 2x2=4 rezultate, in conditiile in care fiecare jucator dispune de doua strategii. Daca Ana ar fi avut la dispozitie trei strategii, sa spunem , iar Dan numai cele doua strategii, rezultatele posibile ar fi fost: 3x2=6 rezultate.

Jucatorii au preferinte in ceea ce priveste rezultatele. In exemplul nostru, sa spunem ca Ana si Dan sunt fericiti daca opteaza amandoi pentru aceeasi actiune si nefericiti in caz contrar. Rezultatele devin (fericit, fericit) sau (fericit, nefericit) sau (nefericit, nefericit). Putem asocia asadar o functie de utilitate fiecarui rezultat posibil.

Rezultatele jocului pot fi reprezentate cu ajutorul unei matrice a rezultatelor (payoff matrix). In exemplul nostru, daca vom asocia cifra 1 satisfactiei celor doi jucatori si zero insatisfactiei, matricea ar arata astfel:

Film Restaurant

Film

Restaurant

Matricea se citeste astfel: daca Ana si Dan aleg amandoi sa mearga la film, sau sa mearga la restaurant, resimt o satisfactie egala, simbolizata de valoarea unu. Daca Ana alege film, iar Dan restaurant, satisfactia ambilor jucatori este zero. Acelasi rezultat apare daca Dan alege film, iar Ana restaurant.

Jocurile pot fi clasificate in mai multe categorii. Astfel, dupa modul de adoptare a deciziilor, distingem:

Jocuri cooperante, daca jucatorii decid sa coopereze si sa adopte deciziile in comun (cazul cartelului)

Jocuri necooperante, daca, fiind confruntati cu situatii conflictuale, jucatorii adopta decizii in mod individual, fara a coopera.

In functie de factorul timp, vom avea:

Jocuri statice, in cadrul carora jucatorii adopta decizii simultan si o singura data;

Jocuri dinamice, in cadrul carora jucatorii adopta decizii succesiv in diferite momente de timp.

2. Jocurile statice

2.1. Strategii dominante si strategii dominate

Sa incepem cu urmatorul joc simplu: consideram doi jucatori, A si B carora li se cere sa scrie pe o foaie de hartie X sau Y. In functie de ceea ce va scrie fiecare, matricea rezultatelor se prezinta astfel:

B

X Y

2

3

0

1

A X

Y

Cifra din stanga corespunde castigului jucatorului A, iar cea din dreapta castigului jucatorului B. Astfel, daca A scrie X el va obtine 2 daca B scrie tot X si 0 daca B scrie Y. Aceasta matrice descrie complet jocul, in sensul ca arata numarul de jucatori, strategiile pe care acestia le au la dispozitie, ca si castigurile corespunzatoare diferitelor tipuri de strategii. Matricea castigurilor se mai numeste si forma strategica a jocului, intrucat descrie relatia dintre combinatiile de strategii posibile si castigurile aferente.

In acest joc, daca A scrie X, el poate castiga 2 sau nimic, pe cand daca scrie Y poate castiga 3 sau 1. Daca este iubitor de risc, el poate castiga mai mult cu strategia Y decat cu X. Daca este adversar la risc, el pierde mai putin cu strategia Y decat cu X. Indiferent de profilul sau psihologic, el va alege Y. Acelasi rationament il putem face si pentru B. In consecinta, atat A, cat si B vor scrie Y, aceasta fiind solutia jocului, in ipoteza ca jucatorii sunt rationali. Spunem ca Y este strategie dominanta, iar X este strategie strict dominata.

In general, vom spune ca o strategie este strict dominanta daca permite obtinerea unor castiguri superioare oricaror altor strategii, indiferent de strategiile alese de celalalt jucator. In cazul in care castigurile sunt mai mari sau egale, strategia este dominanta.

Solutia jocului (Y,Y) nu este insa optima in sensul lui Pareto deoarece daca ambii jucatori ar scrie X castigul ar fi mai mare. Solutia (X,X) nu este insa un echilibru stabil, intrucat fiecare jucator stie ca-si poate mari castigul daca joaca Y.

Un exemplu de astfel de joc este modelul Cournot.

Matricea oligopolului: a coopera sau a nu coopera?

QB

QA

1/2Q

3/4Q

1/2Q

1,3 si 1,3

0,5 si 1,5

3/4Q

1,5 si 0,5

1 si 1

Daca A si B coopereaza, fiecare va produce jumatate din productia pietei, deci va castiga 1,3 miliarde de lei profit. Dar atat A, cat si B stiu ca daca produc trei sferturi din piata, pot obtine 1,5 miliarde de lei profit. Deci combinatia (1/2QA+1/2QB) nu este un echilibru stabil, pentru ca firmele sunt tentate sa produca mai mult. In schimb, la o productie de 3/4 din piata fiecare, nici A, nici B nu au motive sa modifice productia, deoarece aceasta actiune ar presupune un profit mai mic.

Acest joc simplu evidentiaza ca, in absenta unui "comisar al preturilor", concurenta si adoptarea descentralizata a deciziilor nu conduce la o situatie de optim paretian.

Ce se intampla in cazul in care nu exista o strategie strict dominanta? Alegerea strategiilor se va face eliminarea treptata a strategiilor strict dominate. Pentru a intelege, sa complicam un pic jocul de la care am pornit. Sa presupunem acum ca A are posibilitatea sa scrie X, Y sau W. Matricea castigurilor se prezinta astfel:

B

X Y

2

3

0

1

0

1

A X

Y

W

Pentru jucatorul A, strategia X este strict dominata de Y. Dar Y nu mai este dominanta, pentru ca daca B joaca X, A poate sa obtina un castig mai mare cu W (4). Dar B nu va juca niciodata X, pentru ca, pentru el X ramane o strategie strict dominata (poate obtine 2 sau 0, pe cand cu Y poate obtine 3 sau 1). Prin urmare putem elimina coloana din dreapta a matricei. Prin urmare A stie ca B va juca Y si va alege si ea tot Y, aceasta fiind solutia jocului. Sa observa ca acest joc se bazeaza pe o informare completa a jucatorilor. Acestia cunosc castigurile lor, castigurile celorlalti jucatori, ceea ce ceilalti jucatori cunosc si modul in care acestia gandesc. Vom spune ca informatia este cunoastere comuna in sensul ca ea este cunoscuta de toti jucatorii, fiecare jucator stie ca ceilalti stiu s.a.m.d..

2.2. Echilibrul Nash

Ce se va intampla in situatia in care nici unul dintre jucatori nu dispune de o strategie dominata? Sa consideram urmatorul joc:

B

X Y

1

2*

2*

1

1

2*

A X

Y

W

Cu X, A poate castiga 1 sau 3, cu Y 2 sau 2, iar cu W 3 sau 1. Suma castigurilor, indiferent de ceea ce ar alege este patru. B cu X poate castiga 1, 2 sau 1, la fel si cu Y. Nash a propus un alt criteriu de alegere decat cel al strategiei dominate, criteriu ce nu mai poate fi evident aplicat in jocul de mai sus. Astfel, un echilibru Nash este o combinatie de strategii realizata astfel incat strategia fiecarui jucator este cel mai bun raspuns la strategiile celorlalti. In jocul nostru, daca A joaca X, cel mai bun raspuns al lui B este Y. Daca A joaca Y, cel mai bun raspuns al lui B este X. Daca A joaca W, cel mai bun raspuns al lui B este din nou Y. Ansamblul celor mai bune raspunsuri a lui B este (Y,X,Y). Pentru A, ansamblul celor mai bune raspunsuri este (W, X). In matricea noastra, strategia (X, Y) este un echilibru Nash si totodata solutia jocului. Astfel pentru ca A joaca doar W sau X, linia a doua dispare. Cu X, B va castiga 1 sau 1, pe cand cu Y 2 sau 2. Evident va juca Y. A stie acest lucru si va alege cel mai bun raspuns, adica X.

Echilibrul Nash corespunde asadar intersectiei ansamblurilor compuse din cele mai bune raspunsuri ale jucatorilor, solutia (X,Y) fiind in cazul nostru singura intersectie.

Echilibrul Nash ridica insa doua probleme: poate sa nu fie unic sau poate sa nu fie deloc.

Astfel, sa consideram urmatorul joc:

B

X Y

-1

1*

1*

-1

A X

Y

In acest joc nu exista un echilibru Nash, intrucat combinatiile celor mai bune raspunsuri nu se intersecteaza, asa cum evidentiaza asterixul. Jocul pare sa nu aiba solutie, totusi, se poate ajunge la un rezultat. Sa presupunem ca fiecare jucator "da cu banul" daca sa scrie X sau Y. Pentru cap va scrie X, iar pentru pajura Y,ceea ce inseamna ca alege la intamplare X sau Y. Fiecare jucator va alege X cu o anumita probabilitate si Y cu o alta probabilitate. X si Y poarta numele de strategii pure, pe cand alegerea probabilitatilor asociate acestor strategii poarta numele de strategie mixta. In exemplul nostru va exista o combinatie de strategii mixte care sa fie un echilibru Nash. Vom nota cu α probabilitatea ca jucatorul A sa joace X si cu β probabilitatea ca jucatorul B sa joace X. Daca A stie ca B va juca X cu probabilitatea β, speranta sa de castig in cazul in care joaca X va fi: β(1)+(1- β)(-1)=2 β-1. Daca alege Y, speranta sa de castig va fi: β(-1)+(1- β)(1)=1-2 β. A nu va accepta sa aleaga la intamplare intre X si Y decat daca speranta sa de castig este aceeasi ceea ce inseamna ca: 2 β-1=1-2 β, de unde rezulta β=1/2. Asemanator, B va accepta sa joace in strategii mixte numai daca α=1/2. In consecinta vom avea pentru A: 1/2X+1/2Y, iar pentru B 1/2X+1/2Y, aceasta combinatie de strategii mixte fiind un echilibru Nash.

Pentru o mai buna intelegere, sa modificam rezultatele jocului astfel:

B

X Y

1

4

2

1

A X

Y

Se observa cu usurinta ca nici acest joc nu are un echilibru Nash pur, deci trebuie sa apelam la strategiile mixte. Sa spunem ca A alege sa joace X cu probabilitatea α, iar B sa joace X cu probabilitatea β. Speranta de castig a lui A daca joaca X este: 1β+(1-β)0=β, iar daca joaca Y: β0+2(1-β). Pentru ca cele doua sa fie egale vom avea β= β0+2(1-β), de unde rezulta β=2/3. Asemanator α+2(1- α)=4 α+1- α, de unde α=1/4. Echilibrul Nash va fi combinatia de strategii mixte: m1,m2, cu m1=(1/4)X+(3/4)Y si m2=(2/3)X+(1/3)Y.

Rezulta ca ori de cate ori numarul strategiilor pure este finit va exista cel putin un echilibru Nash.

Ce se intampla insa daca exista mai multe echilibre Nash? Jocul numit "razboiul sexelor" este exemplul celebru de joc care admite mai multe echilibre Nash.

Sa ne intoarcem la Ana si la Dan care doreau sa iasa impreuna in oras. Sa spunem ca Ana doreste sa mearga la film, pe cand Dan prefera sa mearga la restaurant. Fiecare poate alege doua strategii: sa fie ferm pe pozitie, sau sa cedeze. Sa spunem ca matricea rezultatelor se prezinta astfel:

Dan

Ferm Cedeaza

-1

2*

3*

1

Ana Ferm

Cedeaza

in care cifrele reprezinta aprecierea utilitatii fiecarei actiuni.

Cel mai bun raspuns al fiecarui jucator la actiunile celuilalt este sa fie ferm, daca celalat cedeaza si sa cedeze, daca celalat este ferm. In aceste conditii vom avea doua echilibre Nash, marcate in matrice cu asterix. In consecinta, exista jocuri in care solutia este imposibil de prevazut cu ajutorul echilibrului Nash. Desigur, aici avem la dispozitie din nou strategiile mixte care ne vor conduce la un echilibru unic. Astfel, daca α este probabilitatea ca Ana sa fie ferma, iar β probabilitatea ca Dan sa nu cedeze, in urma exprimarii sperantelor de castig vom obtine:

- β+3(1- β)=2 β+(1- β), de unde β=2/5. Asemanator α=2/5, prin urmare combinatia va fi m1, m2, cu m1=m2=(2/5)ferm+(3/5)cedeaza.

Plecand de la multiplicitatea echilibrelor Nash, s-au cautat si identificat solutii de selectare a acestora, solutii ce corespund unor cazuri particulare.

De exemplu, R.J Auman (1974) a aratat ca jucatorii isi pot imbunatati situatia daca aleg sa-si coordoneze actiunile in functie de un eveniment aleator: sa spunem ploua sau nu ploua (presupunand ca restaurantul era in aer liber). Sa presupunem ca probabilitatea sa ploua este de 1/2. Ana si Dan incheie urmatoarea conventie: daca ploua merg la film, iar daca nu ploua merg la restaurant. In absenta acestei conventii speranta de castig era 7/5=1,4. Acum fiecare este dispus sa cedeze cu probabilitatea 1/2, ceea ce inseamna ca speranta de castig este: 3x1/2+2x1/2=5/2=2,5, mai mare decat 1,4.

Un acord care consta in a conditiona alegerea de combinatii de strategii care constituie un echilibru Nash de un anumit eveniment aleator poarta numele de echilibru corelat. Se observa ca probabilitatea de producere a evenimentului aleator influenteaza castigurile jucatorilor. Echilibru corelat permite identificarea unei solutii unice in cazul unui joc caracterizat prin mai multe echilibre Nash, daca jucatorii au posibilitatea sa comunice intre ei inainte de adoptarea deciziei. Dar el nu ne spune nimic despre modul in care va fi ales evenimentul aleator.

O alta posibilitate de a alege intre mai multe echilibre Nash este oferita de conceptul de punct focal. Sa presupunem ca Ana si Dan, fara a se cunoaste in prealabil, se intalnesc din intamplare intr-un Internet-caffe, stau de vorba si decid sa se revada. Ei stabilesc sa se revada a doua zi la ora 18, dar uita sa precizeze locul intalnirii. De asemenea, nu fac schimb de adrese sau de numere de telefon. In acest caz, locul intalnirii va fi cu siguranta Internet-caffe-ul. Acest loc este "punctul focal". El este un reper care permite coordonarea actiunilor. Cu toate acestea "punctul focal" poate fi adesea inoperant. De exemplu, sa presupunem ca pe parcursul primei intalniri Ana si Dan au discutat despre cat de mult le place sa manance la KFC. Atunci unul dintre ei poate crede ca celalalt a inteles ca intalnirea va fi la KFC, ceea ce dovedeste fragilitatea coordonarii prin intermediul unui punct focal.

O alta modalitate de a alege printre mai multe echilibre Nash o constituie conventiile. Sa ne intoarcem la razboiul sexelor: daca Dan si Ana sunt sot si sotie, iar in familiile celor doi, de-a lungul mai multor generatii, s-a incetatenit obiceiul ca doamna sa cedeze, acest obicei va juca rolul unei conventii, iar echilibrul va fi (cedeaza, ferm). Conventiile constituie asadar un mijloc de corelare a deciziilor prin imitare. Pornind de la aceasta concluzie, firmele acorda o importanta mare cunoasterii istoricului comportamentului concurentei.

Prin comparatie cu biologia, conventiile pot fi considerate drept consecinta a unui proces evolutiv asemanator celui descris de Darwin. Astfel, indivizii care obtin castiguri mari alegand cele mai bune strategii vor fi imitati de ceilalti jucatori. Conventiile sunt rezultatul unui proces de incercari si de esecuri prin care nici unul dintre jucatori nu mai doreste sa treaca. De aceea ele corespund unor echilibre Nash (nici un jucator nu este incitat sa se abata de la ele). Acest tip de echilibru Nash poarta numele de "stare stabila in evolutie"(evolutionary stable states).

Un alt criteriu se selectie a echilibrului este riscul. Astfel, exista posibilitatea ca o strategie sa fie dominanta din punct de vedere al riscului inn raport cu alta strategie. Sa luam ca exemplu urmatorul joc:

B

X Y

9

8

-15

7 7

A X

Y

In acest joc, daca A alege X, poate castiga 9 sau pierde 15, pe cand daca alege Y poate castiga 8 sau Se observa ca avem doua echilibre Nash, marcate cu asterix. Din punct de vedere al optimului paretian, alegerea optima ar fi (X,X). Dar A si B pot considera strategia X prea riscanta si atunci aleg Y. Spunem ca strategia (Y,Y) este dominanta din punct de vedere al riscului in raport cu (X,X).

Analiza succinta a jocurilor statice pe care am realizat-o pe parcursul acestui sub-capitol conduce la concluzia ca interactiunile strategice necooperante se caracterizeaza prin imperfectiunea coordonarii deciziilor, imperfectiune care poate conduce la o situatie de sub-optim paretian. De asemenea, echilibrul Nash este un concept util in cazul jocurilor care admit doar un singur astfel de echilibru, dar dificil de utilizat atunci cand exista mai multe echilibre. Criteriile de selectie a solutiei jocului cu mai multe echilibre Nash pot fi: un eveniment aleator, punctul focal sau conventiile.

3. Jocurile dinamice

3.1. Jocul: o altfel de reprezentare

Sa modificam putin jocul de la care am pornit, in care jucatorilor li se cerea sa scrie X sau Y pe o foaie de hartie. Sa presupunem acum ca cei doi jucatori nu adopta deciziile simultan, ci secvential. Sa presupunem ca A este cel care scrie primul X sau Y pe hartie, apoi B adopta decizia in functie de decizia lui A. Secventialitatea deciziilor poate fi reprezentata cu ajutorul unei scheme arborescente astfel:

A

X Y

B B

* *

X Y X Y

(2,2) (0,3) (3,0) (1,1)

Fiecare ramura a arborelui indica o actiune posibila, iar fiecare nod reprezentat printr-un asterix este un punct in care un jucator reprezentat deasupra asterixului adopta o anumita decizie dintre deciziile posibile. Castigurile sunt scrise in dreptul nodurilor terminale, numite astfel intrucat nu admit noduri succesive. Se poate observa ca A dispune doar de doua strategii, in timp ce B dispune de patru strategii. In total vom avea 4x2=8 rezultate posibile. Jocul poate fi reprezentat si sub forma strategica astfel:

B

(X, X) (X, Y) (Y, X) (Y,Y)

2

2

3

3

0

1

0

1

A X

Y

Explicatia matricei este urmatoarea: daca A alege X si B raspunde cu X, rezultatul este (2,2) in casuta 1; daca A alege Y si B raspunde cu X, rezultatul va fi (3,0). Prin urmare prima litera din parantezele (X,X), (X,Y), (Y,X) si (Y,Y) arata raspunsul lui B la strategia X a lui A, iar a doua litera este raspunsul lui B la strategia Y a lui A.

Daca arborele de mai sus ar fi corespuns unui joc static si nu unui joc secvential, jucatorul B nu ar fi stiut pe ce nod sa se situeze intrucat decizilor celor doi jucatori ar fi fost simultane. De aceea jocurile statice se reprezinta printr-un arbore asemanator dar cu linii punctate intre nodurile intre care jucatorul nu stie ce sa aleaga, astfel:

A

X Y

B B

* *

X Y X Y

(2,2) (0,3) (3,0) (1,1)

In jocurile statice se considera ca jucatorii se caracterizeaza printr-o informatie imperfecta, intrucat nu stiu pe ce nod se situeaza atunci cand adopta deciziile (in cazul nostru, B cand ia decizia nu stie daca se afla pe nodul din stanga sau pe cel din dreapta). Aceasta concluzie este importanta intrucat evidentiaza ca reprezentarea jocului sub forma de arbore permite cunoasterea informatiei de care dispune fiecare jucator, perfecta sau imperfecta. Vom numi ansamblul de informatie al unui jucator totalitatea nodurilor pe care acesta crede ca se poate situa in momentul in care adopta deciziile. Cum jucatorul B din jocul nostru static dispune de doua noduri, vom spune ca informatia sa este imperfecta. Dimpotriva, informatia este perfecta daca ansamblurile de informatie ale tuturor jucatorilor cuprind un singur nod. Astfel daca vom considera acelasi joc, dar secvential, observam ca informatia este completa.

3.2. Echilibrul Nash in jocurile secventiale

Sa consideram urmatorul joc:

A

X Y

B

(2,2) *

X Y

(3,1) (0,0)

Acest joc poate fi reprezentat sub forma matriceala astfel:

B

X Y

2

2*

1*

0

A X

Y

Semnificatia arborelui este urmatoarea: daca A alege X, rezultatul este (2,2), indiferent daca B alege X sau Y. Daca insa A alege Y, iar B raspunde cu X, rezultatul este (3,1), iar daca B raspunde cu Y rezultatul este (0,0). Se observa cu usurinta ca acest joc are doua echilibre Nash, marcate cu asterix. Cum se poate alege solutia dintre mai multe echilibre Nash?

Daca A observa ca atunci cand a scris X, B a raspuns tot cu X, in urmatoarea etapa a jocului va avea tot interesul sa scrie Y, presupunand ca B va raspunde tot cu X. Prin urmare singura solutie este (Y,X). Acest mod de selectie a echilibrului poarta numele de inductie inversa. Ea exprima faptul ca jucatorii adopta deciziile cunoscand deciziile anterioare luate de ceilalti jucatori. Prin urmare jocurile secventiale se pot rezolva pas cu pas, plecand de la nodurile terminale si urcand treptat catre varf. In cazul unei informatii perfecte, vom numi sub-joc un nod si ansamblul nodurilor sale succesive. De exemplu, in arborele precedent exista doua sub-jocuri. Daca pornim de la sub-jocul apartinand lui B, observam ca cea mai buna alegere a acestuia este sa scrie X. Jucatorul A, care joaca primul, stie ca cea mai buna strategie a lui B in sub-joc este X, deci va alege Y pentru a castiga mai mult. Un astfel de echilibru poarta numele de echilibru perfect in sub-joc. Echilibrul Nash (X,Y) nu este unul perfect, intrucat B nu va alege niciodata Y in sub-jocul care incepe la el. Desigur B il poate ameninta pe A ca va juca Y, indiferent de decizia pe care o va lua A si anterior luarii deciziei de catre A. Dar amenintarea nu este credibila, deoarece nu ar fi avantajoasa nici pentru B. Acest joc simplu evidentiaza si importanta unor intelegeri si a existentei unor mijloace eficiente de aparare a intelegerilor dintre jucatori.

De asemenea, reprezentare jocului sub forma de arbore si aplicare inductiei inverse reflecta, in functie de specificul fiecarui joc, avantajul primei mutari sau avantajul celei de-a doua miscari. In exemplul nostru, A beneficiaza de avantajul primei mutari, B fiind in dezavantaj. Se observa ca daca B ar fi primul decident, el ar alege Y, fortindu-l pe A sa aleaga tot Y.    

4. Jocurile repetate

Interactiunile din economie sunt de cele mai multe ori interactiuni de durata, asa cum ar fi de exemplu un contract de munca sau un contract intre client si furnizor. Astfel de interactiuni pot fi reprezentate cu ajutorul jocurilor repetate. Intrebarea la care vom incerca sa raspundem este: daca un joc static se repeta de mai multe ori, cu aceiasi jucatori, jucatorii vor lua aceleasi decizii, chiar daca ele sunt sub-optime paretian?

Sa reluam jocul de la inceputul capitolului, dar sa-l modificam astfel:

B

X Y

1,5

3

0

0

A X

Y

Acest joc static avea ca solutie (Y,Y), care aratam ca nu este optima in sensul lui Pareto. Ce se va intampla in cazul in care jocul se repreta? Exemplul este celebru si cunoscut sub numele de dilema prizonierului. Celebra dilema pleaca de la urmatoarea istorioara: doi hoti care au dat impreuna o spargere sunt prinsi de politie si interogati in celule izolate. Fiecaruia i se spune urmatorul lucru: daca tu minti si celalalt spune adevarul, tu iei zece ani inchisoare si celalalt este eliberat. Daca amandoi mintiti, va eliberam din lipsa de probe. Daca amandoi spuneti adevarul, primiti fiecare cate un an. Solutia acestui joc este ca cei doi hoti se vor denunta reciproc, intrucat aceasta este strategia dominanta. Ce se va intampla insa daca, dupa un an de inchisoare, cei doi hoti se reintalnesc si dau o noua spargere? Suntem tentati in mod logic sa presupunem ca cei doi se vor intelege si vor minti amandoi, intrucat castigul este mai mare. Dar daca am masura castigul prin suma parte din furt? In exemplul nostru, sa spunem ca daca amandoi sunt eliberati, mintind, fiecare obtine 1,5 mil. dolari. Daca unul minte si celalalt spune adevarul, cel care minte nu obtine nimic, iar cel care spune adevarul ia tot. Daca spun amandoi adevarul, restituie prada proprietarului si nu se aleg cu nimic. Daca jocul se repeta de un numar finit de ori, in ultima etapa fiecare jucator va fi tentat sa minta pentru a se alege cu mai mult. Aplicand inductia inversa, ajungem la solutia jocului static initial: amandoi spun adevarul. Acordul dintre hoti va fi respectat numai daca jocul se repeta de un numar infinit de ori.

Sa consideram urmatorul joc repetitiv:

Etapa 1

B

X Y

2

3

0

1

A X

Y

Etapa 2

B

X Y

4

5

1

3

A X

Y

Aplicand metoda strategiilor dominante, observam ca in ambele etape (Y,Y) este strategie dominanta si va constitui solutia jocului. Daca vom considera ca rezultatele sunt exprimate in milioane lei, castigul total va fi, dupa cele doua etape cate 5 milioane de lei pentru fiecare jucator.

Daca cei doi jucatori s-ar fi inteles intre ei, ar fi castigat dupa cele doua etape cate 6 milioane de lei. Dar daca jocul este finit, atat A, cat si B au interesul sa triseze o eventuala intelegere, intrucat daca, de exemplu, A joaca Y in loc de X la ultima etapa, el castiga 5 in loc de patru. Cea mai buna actiune a se in nodul final este Y; aplicand metoda inductiei inverse, cea mai buna alternativa a lui B in etapa 1 va fi tot Y si ajungem la solutia initiala, in conditiile in care nu exista mijloace care sa intareasca acordul si prin care sa se asigure respectarea lui. Daca jocul este infinit, este posibil ca acordul sa dureze pe toata perioada jocului, sau numai pentru o parte dintre etape. Conform teoremei "folk", orice combinatie de strategii ale unui joc repetat la infinit care aduc un flux de castiguri mai mare sau cel putin egal cu cel al unui echilibru Nash din jocul central pot fi echilibre perfecte in subjoc, daca indivizii au o preferinta suficient de mica pentru prezent. In consecinta pentru un joc repetat la infinit exista foarte multe echilibre posibile, ridicand problema selectarii solutiei.

5. Jocurile statice cand informatia este incompleta

Sa consideram doi jucatori care trebuie sa scrie simultan X sau Y pe o foaie de hartie. Jucatorul A poate fi de doua tipuri diferite, sa spunem economist sau inginer. A stie de ce tip este, dar B nu cunoaste decat probabilitatea ca A sa fie de un anumit tip sau altul. Sa spunem ca B stie ca A este economist cu probabilitatea α si inginer cu probabilitatea 1- α. Matricea castigurilor asociate celor doua jocuri (B contra economistului si B contra inginerului) se prezinta astfel:

B

X Y

1

0

0

1

A ec. X

Y

B

X Y

0

1

0

1

A ing. X

Y

Pentru a rezolva acest joc, vom presupune ca un al treilea jucator, pe care il vom numi "Natura", notat pe scurt cu N este cel care stabileste tipul lui A, iar A stie ce alege N in timp ce B nu stie. Acest tip de rationament este cunoscut sub numele de transformarea Harsanyi si permite transformarea informatiei incomplete in informatie imperfecta. Jocul poate fi acum reprezentat sub forma arborescenta astfel:

N

α 1- α

A Economist    A Inginer

X Y X Y

B B B B

X Y X Y X Y X Y

Primul nod corespunde alegerii lui N, care stabileste tipul lui A. Linia punctata arata ca B dispune de o informatie imperfecta, in sensul ca nu stie pe ce nod se situeaza dintre cele 4 noduri. A dispune de un ansamblu de informatie care cuprinde patru noduri. Vom presupune ca A cunoaste de asemenea ceea ce crede B, mai exact probabilitatea α. Transformand astfel jocul putem aplica echilibrul Nash pentru a determina strategiile alese.

Vom numi echilibru bayesian situatia in care fiecare jucator alege strategia care ii maximizeaza speranta de castig, date fiind tipul sau, previziunile sale si previziunile si strategiile tuturor celorlalti jucatori. Sa determinam echilibrul bayesian in jocul nostru: pornim de la jucatorul A, care are strategii strict dominante, diferite in functie de tipul sau, economistul X, iar inginerul Y. B va estima ca A alege X cu probabilitatea α si Y cu probabilitatea 1- α. Daca joaca X, B obtine o speranta de castig egala cu α, iar daca joaca Y speranta de castig este 1- α. Cand cele doua sperante de castig sunt egale, rezulta ca α=1/2. Prin urmare B va juca X cand α ≥ 1/2 (1- α ≤ α ) si Y cand α ≤ 1/2. Combinatia de strategii care constituie un echilibru bayesian depinde asadar de tipul jucatorului A si de ceea ce crede acesta. Daca α ≥ 1/2, B va juca intotdeauna X, in timp ce economistul va alege X, iar inginerul Y. Daca A este economist, echilibrul bayesian rezultat va fi (X,X) care este un echilibru Nash. In schimb, daca A este inginer, chiar daca probabilitatea a fost mai mica, el va alege Y, iar echilibrul bayesian rezultat (Y,X) nu este un echilibru Nash. Prin urmare nu orice echilibru bayesian este si un echilibru Nash.

Jocurile secventiale cand informatia este incompleta

Intr-un joc secvential, deciziile unui jucator pot scoate in evidenta informatii cu privire la tipul acestuia, ceea ce poate modifica anticiparile celorlalti jucatori. Atunci cand aplicam inductia inversa va trebui sa tinem seama de modificarile anticiparilor. Sa presupunem in jocul anterior ca B nu cunoaste tipul lui A, dar ca A joaca inaintea lui B si B stie ceea ce joaca A. B are atunci doua ansambluri de informatie: primul contine doua noduri situate dupa decizia X, iar cel de-al doilea doua noduri situate dupa decizia Y. X fiind strategie strict dominanta pentru economist, iar Y strategie strict dominanta pentru inginer, jucand X sau Y, A arata de ce tip este. B va avea tot interesul sa joace X, daca A joaca X si Y daca A joaca Y (iata un exemplu de avantaj al celei de-a doua miscari). Prin urmare solutia jocului, in functie de tipul lui A, va fi (X,X) sau (Y,Y) si reprezinta exemple de echilibru bayesian perfect. Procesul de revizuire a anticiparilor poarta numele de proces bayesian si arata ca jucatorii aplica teorema lui Bayes pentru a-si modifica previziunile in functie de deciziile anterioare ale celorlalti jucatori.

Cum pot fi aplicate informatiile pe care ni le furnizeaza ultimele doua tipuri de jocuri despre care am discutat?

Sa luam exemplul unui duopol Cournot si sa presupunem ca functiile profitului celor doua firme A si B sunt de forma:

i=Qi(Mi-Qi-Qj), in care Qi, Qj reprezinita cantitatile oferite de cele doua firme, iar Mi o informatie privata referitoare la firma i. Pentru firma A Mi este 1, iar B cunoaste acest lucru. In schimb B dispune de o informatie privata Mi pe care firma A nu o cunoaste. A stie doar ca Mi este 3/4 cu probabilitatea 1/2 si 5/4 cu probabilitatea 1/2. Cat vor produce cele doua firme?

Vom incepe cu firma B, pentru care maximizarea profitului, in functie de tipul sau, inseamna maximizarea relatiei:

2=Q2(M2-Q1-Q2), de unde rezulta prin egalarea primei derivate cu zero:

Q2*= (M2-Q1)/2.

Firma A, in functie de informatia firmei B, are functia profitului de forma ∏1=1/2Q1[1-Q1-(3/4-Q1)/2]+ 1/2Q1[1-Q1-(5/4-Q1)/2]. Egaland prima derivata cu zero vom obtine:

Q1=[2-Q2*(3/4)-Q2*(5/4)]/4, de unde inlocuind Q2* obtinem:

Q1*=1/3 si Q2*=5/24 sau Q2*=11/24.

Ultimele modele de jocuri se pot aplica insa si pentru alte situatii caracterizate prin asimetria informatiei, cum ar fi selectia adversa, hazardul moral s.a..





Politica de confidentialitate





Copyright © 2024 - Toate drepturile rezervate