nash equilibrium


facebook twitter əjdaha lazımdı   googllalink

    1. oyunlar nəzəriyyəsinin əsası olan və john nash'ın 23 yaşında ortaya atdığı teorem. riyaziyyatçılar çox vaxt nash teoremi deyir. oyunlar nəzəriyyəsində hər oyunun öz elementləri var. oyunlar özləri isə statik və dinamik oyunlara ayrılır. birində oyun oyunçuların eyni anda verdiyi qərarlar ilə başlayır, digərində isə tam əksinə qərarlar ardıcıl olur. öz dilimizdə desək; bir oyun statikdi yəni pek fazla dəyişən yoxdu digəri isə dinamik. əvvəlcə statik oyunlara baxaq;

    statik oyunlarda elementləri tərif etmək üçün çoxluqlardan istifadə edəcəyik. hər oyunçu üçün strategiya və nəticə (bal, skor və s. də deyilir) iki çoxluğumuz olacaq. məsələn; n=(1,2,3...,n) bu çoxluğa strategiya çoxluğu deyə bilərik. burda n oyunçu sayını göstərir. hər oyunda seçdiyimiz strategiyalar bu çoxluğun elementləridir. strategiya özü isə bir oyun oynayarkən verdiyimiz qərarlar- seçimlərimizdir. bu çoxluq xeyli uzun ya da kiçik ola bilər; uzunluq oynanılan oyundan aslıdır. məs: "go" deyə bir oyun var; bir oyunda yüzlərlə strategiya olur və bu səbəbdən çoxluğun elementlərinin sayı çox olur- çoxluq uzun olur. nash teoremdə hər hansı "i" oyunçusunun hər hansı "j" strategiyasınıda "s" ilə göstərir. (düsturlarda görsəz nə olduğunu düşünərsiz deyə yazdım) burdan oyunçunun bütün strategiyalarının təyin olduğu çoxluğa o oyunçunun strategiya çoxluğu deyilir; s ilə işarə edəcəyik. s tək bir oyunçunun strategiya çoxluğudu, üstdəki n isə (bundan sonra "s" yazacam) bütün oyunçuların strategiya çoxluğudu. çoxluqları bildik; bəs oyunçuların skorlarını necə təyin edək? bunun üçün funksiyalardan istifadə etməli olacağıq. bayaq ələ aldığımız "i" oyunçusunun skorunu: skor funksiyası "pi" ilə göstərəcəyik. (düsturlarda vurma işarəsi kimi göstərilir çox vaxt: eyler hasili kimi) indi bir nümunə ilə izah edim;

    internetdə, kitablarda bir sözlə yuxarıdakı əlaqələri izah etmək üçün bir çox mənbədə bu nümunə çox sıx hallanır; iki firma düşünün. reklam vermiş olsunlar; reklamda: hər iki firmanın mallarının qiyməti sabir olsun (sabit satılsın); hər iki firma reklam səviyyəsini "yüksək" və ya "aşağı" seçmiş olsun; (səviyyə=keyfiyyət); firmaların bazardakı payı firmalar tərəfindən seçilmiş reklamların nisbi keyfiyyətinə bağlı olsun. nash bütün bunları belə izah edir: iki oyunçu (firmalara oyunçu deyəcəyik) və iki strategiya çoxluğumuz (yüksək və aşağı keyfiyyətlər) var. skor funksiyası üçün oyunçuların strategiya çoxluğunu yazsaq- s=(b,c) [çox vaxt hər iki hərfin aşağısında indekslər yazılır] firmaların çoxluqdan seçdiyi strategiyaları götürək; m firması (oyunçu) b strategiyasını digəri isə c ni seçmiş olsun. (indeksləri unutmayın) hər ikisinin bazar payını toplayanda 1'ə bərabər olur əlbəttə ki. mən burda göstərə bilmirəm ancaq sonda link verəcəm ordan baxa bilərsiz skor funksiyasını tapmaq qaydasına; nə isə. hər iki oyunçunun skor funksiyalarını bilirik. skor funksiyalarından tapdığımız; firmaların yüksək keyfiyyətli reklam seçdikləri halda bazar paylarının 50/50 olacağıdır. internetdən tapa biləcəyiniz skor matrixinə hər iki oyunçu üçün tapdığımız funksiyaları yazırıq. bu matrixdən hansı firma hansı reklam səviyyəsini seçsə nə qədər qazanacaq; başarılı olacaq yoxsa yox asanlıqla tapmaq olur. oyunlar nəzəriyyəsinin dili ilə desək; hansı strategiyanın oyunçu üçün daha yaxşı olduğunu bilə bilirik bu sayədə. birdə bir şeyi öyrənəcəyik; hər iki firma hansı strategiyanı seçsə hər ikisi üçün daha yaxşı olacaq. buna nash tarazlığı deyəcəyik. yuxarıda verdiyim örnəkdə oyunçular rəqabətdə olduğu üçün hər iki oyunçu özü üçün yaxşı olanı istəyəcək ancaq tam fərqli və ən məşhur nümunə ilə birdə nəzəriyyəyə baxaq;

    çox məşhur prisonners dilemma'nı nəzərdə tuturam. bu nümunə hər yerdə nash tarazlığını ifadə etmək üçün istifadə olunur. dilemma fizik və riyaziyyatçı neumann tərəfindən ortaya atılıb.

    (bax: extreme value theorem)

    oyunlar nəzəriyyəsinin iki əsas teoremindən biri nash teoremi (nash tarazlığı) digəri isə neumanın bu teoremidir.

    məhkumlar dilemması bizə oyunun bir oyunçusunun öz mənffətinin digər oyunçu ilə birlikdə olan toplam mənffətləri ilə örtüşmədiyini göstərir.

    neumann özü belə bir düşüncə təcrübəsi ortaya atıb:

    iki dost olsun və hər ikisindən veriləcək iki təklifdən ancaq birini seçməkləri tələb olunsun;

    a) mənə 1000$ verin.
    b) dostuma 5000$ verin.

    öz qazancını güdən hər kəs təbii ki a variantını seçəcək. ancaq gəlin neumannın deyişi ilə məsələyə baxaq; hər dost b ni seçsəydi hər dostun 1000$ yox 5000$ ı olacaqdı. toplam qazanc: 10000$ olacaqdı. ancaq hər ikisi a nı seçdiyi üçün hər biri cəmi 1000$ qazandı, toplamda 2000$. nəticədə həm öz qazancları az oldu həm də toplam qazancları. burda nash belə fikirləşdi; hər iki oyunçu öz şəxsi yox hər ikisinin mənfəətini düşünsəydi həm öz həm də toplam qazancları 5 dəfə daha çox olacaqdı. nash teoremi ilə desək; oyunçular arasında qurulacaq tarazlıq ümumi mənfəət üçün ən uğurlu strategiyadır. teoremin özü budur. bunu dövlətlər arası münasibətlərdən tut neft ixracına qədər tətbiq etmək olar.

    nash teoremini riyazi dildə ifadə etsək; s n oyunçusu üçün bir strategiya çoxluğu olsun. bu strategiya çoxluğuna görə hər i oyunçusu üçün strategiya çoxluğunda s(index i) uyğun gələrsə nash tarazlığı yaranır. belə yazaq;

    π(index i)(s1, s2,....,si,.....,....s (index n))≥π(index i)=(s1, s2,....,si,...,s (index n))

    neumannın maximum, minimum strategiyaları və s. haqqında üstdə verdiyim bax'da yazacam.


sən də yaz!