სუფთა სტრატეგიული თამაშები. თამაშის თეორია და სტატისტიკური გადაწყვეტილებები

01.03.2019

ბიმატრიქსის თამაშის აღწერა. ყველა თამაში, რომელიც განიხილება, ეკუთვნოდა კლასს ნულოვანი ჯამის თამაშები. თუმცა, მთელი რიგი კონფლიქტური სიტუაციები, რომლებიც წარმოიქმნება ქმედებების მსვლელობისას, ხასიათდება იმით, რომ ერთი მხარის მოგება ზუსტად არ უდრის მეორის დანაკარგს. თამაშის თეორიული მოდელებიასეთი სიტუაციები არის არაკოოპერაციული არანულოვანი ჯამის თამაშები. ასეთ თამაშებს ბიმატრიცას უწოდებენ, რადგან თითოეული ასეთი თამაშის ამოცანა მცირდება ერთი და იმავე ფორმის ორი მატრიცის ამოცანამდე: .

პროცესი ბიმატრიქსის თამაშიმოიცავს I მოთამაშის მიერ ნომრის დამოუკიდებელ არჩევანში და რიცხვის II მოთამაშის მიერ, რის შემდეგაც მოთამაშე I იღებს გამარჯვებას, ხოლო მოთამაშე II იღებს გამარჯვებას.

მატრიცების მწკრივის ნომრები ეწოდება სუფთა მოთამაშის სტრატეგიები I და ამ მატრიცების სვეტების ნომრები არის სუფთა მოთამაშის სტრატეგიები II. შემდეგ ფორმის წყვილი იქნება სიტუაციები სუფთა სტრატეგიებში ბიმატრიქსის თამაში, და ნომრები და არის I და II მოთამაშეების ანაზღაურება სიტუაციაში. შესაბამისად, I მოთამაშის სუფთა სტრატეგიების გამოყენების ალბათობის განაწილება არის და მოთამაშე II - ჩვენ დავურეკავთ შერეული სტრატეგიები. შემდეგ ფორმის წყვილი წარმოადგენს სიტუაციებს ბიმატრიქსის თამაშიშერეული სტრატეგიებიდა ნომრები და არის გამარჯვების მათემატიკური მოლოდინი I და II მოთამაშეებისთვის.

ბიმატრიქსის თამაშის წონასწორობა შერეულ სტრატეგიებშიჩვენ დავარქმევთ ისეთ წყვილს, რომლისთვისაც:

(8.2)
,

სად - მოსალოდნელი ღირებულებამოთამაშე I-ის მოგება;

გამარჯვების მათემატიკური მოლოდინი II მოთამაშისთვის;

ოპტიმალური შერეული მოთამაშის სტრატეგიაᲛᲔ;

ოპტიმალური შერეული მოთამაშის სტრატეგია II.

დავალება

ბიმატრიქსის თამაშის აგება და გადაწყვეტა. დავუშვათ, რომ რომელიმე ქვეყნის წყალქვეშა ნავი ეძებს ქვეყნის სარაკეტო წყალქვეშა ნავს, რომელიც მანევრირებს საბრძოლო საპატრულო ზონის მკაცრად განსაზღვრულ ნაწილში. დანარჩენ ტერიტორიას მართავს წყალქვეშა ნავი, რომელიც აწარმოებს წყალქვეშა სამძებრო სამუშაოებს. ნება მიეცით თითოეულმა წყალქვეშა ნავმა გამოიყენოს საკუთარი ჰიდროაკუსტიკური სადგური მტრის აღმოსაჩენად ან აქტიურ რეჟიმში, პერიოდულად ჩართოთ იგი, ან მხოლოდ პასიურ რეჟიმში, განახორციელოს უწყვეტი ძებნა.

ორივე წყალქვეშა წყალქვეშა ნავი და სარაკეტო წყალქვეშა ნავი, რომელსაც აქვს სონარის ამოცნობა, შეუძლია მოერიდოს მტერს. თუმცა, სონარის გააქტიურების სიხშირე შესაძლებელს ხდის აღმოჩენას, მაგრამ არასანდო.

მსგავსში კონფლიქტური სიტუაციაერთ-ერთი მოთამაშე წყალქვეშა ნავია, მეორე კი წყალქვეშა ნავი. ცხადია, სარაკეტო წყალქვეშა ნავი არ შეიძლება იყოს მოთამაშე, რადგან მას აქვს მოქმედების მხოლოდ ერთი რეჟიმი, რომელიც არის მალულად მანევრირება და აცილების მოქმედებების შესრულება. სონარის სიგნალების აღმოჩენა.

აქ დამახასიათებელი თვისება ის არის, რომ თითოეული მოთამაშე სხვადასხვა, მაგრამ არა საპირისპირო მიზნებს მისდევს. მართლაც, წყალქვეშა ნავის დანიშნულება არის სარაკეტო წყალქვეშა ნავის აღმოჩენა, ხოლო წყალქვეშა ნავის დანიშნულება არის წყალქვეშა ნავის აღმოჩენა. ამიტომ, თითოეული მოთამაშის მიერ მიზნის მიღწევის შესაფასებლად, მოქმედების არჩეული მეთოდების (სტრატეგიების) მიხედვით, აუცილებელია არსებობდეს ეფექტურობის ორი კრიტერიუმი და, შესაბამისად, ორი ანაზღაურებადი ფუნქცია. მაშინ ასეთი კონფლიქტური სიტუაციის მოდელი იქნება სასრული თამაში არანულოვანი ჯამით, რომელიც აღწერილია ერთი და იმავე ფორმის ორი მატრიცით. და ბიმატრიცას უწოდებენ.

ავიღოთ როგორც შესრულების კრიტერიუმიწყალქვეშა ნავი (მოთამაშე I) სარაკეტო წყალქვეშა ნავის აღმოჩენის ალბათობა და შესრულების კრიტერიუმიწყალქვეშა წყალქვეშა ნავი (მოთამაშე II) – წყალქვეშა ნავის აღმოჩენის ალბათობა. შემდეგ ბიმატრიქსის თამაში მოცემულია მატრიცით (სურათი 9.a) და მატრიცით (სურათი 9.ბ).


ბრინჯი. 9.ა.


ბრინჯი. 9.ბ.

სად - აქტიური რეჟიმის გამოყენება;

პასიური რეჟიმის გამოყენება.

ორმოთამაშიანი ნულოვანი ჯამის მატრიცული თამაში შეიძლება ჩაითვალოს შემდეგ აბსტრაქტულ ორმოთამაშიან თამაშად.

პირველ მოთამაშეს აქვს სტრატეგიები მე = 1,2,...,, მეორე აქვს სტრატეგიები = 1,2,...,. თითოეული წყვილი სტრატეგია ( მე, ) შესაბამისი ნომერი იჯ , 1 მოთამაშის მოგების გამოხატვა მე-2 მოთამაშის ხარჯზე, თუ პირველი მოთამაშე მიიღებს მას მე- yu სტრატეგია და 2 – საკუთარი სტრატეგია.

თითოეული მოთამაშე აკეთებს ერთ ნაბიჯს: მოთამაშე 1 ირჩევს თავისს მესტრატეგია ( მე= ), 2 - შენი სტრატეგია ( =
), რის შემდეგაც მოთამაშე 1 იღებს მოგებას იჯმე-2 მოთამაშის ხარჯზე (თუ იჯ < 0, მაშინ ეს ნიშნავს, რომ მოთამაშე 1 იხდის მეორე თანხას | იჯ|). აქ მთავრდება თამაში.

თითოეული მოთამაშის სტრატეგია მე=
;
=
ხშირად წმინდა სტრატეგიას უწოდებენ.

თუ გავითვალისწინებთ მატრიცას

=

შემდეგ მატრიცული თამაშის თითოეული თამაშის ჩატარება მატრიცით მოდის პირველი მოთამაშის არჩევანზე მემე-2 რიგი და მოთამაშე 2 მე-2 სვეტი და მოთამაშე 1 (მოთამაშის 2-ის ხარჯზე) იღებს მოგებას ij .

თამაშების შესწავლაში მთავარია მოთამაშეთა ოპტიმალური სტრატეგიის კონცეფცია. ამ კონცეფციას ინტუიციურად აქვს შემდეგი მნიშვნელობა: მოთამაშის სტრატეგია ოპტიმალურია, თუ ამ სტრატეგიის გამოყენება უზრუნველყოფს მას ყველაზე დიდ გარანტირებულ მოგებას სხვა მოთამაშის ყველა შესაძლო სტრატეგიისთვის. ამ პოზიციებზე დაყრდნობით, მოთამაშე 1 იკვლევს ანაზღაურების მატრიცას შემდეგნაირად: თითოეული ღირებულებისთვის მე (მე =
) მინიმალური მოგების ღირებულება განისაზღვრება მე-2 მოთამაშის მიერ გამოყენებული სტრატეგიების მიხედვით

იჯ (მე=
)

იმათ. განსაზღვრული მინიმალური მოგებამოთამაშისთვის 1, იმ პირობით, რომ ის მიიღებს მის მეწმინდა სტრატეგია, მაშინ ამ მინიმალური ანაზღაურებიდან ასეთი სტრატეგია გვხვდება მე = მე , რომლის დროსაც ეს მინიმალური მოგება იქნება მაქსიმალური, ე.ი. მდებარეობს


იჯ =
=(1)

განმარტება . ნომერი , განსაზღვრული ფორმულით (1) ეწოდება დაბალი წმინდა ფასი თამაშები და გვიჩვენებს, თუ რა მინიმალური მოგების გარანტია შეუძლია მოთამაშეს 1 თავისთვის თავისი სუფთა სტრატეგიების გამოყენებით მე-2 მოთამაშის ყველა შესაძლო მოქმედებისთვის.

მოთამაშე 2, თავისი ოპტიმალური ქცევით, უნდა ცდილობდეს, თუ ეს შესაძლებელია, თავისი სტრატეგიების მეშვეობით, მინიმუმამდე დაიყვანოს მოთამაშის ანაზღაურება. ამიტომ, მე-2 მოთამაშისთვის ჩვენ ვხვდებით

იჯ

იმათ. მოთამაშის 1-ის მაქსიმალური მოგება განისაზღვრება იმ პირობით, რომ მოთამაშე 2 გამოიყენებს მას სუფთა სტრატეგია, შემდეგ მოთამაშე 2 ეძებს საკუთარს = 1 სტრატეგია, რომელშიც მოთამაშე 1 მიიღებს მინიმალურ მოგებას, ე.ი. აღმოაჩენს


იჯ =
=(2).

განმარტება . ნომერი ფორმულით (2) განსაზღვრული ეწოდება წმინდა ზედა ფასი თამაშები და გვიჩვენებს, რა მაქსიმალური მოგების გარანტია შეუძლია მოთამაშეს 1 თავისთვის თავისი სტრატეგიებიდან გამომდინარე.

სხვა სიტყვებით რომ ვთქვათ, თავისი სუფთა სტრატეგიების გამოყენებით, მოთამაშე 1 შეუძლია უზრუნველყოს მოგება არანაკლებ და მე-2 მოთამაშეს, თავისი სუფთა სტრატეგიების გამოყენებით, შეუძლია 1 მოთამაშეზე მეტი მოგების თავიდან აცილება .

განმარტება . თუ თამაშში A მატრიცით =შემდეგ ამბობენ, რომ ამ თამაშს აქვს უნაგირს წერტილი წმინდა სტრატეგიებში და სუფთა ფასი თამაშები

 = =.

უნაგირის წერტილი არის სუფთა სტრატეგიების წყვილი (მე , ) შესაბამისად, მოთამაშეები 1 და 2, რომლებშიც მიიღწევა თანასწორობა =. ამ კონცეფციას აქვს შემდეგი მნიშვნელობა: თუ ერთ-ერთი მოთამაშე იცავს უნაგირების წერტილის შესაბამის სტრატეგიას, მაშინ მეორე მოთამაშეს არ შეუძლია გააკეთოს უკეთესი, ვიდრე დაიცვას უნაგირების წერტილის შესაბამისი სტრატეგია. მათემატიკურად, ეს შეიძლება სხვაგვარად დაიწეროს:


სად მე, – 1 და 2 მოთამაშეების ნებისმიერი სუფთა სტრატეგია, შესაბამისად; (მე , ) - სტრატეგიები, რომლებიც ქმნიან საყრდენ წერტილს.

ამრიგად, (3) საფუძველზე, უნაგირ ელემენტს
მინიმალურია i o-ე მწკრივში და მაქსიმალურია j o-ე სვეტში A მატრიცაში. ხაზიიპოვეთ მინიმალური ელემენტი და შეამოწმეთ არის თუ არა ეს ელემენტი მასში მაქსიმალური სვეტი. თუ კი, მაშინ ეს არის უნაგირის ელემენტი და მის შესაბამისი სტრატეგიების წყვილი ქმნის უნაგირის წერტილს. რამდენიმე სუფთა სტრატეგია (მე , ) მოთამაშეები 1 და 2, რომლებიც ქმნიან უნაგირის წერტილს და უნაგირის ელემენტს
, დაურეკა თამაშის გადაწყვეტა . სადაც მე და უწოდებენ ოპტიმალური გაწმენდა სტრატეგიები შესაბამისად 1 და 2 მოთამაშეები.

მაგალითი 1

უნაგირის წერტილი არის წყვილი ( მე = 3; = 1), სადაც = == 2.

გაითვალისწინეთ, რომ თუმცა ანაზღაურება სიტუაციაში (3;3) ასევე უდრის 2 =-ს =, ეს არ არის უნაგირის წერტილი, რადგან ეს მოგება არ არის მაქსიმალური მესამე სვეტის მოგებათა შორის.

მაგალითი 2

ანაზღაურების მატრიცის ანალიზიდან ირკვევა, რომ
, ე.ი. ამ მატრიცას არ აქვს უნაგირის წერტილი. თუ მოთამაშე 1 ირჩევს თავის სუფთა მაქსიმინის სტრატეგიას მე = 2, შემდეგ მოთამაშე 2, ირჩევს მის მინიმქს = 2, წააგებს მხოლოდ 20. ამ შემთხვევაში, მოთამაშე 1-ისთვის მომგებიანია აირჩიოს სტრატეგია i = 1, ე.ი. გადაუხვიეთ მისი სუფთა მაქსიმინის სტრატეგიას და მოიგეთ 30. მაშინ მე-2 მოთამაშისთვის მომგებიანი იქნება სტრატეგიის არჩევა j = 1, ე.ი. გადაუხვიოს თავისი სუფთა მინიმალური სტრატეგიიდან და წააგოს 10. თავის მხრივ, მოთამაშე 1-მა უნდა აირჩიოს თავისი მე-2 სტრატეგია 40-ის მოსაგებად, ხოლო მოთამაშე 2 უპასუხებს მე-2 სტრატეგიის არჩევით და ა.შ.

მოდით შევხედოთ მაგალითს. მიეცით თამაშის მატრიცა (4):

ჩვენ უნდა ვიპოვოთ თამაშის ქვედა ფასი α, თამაშის ზედა ფასი β და მინიმალური სტრატეგიები და შევამოწმოთ არის თუ არა ისინი სტაბილური. გამოსავალი. დამატებითი სვეტისა და მწკრივის ანალიზიდან ვიღებთ: α = 5, β = 5. მაქსიმინი უდრის მინიმუმს! ეს განსაკუთრებული შემთხვევაა. რა მოჰყვება აქედან? ავიღოთ რამდენიმე მინიმალური სტრატეგია: K 2 და C 3. თუ ორივე იცავს ამ სტრატეგიას, მაშინ ანაზღაურება იქნება 5. ახლა, ვთქვათ, ჩვენ გავიგეთ მტრის ქცევის შესახებ. Რას ვაკეთებთ? არაფერი! ჩვენ გავაგრძელებთ K2 სტრატეგიის დაცვას, რადგან მისგან ნებისმიერი გადახრა ჩვენთვის წამგებიანია. ვიცით თუ არ ვიცით მტრის ქცევის შესახებ, ჩვენ მაინც დავიცავთ K 2 სტრატეგიას! იგივე ეხება "ლურჯებს" - მათთვის აზრი არ აქვს C 3 სტრატეგიის შეცვლას. ამ მაგალითში K 2 და C 3 სტრატეგიების წყვილი სტაბილურია, ანუ წარმოადგენს წონასწორობის პოზიციას და იძლევა თამაშის გამოსავალს. რატომ მოხდა ეს? რადგან მატრიცაში არის სპეციალური ელემენტი 5; ის მინიმალურია თავის მწკრივში და ამავე დროს მაქსიმალურია თავის სვეტში. ასეთ ელემენტს ე.წ უნაგირის წერტილი. თუ მატრიცას აქვს უნაგირის წერტილი (ანუ, თამაშის დაბალი ფასი უდრის ზედა), მაშინ თამაშს აქვს გამოსავალი სუფთა სტრატეგიებში: ეს არის სტრატეგიების წყვილი, რომლებიც იკვეთება უნაგირის წერტილში. თავად უნაგირის წერტილი იძლევა თამაშის ფასს - ჩვენს მაგალითში ის უდრის 5-ს. თამაშების კლასს, რომელსაც აქვს უნაგირის წერტილი, დიდი მნიშვნელობა აქვს თამაშის თეორიაში. კერძოდ, დადასტურდა, რომ თუ თამაშის წესების მიხედვით, თითოეულმა მოთამაშემ იცის ყველა წინა სვლის შედეგი, როგორც საკუთარი, ასევე მოწინააღმდეგის (ე.წ. თამაში სრული ინფორმაციით), მაშინ თამაშს აქვს უნაგირის წერტილი და, შესაბამისად, აქვს გამოსავალი სუფთა სტრატეგიებში. სრული ინფორმაციის მქონე თამაშების მაგალითებია: ჭადრაკი, ქვები, ტიკ-ტაკი და ა.შ. მოვიყვანოთ თამაშის მაგალითი სრული ინფორმაციით, რომლის გადაწყვეტაც ადვილი მოსაძებნია. ორი მოთამაშე - K და C - მონაცვლეობით ათავსებენ იდენტურ მონეტებს მრგვალ მაგიდაზე. თითოეული მონეტის პოზიცია არჩეულია თვითნებურად, თუ ის არ ემთხვევა სხვებს. უკანასკნელი მოთამაშე, ვინც მოათავსებს მონეტას, იმარჯვებს (როცა ადგილი არ რჩება სხვებისთვის). ღირს ცოტათი დაფიქრება, რათა დავრწმუნდეთ, რომ ამ თამაშის შედეგი ყოველთვის წინასწარ დასკვნაა და რომ არსებობს კარგად განსაზღვრული სტრატეგია, რომელიც გარანტირებულია მოგების გარანტია მოთამაშისთვის, რომელიც პირველ რიგში ჩადებს მონეტას (დაე, იყოს K). კერძოდ, K-მ პირველი მონეტა უნდა მოათავსოს მაგიდის ცენტრში, შემდეგ კი ყოველ სვლაზე C-მ უნდა უპასუხოს მაგიდის ცენტრთან მიმართებაში ზუსტად სიმეტრიული მოძრაობით! ღარიბ ს-ს შეუძლია ისე მოიქცეს, როგორც უნდა, მაგრამ გასაქცევი მაინც არ აქვს... ცხადია, ასეთ თამაშს აზრი მხოლოდ მათთვის აქვს, ვინც გამოსავალი არ იცის. საინტერესოა, რომ ზუსტად იგივე სიტუაციაა ასეთებთან პოპულარული თამაშიჭადრაკის მსგავსად! ამ თამაშს აქვს აზრი მხოლოდ მანამ, სანამ გამოსავალი არ მოიძებნება. თეორიულად დადასტურდა, რომ გამოსავალი არსებობს და ჭადრაკის თამაშის შედეგი არსებითად წინასწარ არის განსაზღვრული: თუ თითოეული მხარე გამოიყენებს თავის ოპტიმალურ სტრატეგიას, მაშინ თამაში ან ყოველთვის თეთრების გამარჯვებით დასრულდება, ან ყოველთვის შავის გამარჯვებით. ან ყოველთვის გათამაშებაში! მაგრამ კონკრეტულად რა? ეს ჯერ არ ვიცით, რადგან შესაძლო სტრატეგიების რაოდენობა ძალიან დიდია იმისათვის, რომ ჭადრაკის თამაშის მატრიცა ავაშენოთ და მასში უნაგირი წერტილი ვიპოვოთ... ალბათ, ჭადრაკის მოყვარულებს აინტერესებთ ის ფაქტი, რომ ჭადრაკი თამაში მალე არ მოგვარდება. დასკვნის სახით აღვნიშნოთ, რომ მატრიცაში შეიძლება იყოს არა ერთი, არამედ რამდენიმე უნაგირის წერტილი; მაშინ სუფთა სტრატეგიებში თამაშის იმდენი გამოსავალია, რამდენიც არის უნაგირის წერტილები. თითოეული მათგანი მოგებას იძლევა, ფასის ტოლითამაშები.

სუფთა სტრატეგიამოთამაშე I უნდა აირჩიოს ანაზღაურების მატრიცის A n მწკრივიდან ერთ-ერთი, ხოლო II მოთამაშის სუფთა სტრატეგია არის იმავე მატრიცის ერთ-ერთი სვეტის არჩევა.

ოპტიმალური სუფთა მოთამაშის სტრატეგიები განსხვავდება შერეულისგან სავალდებულო ერთეულის არსებობით p i = 1, q i = 1. მაგალითად: P(1,0), Q(1,0). აქ p 1 = 1, q 1 = 1.

პრობლემა 1
გადახდის მატრიცის გამოყენებით, იპოვნეთ ოპტიმალური სუფთა სტრატეგიები მკაცრი დომინირების პრინციპის გამოყენებით. პასუხად ჩაწერეთ ვექტორები P*, Q*.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

გამოსავალი:

ჩვენ ყველა პრობლემას ვაგვარებთ კალკულატორის მატრიცის თამაშის გამოყენებით.

ჩვენ ვვარაუდობთ, რომ მოთამაშე I ირჩევს თავის სტრატეგიას ისე, რომ მაქსიმალურად გაზარდოს თავისი ანაზღაურება, ხოლო მოთამაშე II ირჩევს თავის სტრატეგიას ისე, რომ მინიმუმამდე დაიყვანოს I მოთამაშის ანაზღაურება.

მოთამაშეებიB 1B 2B 3B 4a = min (A i)
A 13 1 2 5 1
A 22 0 0 3 0
A 3-3 -5 -5 -2 -5
A 40 -2 -2 1 -2
b = max(B i)3 1 2 5
ჩვენ ვპოულობთ გარანტირებულ ანაზღაურებას, რომელიც განისაზღვრება დაბალი ფასითამაში a = max(a i) = 1, რაც მიუთითებს მაქსიმალურ სუფთა სტრატეგიაზე A 1 .
თამაშის ზედა ფასი b = min(b j) = 1.
უნაგირის წერტილი (1, 2) მიუთითებს ალტერნატივის წყვილის გადაწყვეტაზე (A1,B2). თამაშის ფასი არის 1 ლარი.
2. შეამოწმეთ გადახდის მატრიცა დომინანტური რიგებისა და დომინანტური სვეტებისთვის.
ზოგჯერ, თამაშის მატრიცის მარტივი გამოკვლევის საფუძველზე, შეიძლება ითქვას, რომ ზოგიერთი სუფთა სტრატეგია შეიძლება შევიდეს მხოლოდ ოპტიმალურ შერეულ სტრატეგიაში ნულოვანი ალბათობით.
ამას ამბობენ მე-ემასზე დომინირებს პირველი მოთამაშის სტრატეგია ქთსტრატეგია, თუ a ij ≥ a kj ყველასთვის j E Nდა ერთი მაინც ა ი > ა კჯ . ამ შემთხვევაში ისიც ნათქვამია მე-ესტრატეგია (ან ხაზი) ​​- დომინანტი, კ-ე– დომინირებდა.
ამას ამბობენ ჯ-იმასზე დომინირებს მე-2 მოთამაშის სტრატეგია სტრატეგია თუ ყველასთვის j E M a ij ≤ a il და ერთი მაინც i a ij< a il . В этом случае j-thსტრატეგიას (სვეტს) ეწოდება დომინანტი, – დომინირებდა.
სტრატეგია A 1 დომინირებს A 2 სტრატეგიაში (1 რიგის ყველა ელემენტი მეტია ან ტოლია მე-2 რიგის მნიშვნელობებზე), ამიტომ ჩვენ გამოვრიცხავთ მატრიცის მე-2 მწკრივს. ალბათობა p 2 = 0.
სტრატეგია A 1 დომინირებს A 3 სტრატეგიაში (1 რიგის ყველა ელემენტი მეტია ან ტოლია მე-3 რიგის მნიშვნელობებზე), ამიტომ გამოვრიცხავთ მატრიცის მე-3 მწკრივს. ალბათობა p 3 = 0.
3 1 2 5
0 -2 -2 1

B მოთამაშის ზარალის თვალსაზრისით, B 1 სტრატეგია დომინირებს B 2 სტრატეგიაში (1 სვეტის ყველა ელემენტი მეტია მე-2 სვეტის ელემენტებზე), ამიტომ ჩვენ გამოვრიცხავთ მატრიცის 1 სვეტს. ალბათობა q 1 = 0.
B მოთამაშის დანაკარგების თვალსაზრისით, B 4 სტრატეგია დომინირებს B 1 სტრატეგიაში (მე-4 სვეტის ყველა ელემენტი აღემატება 1-ლი სვეტის ელემენტებს), ამიტომ გამოვრიცხავთ მატრიცის მე-4 სვეტს. ალბათობა q 4 = 0.
1 2
-2 -2

ჩვენ შევამცირეთ 4 x 4 თამაში 2 x 2 თამაშზე.



თამაშის გადაწყვეტა ( 2 x n


p 1 = 1
p 2 = 0
თამაშის ფასი, y = 1
ახლა ჩვენ შეგვიძლია ვიპოვოთ B მოთამაშის მინიმალური სტრატეგია განტოლებათა შესაბამისი სისტემის ჩაწერით
q 1 = 1
q 1 + q 2 = 1
ამ სისტემის გადაჭრისას ჩვენ ვხვდებით:
q 1 = 1.
პასუხი:
თამაშის ფასი: y = 1, მოთამაშის სტრატეგიის ვექტორები:
Q(1, 0), P(1, 0)

∑a ij q j ≤ v
∑a ij p i ≥ v
M(P 1 ;Q) = (1 1) + (2 0) = 1 = v
M(P 2 ;Q) = (-2 1) + (-2 0) = -2 ≤ v
M(P;Q 1) = (1 1) + (-2 0) = 1 = v
M(P;Q 2) = (2 1) + (-2 0) = 2 ≥ v

ვინაიდან რიგები და სვეტები ამოღებულ იქნა ორიგინალური მატრიციდან, ნაპოვნი ალბათობის ვექტორები შეიძლება დაიწეროს როგორც:
P(1,0,0,0)
Q(0,1,0,0)

პრობლემა 2
გადახდის მატრიცის გამოყენებით იპოვნეთ თამაშის ქვედა და ზედა ფასი. თუ არის უნაგირის წერტილი, ჩაწერეთ ოპტიმალური სუფთა სტრატეგიების ვექტორები P*, Q*.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

გამოსავალი:
1. შეამოწმეთ აქვს თუ არა გადახდის მატრიცას უნაგირის წერტილი. თუ კი, მაშინ ჩვენ ვწერთ თამაშის გამოსავალს სუფთა სტრატეგიებში.
მოთამაშეებიB 1B 2B 3a = min (A i)
A 1-6 -5 0 -6
A 2-8 -3 -2 -8
A 3-3 -2 3 -3
b = max(B i)-3 -2 3

ჩვენ ვპოულობთ გარანტირებულ ანაზღაურებას, რომელიც განისაზღვრება თამაშის დაბალი ფასით a = max(a i) = -3, რაც მიუთითებს მაქსიმალურ სუფთა სტრატეგიაზე A 3 .
თამაშის ზედა ფასი b = min(b j) = -3.
უნაგირის წერტილი (3, 1) მიუთითებს წყვილი ალტერნატივის გადაწყვეტაზე (A3,B1). თამაშის ღირებულებაა -3.
პასუხი: P(0,0,1), Q(1,0,0)

პრობლემა 3
გადახდის მატრიცის გამოყენებით იპოვეთ ოპტიმალური სტრატეგიების P*, Q* და თამაშის ფასის ვექტორები. რომელი მოთამაშე იგებს?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

გამოსავალი:
1. შეამოწმეთ აქვს თუ არა გადახდის მატრიცას უნაგირის წერტილი. თუ კი, მაშინ ჩვენ ვწერთ თამაშის გამოსავალს სუფთა სტრატეგიებში.
ჩვენ ვვარაუდობთ, რომ მოთამაშე I ირჩევს თავის სტრატეგიას ისე, რომ მაქსიმალურად გაზარდოს თავისი ანაზღაურება, ხოლო მოთამაშე II ირჩევს თავის სტრატეგიას ისე, რომ მინიმუმამდე დაიყვანოს I მოთამაშის ანაზღაურება.
მოთამაშეებიB 1B 2B 3B 4a = min (A i)
A 1-6 -6 2 4 -6
A 22 -2 7 -1 -2
b = max(B i)2 -2 7 4

ჩვენ ვპოულობთ გარანტირებულ ანაზღაურებას, რომელიც განისაზღვრება თამაშის დაბალი ფასით a = max(a i) = -2, რაც მიუთითებს მაქსიმალურ სუფთა სტრატეგიაზე A 2 .
თამაშის ზედა ფასი b = min(b j) = -2.
უნაგირის წერტილი (2, 2) მიუთითებს ალტერნატივის წყვილის გადაწყვეტაზე (A2,B2). თამაშის ღირებულებაა -2.
3. იპოვნეთ თამაშის გამოსავალი შერეულ სტრატეგიებში.
მოდით გადავჭრათ პრობლემა გეომეტრიული მეთოდის გამოყენებით, რომელიც მოიცავს შემდეგ ნაბიჯებს:
1. დეკარტის კოორდინატთა სისტემაში აბსცისის ღერძის გასწვრივ გამოსახულია სეგმენტი, რომლის სიგრძე უდრის 1-ს. სეგმენტის მარცხენა ბოლო (პუნქტი x = 0) შეესაბამება A 1 სტრატეგიას, მარჯვენა ბოლო - A სტრატეგიას. 2 (x = 1). შუალედური წერტილები x შეესაბამება ზოგიერთი შერეული სტრატეგიის ალბათობას S 1 = (p 1 ,p 2).
2. A 1 სტრატეგიის ანაზღაურება გამოსახულია მარცხენა ორდინატზე. ორდინატის პარალელურ წრფეზე 1 წერტილიდან ასახულია A 2 სტრატეგიის მოგება.
თამაშის გადაწყვეტა ( 2 x n) ჩვენ ვახორციელებთ A მოთამაშის პოზიციიდან მაქსიმინის სტრატეგიის დაცვით. არცერთ მოთამაშეს არ აქვს დომინანტური ან დუბლიკატი სტრატეგიები.

A მოთამაშის მაქსიმალური ოპტიმალური სტრატეგია შეესაბამება N წერტილს, რაზეც შეგვიძლია დავწეროთ შემდეგი სისტემაგანტოლებები:
p 1 = 0
p 2 = 1
თამაშის ფასი, y = -2
ახლა ჩვენ შეგვიძლია ვიპოვოთ B მოთამაშის მინიმალური სტრატეგია განტოლებათა შესაბამისი სისტემის დაწერით, B 1,B 3,B 4 სტრატეგიის გამოკლებით, რომელიც აშკარად დიდ ზარალს აძლევს B მოთამაშეს და, შესაბამისად, q 1 = 0,q. 3 = 0, q 4 = 0.
-2q 2 = -2
q 2 = 1
ამ სისტემის გადაჭრისას ჩვენ ვხვდებით:
q 2 = 1.
პასუხი:
თამაშის ფასი: y = -2, მოთამაშის სტრატეგიის ვექტორები:
Q(0, 1, 0, 0), P(0, 1)
4. შევამოწმოთ თამაშის ამოხსნის სისწორე სტრატეგიის ოპტიმალური კრიტერიუმის გამოყენებით.
∑a ij q j ≤ v
∑a ij p i ≥ v
M(P 1 ;Q) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ v
M(P 2 ;Q) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = v
M(P;Q 1) = (-6 0) + (2 1) = 2 ≥ v
M(P;Q 2) = (-6 0) + (-2 1) = -2 = v
M(P;Q 3) = (2 0) + (7 1) = 7 ≥ v
M(P;Q 4) = (4 0) + (-1 1) = -1 ≥ v
ყველა უტოლობა დაკმაყოფილებულია როგორც თანასწორობა ან მკაცრი უტოლობა, შესაბამისად, თამაშის გამოსავალი სწორად არის ნაპოვნი.

პრობლემა 4
გაეცით კითხვაზე დეტალური პასუხი

სუფთა სტრატეგია- განმსაზღვრელი (შემთხვევითობის გამოკლებით) სამოქმედო გეგმა. წინა თავში განვიხილეთ მხოლოდ სუფთა სტრატეგიები. შერეული სტრატეგიები განხილული იქნება 2.2 ნაწილში, მაგრამ ახლა, თუ სხვა რამ არ არის აღნიშნული, სტრატეგიაში ყოველთვის ვგულისხმობთ სუფთა სტრატეგიას.

ძალიან ხშირად პრეზენტაციის დროს ჩვენ ილუსტრირებთ ამოხსნის ცნებებს ბიმატრიქსის თამაშების მაგალითებით, ამიტომ მივცემთ შესაბამის განმარტებებს.

განმარტება 2.1. საბოლოო თამაშიარის თამაში, რომელშიც მოთამაშეთა ნაკრები და თითოეული მოთამაშის სტრატეგიების ნაკრები შეიცავს ელემენტების სასრულ რაოდენობას. ორი ადამიანის სასრული თამაში ეწოდება ბიმატრიქსის თამაში.

გვარი მომდინარეობს ასეთ თამაშში მოგების ჩაწერის მოსახერხებელი ფორმით - ორმაგი მატრიცის გამოყენებით.

შემდგომი ანალიზისთვის, მოსახერხებელია თვითნებური სტრატეგიის პროფილის s სტრატეგიების დაყოფა ზოგიერთი მე-ე მოთამაშის სტრატეგიად და ყველა სხვა მოთამაშის ს_ (. ფორმალურად, s = (.у, s,). აქ არ იგულისხმება, რომ ჩვენ ვცვლით სტრატეგიის პროფილის კოორდინატებს, ჩვენ უბრალოდ შემოგთავაზებთ მისი აღნიშვნის სხვა გზას.

თამაშის გადაწყვეტის პირველი კონცეფცია, რომელსაც ჩვენ განვიხილავთ, არის წონასწორობა დომინანტურ სტრატეგიებში.

განმარტება 2.2. /th მოთამაშის სტრატეგია მკაცრად დომინირებსმისი სტრატეგია თუ Uj(s jt s ,) > h,(s", s ,) ნებისმიერი ნაკრებისთვის s , დარჩენილი მოთამაშეების სტრატეგიები. ამ შემთხვევაში სტრატეგია s" ე.წ. მკაცრად დომინირებს.

არსებითად, ეს ნიშნავს, რომ ნებისმიერი დაფიქსირდასხვა მოთამაშეების სტრატეგიების კომპლექტში, მე-ე მოთამაშე, რომელიც ირჩევს სტრატეგიას s, იღებს მკაცრად უფრო დიდი გამარჯვებავიდრე სტრატეგიის არჩევისას". ლოგიკურია ვივარაუდოთ, რომ რაციონალურმა მოთამაშემ არ უნდა აირჩიოს მკაცრად დომინირებული სტრატეგიები.ასეთი ვარაუდი უმარტივეს თამაშებში შეიძლება საკმარისი იყოს თამაშის გამოსავლის მოსაძებნად.

განმარტება 2.3. სტრატეგიების პროფილი s* =(ს*, ს^,..., ს*) ეწოდება ბალანსი შიგნით (მკაცრად) დომინანტური სტრატეგიები, თუ რომელიმე მე-ე მოთამაშისთვის სტრატეგია s” მკაცრად დომინირებს მის რომელიმე სხვა სტრატეგიაში.

შეიძლება ჩანდეს, რომ გადაწყვეტის ამ კონცეფციამ შეიძლება გამოიწვიოს მხოლოდ ტრივიალური დასკვნები. თითოეულ მოთამაშეს აქვს ერთი სტრატეგია, რომელიც მისცემს მას უფრო მეტ მოგებას, ვიდრე ნებისმიერი სხვა, მიუხედავად იმისა, თუ როგორ იქცევიან მისი ოპონენტები. მაშინ ის გამოიყენებს ზუსტად ამ სტრატეგიას წონასწორობაში. ეს ყველაფერი საკმაოდ აშკარაა. მაგრამ ეს არის ზუსტად ის სიტუაცია, რომელიც დამახასიათებელია, ალბათ, ყველაზე ცნობილი და ძალიან მნიშვნელოვანი თამაშისთვის, რიგი პრაქტიკული სიტუაციების ანალიზისთვის, "პატიმართა დილემა".

მაგალითი 2.1 (პატიმართა დილემა). ორი კრიმინალი ცალკე საკნებში იმყოფება და ურთიერთობას ვერ ახერხებს. გამოძიებას აქვს საკმარისი მტკიცებულება, რომ თითოეული მათგანი მსუბუქ დანაშაულზე ერთი წლით გაასამართლოს. მაგრამ დიდი დანაშაულისთვის, რომლისთვისაც დამნაშავეებს ათწლიანი პატიმრობა ემუქრებათ, გამოძიებას არ აქვს საკმარისი მტკიცებულებები. გამოძიების წარმომადგენლები თითოეულ დამნაშავეს სთავაზობენ გარიგებას: დამნაშავე მიიღებს სასჯელს

ერთი წლით ნაკლები თუ მისცემს ჩვენებას პარტნიორის წინააღმდეგ, რაც საკმარისი იქნება ამ უკანასკნელის მძიმე დანაშაულის ჩასადენად. თუ ვივარაუდებთ, რომ კრიმინალებს მხოლოდ ციხეში გატარებული წლების რაოდენობა აინტერესებთ, ყოველი დამატებითი წელი იძლევა მინუს ერთ სარგებელს. მაშინ კრიმინალების მოგება შეიძლება წარმოდგენილი იყოს შემდეგი ორმაგი მატრიცით:

იმ შემთხვევაში, როდესაც თამაშში მონაწილეები არ არიან დასახელებული, ჩვენ ვივარაუდებთ, რომ პირველი მონაწილის სხვადასხვა სტრატეგიები შეესაბამება ორმაგი მატრიცის რიგებს, ხოლო მეორე მონაწილის სტრატეგიები შეესაბამება სვეტებს. თუ ჩვენს მაგალითში პირველი პატიმარი მისცემს ჩვენებას, მეორე კი არა, მაშინ პირველი გათავისუფლდება, მეორე კი ათი წლით თავისუფლების აღკვეთას მიიღებს.

ადვილი მისახვედრია, რომ, როგორც არ უნდა მოიქცეს სხვა პატიმარი, ანაზღაურება უფრო დიდია (პატიმრობის ვადა უფრო მოკლეა), თუ ჩვენებას მისცემთ (პირველი მოთამაშისთვის, ორმაგი მატრიცის პირველ რიგში პირველი კოორდინატები მკაცრად მეტია. ვიდრე მეორე რიგში, მეორე მოთამაშისთვის მეორე კოორდინატები პირველ სვეტშია, ორმაგი მატრიცა მკაცრად აღემატება მეორე სვეტს). შემდეგ დომინანტურ სტრატეგიებში წონასწორობა იქნება სტრატეგიების პროფილი (ჩვენების მიცემა, ჩვენების მიცემა).

ამ მაგალითში საინტერესო ის არის, რომ მოთამაშეები, ქცევის არჩევით, რომელიც ზრდის მათ ანაზღაურებას, ხვდებიან ისეთ სიტუაციაში, როდესაც მათი ანაზღაურება დაბალია საპირისპირო სიტუაციასთან შედარებით - როდესაც ორივე ირჩევს გაჩუმებას. ახსნა მდგომარეობს ძლიერი გარეგანი ეფექტის არსებობაში, ე.ი. ერთი მოთამაშის მოქმედებების ძლიერი გავლენა მეორე მოთამაშის მოგებაზე. შედეგად, სტრატეგიების წონასწორობის პროფილი აღმოჩნდება ერთადერთი პარეტო-არაეფექტური პროფილი ამ თამაშში. გაითვალისწინეთ, რომ პარეტოს ეფექტურობა, რომელიც სასურველია თამაშის მონაწილეთა თვალსაზრისით, შეიძლება არ იყოს სასურველი სოციალური თვალსაზრისით, როგორც ამ შემთხვევაში.

სიტუაციები, როგორიცაა პატიმრების დილემა, ხშირად ხდება ეკონომიკური სიტუაციების გაანალიზებისას. განვიხილოთ, მაგალითად, კონკურენცია ორ მაღაზიას შორის, რომლებიც ყიდიან პროდუქციის მსგავს კომპლექტს. სიმარტივისთვის, დავუშვათ, რომ მაღაზიებს შეუძლიათ მხოლოდ ორი დონის ფასი - მაღალი ან დაბალი. მომხმარებელს ბუნებრივია ურჩევნია იყიდოს მაღაზიიდან დაბალი ფასებით. მაშინ მაღაზიების მოგება, რომელიც ხასიათდება მათი მოგებით, შეიძლება გამოიყურებოდეს, მაგალითად, შემდეგნაირად:


წონასწორობის თვალსაზრისით, აქ სიტუაცია პატიმრების დილემის მსგავსია - წონასწორობა დომინანტურ სტრატეგიებში (დაბალი ფასები, დაბალი ფასები) ერთადერთი პარეტო-არაეფექტური პროფილია (და ასევე სასურველია სოციალური თვალსაზრისით).

პატიმრების დილემის უკვე ნახსენები ფართო პოპულარობა იყო მიზეზი იმისა, რომ მისი მაგალითის გამოყენებით ცდილობდნენ ექსპერიმენტულად შეემოწმებინათ თამაშის თეორიის პროგნოზების სისწორე. ჩეკი იყო ეს ორი უცნობებიშესთავაზა ფულის თამაში პრიზებით (მაგალითად, დოლარებში) ორი მაღაზიის თამაშისთვის მითითებულთან ახლოს. თითოეულმა მონაწილემ მიიღო გადაწყვეტილება ცალ-ცალკე (ხშირად ანონიმურად) და არ იცოდა სხვა მოთამაშის გადაწყვეტილება მანამ, სანამ გამარჯვებას არ მიიღებდა. აღმოჩნდა, რომ ასეთ პირობებში, თამაშის ბევრ თამაშში, მოთამაშეები არ მივიდნენ წონასწორულ შედეგამდე, თუ დავუშვათ, რომ ფულადი პრიზებისწორად შეაფასონ მათი მოგება. რა თქმა უნდა, ამ ექსპერიმენტების შედეგებიდან არ გამომდინარეობს, რომ თამაშის თეორიის პროგნოზები არასწორია, მაგრამ მხოლოდ ის, რომ მათი მოგების შეფასებისას მოთამაშეებმა გაითვალისწინეს არაფულადი ფაქტორები - ალტრუიზმის, სამართლიანობის და ა.შ. თუ მოთამაშეთა ანაზღაურება სწორად არის შეფასებული, მაშინ მოთამაშეებმა უპირატესობა უნდა სცენ დომინანტურ სტრატეგიას და ამიტომ აირჩიონ იგი (მიკროეკონომიკაში გამოვლენილი პრეფერენციების სულისკვეთებით). მაშასადამე, ამ ტიპის ექსპერიმენტების ღირებულება არ არის თამაშის თეორიული პროგნოზების ტესტირებაში, არამედ ინდივიდების ქმედებებში არამატერიალური მოტივაციის როლის შეფასებაში.

მკაცრი დომინირების ცნებაზე ბევრად ნაკლები, სუსტი დომინირების ცნება გამოიყენება თამაშების თეორიაში.

განმარტება 2.4. მე-ე მოთამაშის სტრატეგია, სუსტად დომინირებსმისი სტრატეგია თუ მ, (ს, ს ,) > მ ; (sJ, s,) დარჩენილი მოთამაშეების სტრატეგიების ნებისმიერი ნაკრებისთვის s_j,უფრო მეტიც, სხვა მოთამაშეების სტრატეგიების მინიმუმ ერთი ნაკრებისთვის, უთანასწორობა მკაცრად დაკმაყოფილებულია. შემდეგ სტრატეგია s" ეწოდება სუსტად დომინირებს.

არამკაცრი უთანასწორობების შემთხვევაში უკვე შეუძლებელია იმის თქმა, რომ რაციონალური მოთამაშე არ აირჩევს სუსტად დომინირებულ სტრატეგიას, თუმცა ასეთი ქცევა საკმაოდ ლოგიკური ჩანს. არსებობს, თუმცა იშვიათად გამოიყენება, წონასწორობის განმარტება სუსტად დომინანტურ სტრატეგიებში, მკაცრად დომინირების შემთხვევის მსგავსი.

განმარტება 2.5. სტრატეგიის პროფილი s* = (s*, Sj,..., s*) ეწოდება წონასწორობა სუსტად დომინანტურ სტრატეგიებში, თუ რომელიმე მე-ე მოთამაშისთვის სტრატეგია სუსტად დომინირებს მის რომელიმე სხვა სტრატეგიაში.

მაგალითი 2.2 (დახურული მეორე ფასის აუქციონი). მეორე ფასის დახურული აუქციონი ტარდება ორ პირს შორის. აუქციონი სტრუქტურირებულია შემდეგნაირად. თითოეული მონაწილე მიუთითებს არაუარყოფით წინადადებაზე სხვა მონაწილეთა წინადადებების ცოდნის გარეშე (კონვერტში). მონაწილე, რომელმაც გააკეთა უმაღლესი შეთავაზება, იხდის მაქსიმალურ თანხას სხვა მონაწილეთა ფსონებს შორის (ანუ მეორეს ოდენობა, მაგრამ ფსონის ზომა) და იღებს რაღაც ნივთს. თუ, მაგალითად, მოთამაშეთა წინადადებები იყო 100 და 90, მაშინ მონაწილე, რომელიც 100-ს სთავაზობდა, იგებს აუქციონს და ყიდულობს ნივთს 90-ად - მეორე ბიდის ზომით. მიეცით საშუალება თითოეულ მონაწილეს ჰქონდეს საგნის შეფასება, გამოხატული ფულადი ერთეულები, v 2> 0. ეს შეფასებები ცნობილია ყველა მონაწილისთვის. დავუშვათ, თამაშის აღწერის სიმარტივის მიზნით, თუ ორივე მონაწილე მიუთითებს ერთსა და იმავე ფსონზე, მაშინ ელემენტი მიდის პირველ მონაწილეზე.

ამ თამაშში პირველი მოთამაშის სტრატეგია იქნება მისი ფსონის ზომა. ვინაიდან ფსონი არაუარყოფითია, მისი ყველა შესაძლო სტრატეგიის ნაკრები

5, = შესრულებულია 0 = u,(o, s 2) > w,(s, s 2) = = q, - s 2 v x სუსტად დომინირებს სტრატეგია s,.

ჩვენ ვაჩვენეთ, რომ პირველი მოთამაშისთვის, მისი შეფასების ფსონად გამოძახების სტრატეგია სუსტად დომინირებს ნებისმიერ სხვა სტრატეგიაზე. ადვილია იმის შემოწმება, რომ მსგავსი განცხადება მართალია მეორე მოთამაშისთვის. გაითვალისწინეთ, რომ ჩვენს მსჯელობაში არასდროს გამოგვიყენებია ის ფაქტი, რომ მოთამაშემ იცის სხვა მოთამაშის შეფასება და, შესაბამისად, არასრული ინფორმაციით თამაშის შემთხვევაში დახურული აუქციონიმეორე ფასი, თქვენი შეფასებით დარეკვა არანაკლებ მომგებიანი იქნება, ვიდრე ნებისმიერი სხვა ფსონის დადება.

შეიძლება ჩანდეს, რომ გამყიდველისთვის წამგებიანია მეორე ფასის აუქციონის მოწყობა, როდესაც მას შეუძლია მოაწყოს პირველი ფასის აუქციონი და მიიღოს არა მეორე, არამედ პირველი წინადადების ღირებულება. თუმცა, წონასწორობის პირობებში პირველი ფასის აუქციონის შემთხვევაში შეთავაზებების ღირებულება უფრო დაბალი იქნება. აუქციონის მომგებიანობის შესახებ დაწვრილებით თავში ვისაუბრებთ. 5. ჯერჯერობით, აღვნიშნავთ, რომ მეორე ფასის აუქციონი ძალიან პოპულარულია და ფართოდ გამოიყენება, მაგალითად, კომპანიების მიერ. Googleდა „იანდექსი“ ინტერნეტში კონტექსტური რეკლამის გაყიდვისას.

წონასწორობა დომინანტურ სტრატეგიებში არსებობს მხოლოდ მცირე კლასითამაშები. როგორც წესი, მოთამაშეებს არ აქვთ ერთი სტრატეგია, რომელიც დომინირებს ყველა დანარჩენზე. მაგრამ დომინირების კონცეფცია საშუალებას გვაძლევს ვიპოვოთ გადაწყვეტილებები თამაშების უფრო ფართო კლასში. ამისათვის თქვენ უნდა განახორციელოთ თანმიმდევრული მსჯელობა მოთამაშეების ქმედებებზე. ჩვენ უკვე აღვნიშნეთ, რომ რაციონალური მოთამაშე არ აირჩევს მკაცრად დომინირებულ სტრატეგიას. მაგრამ ეს ნიშნავს, რომ სხვა მოთამაშეს შეუძლია გააანალიზოს თამაში, იგნორირებას უკეთებს მოწინააღმდეგეს ასეთი სტრატეგიის არჩევის შესაძლებლობას. შესაძლოა, ამ ანალიზმა გამოავლინოს, რომ სხვა მოთამაშეს აქვს დომინანტური სტრატეგია, რომელიც არ იყო დომინანტი თავდაპირველ თამაშში. Და ასე შემდეგ. მოდით მივცეთ ოფიციალური განმარტება.

პროცესი მკაცრად დომინირებული სტრატეგიების თანმიმდევრული გამორიცხვამოცემულია შემდეგნაირად. მოდით გამოვრიცხოთ ყველა მკაცრად დომინირებული მოთამაშის სტრატეგია განხილვისაგან, ე.ი. განვიხილოთ ახალი თამაში, რომელშიც ყველა დომინირებული სტრატეგია გამორიცხულია მოთამაშის შესაძლო სტრატეგიების ნაკრებიდან. შემდეგ ამ ახალი თამაშიგამოვრიცხოთ ყველა მკაცრად დომინირებული სტრატეგია და ა.შ.

შესაძლებელია, რომ ასეთი პროცესი დასრულდეს მაშინ, როდესაც მოთამაშეებს დარჩებათ რამდენიმე სტრატეგია, მაგრამ შესაძლებელია, რომ თითოეულ მოთამაშეს ჰქონდეს მხოლოდ ერთი გამორიცხული სტრატეგია, მაშინ ლოგიკურია, რომ ამ სტრატეგიების ნაკრები განიხილოს, როგორც გამოსავალი. თამაში.

განმარტება 2.6. თუ მკაცრად დომინირებული სტრატეგიების თანმიმდევრული აღმოფხვრის შედეგად თითოეულ მოთამაშეს რჩება ერთი სტრატეგია, მაშინ ამ სტრატეგიების პროფილი ე.წ. დომინანტური წონასწორობა.

მაგალითში 1.1 ჩვენ მივიღეთ სწორედ ასეთი წონასწორობა. მოდით შევხედოთ სხვა მაგალითს.


სტრატეგიის პროფილი (N, P) წარმოადგენს ერთადერთ ნეშის წონასწორობას ამ თამაშში. მაგრამ გაითვალისწინეთ: P-ს ასარჩევად, მეორე მოთამაშე დარწმუნებული უნდა იყოს, რომ პირველი მოთამაშე არ აირჩევს B. მაგრამ პირველი მოთამაშის ანაზღაურება იგივეა, თუ მეორე მოთამაშე აირჩევს II-ს. უფრო მეტიც, B არჩევის შემდეგ, პირველ მოთამაშეს არ უნდა ეშინოდეს, რომ მეორე მოთამაშე აირჩევს A-ს. შესაძლოა რაციონალური მეორე მოთამაშე იფიქროს C სტრატეგიის არჩევაზე.

მეორე კითხვა, რომელზეც ჯერ კიდევ არ არის ნაპოვნი ცალსახა პასუხი: როგორ მიდიან მოთამაშეები ნეშის წონასწორობამდე?

იდეალური თეორიული სცენარი აქ არის. მოთამაშეები დამოუკიდებლად აყალიბებენ მოლოდინს სხვა მოთამაშეების ქმედებებთან დაკავშირებით და შემდეგ ირჩევენ მოქმედებებს, რომლებიც მაქსიმალურად გაზრდის მათ ანაზღაურებას მათი მოლოდინების გათვალისწინებით. თუ მოლოდინი შეესაბამება მოთამაშეების მიერ რეალურად არჩეულ მოქმედებებს, მაშინ მივიღებთ ნეშის წონასწორობას. მსჯელობის ეს ხაზი საშუალებას გვაძლევს ვუწოდოთ ნეშის წონასწორობა სიტუაცია თვითრეალიზებული მოლოდინები.მაგრამ საიდან მოდის თავად მოლოდინი? და რომელი ნეშის წონასწორობა შეირჩევა აღწერილი პროცესის შედეგად, თუ რამდენიმე მათგანია? განხილულ სცენარში ეს კითხვები პასუხგაუცემელი რჩება.

კიდევ ერთი მიდგომა მოიცავს მოთამაშის ვარჯიშს. მოთამაშეები ან თეორიულად სწავლობენ მოცემულ თამაშს (წარმოიდგინეთ სტუდენტები ეკონომიკის ფაკულტეტი), ან გაქვთ მსგავსი ურთიერთქმედების გამოცდილება (მაგალითად, გამოცდილი თანამშრომელი მოდის ახალი გუნდი), რაც მათ საშუალებას აძლევს სწორად ჩამოაყალიბონ მოლოდინები და აირჩიონ ოპტიმალური ქცევა. ეს სცენარი ეხმარება ახსნას მოლოდინების ფორმირება, მაგრამ, პირველ რიგში, ეს ამცირებს გამოყენების ფარგლებს სათამაშო მოდელებიმხოლოდ სტანდარტულ, შესწავლილ და ხშირად წარმოქმნილ ურთიერთქმედების სიტუაციებს, და მეორეც, შეიძლება გამოიწვიოს ის ფაქტი, რომ ერთჯერადი და განმეორებითი ურთიერთქმედების სიტუაციები არ არის დიფერენცირებული და ეს უკანასკნელი მნიშვნელოვნად განსხვავდება სტრატეგიებისა და გადაწყვეტის მეთოდების თვალსაზრისით. თამაშის თეორიის ჩარჩო, რომელიც უფრო დეტალურად იქნება განხილული თავში. 4.

მესამე სცენარი არის ის, რომ არსებობს წინასწარი შეთანხმება მოთამაშეებს შორის, ან ჩვეულებები, ან კანონები, ან ინსტრუქციები მესამე მხარის მხრიდან, რომლებიც არეგულირებენ მოთამაშეთა ურთიერთქმედებას. ამ შემთხვევაში, შეთანხმებები ან ინსტრუქციები შეიძლება არ იყოს სავალდებულო, მაგრამ თუ რეკომენდირებულია ნეშის წონასწორობის თამაში, მაშინ არცერთ მოთამაშეს არ აქვს სურვილი (მარტო) გადაუხვიოს დადგენილ ქცევას. ნათელია, რომ ასეთი სცენარი ყველა სიტუაციაში შეუძლებელია. გარდა ამისა, ხელშეკრულების დადების ან მესამე მხარის ჩართვის პროცესი შეიძლება გახდეს თამაშის ნაწილი.

დაბოლოს, მესამე ბუნებრივი კითხვა, რომელიც ჩნდება ნეშის წონასწორობის კონცეფციის შესწავლისას, არის შემდეგი: არის თუ არა ემპირიული მტკიცებულება იმისა, რომ რეალური მოთამაშეები ჩვეულებრივ ირჩევენ წონასწორობის სტრატეგიებს? აქ ისევ უკიდურესად რთულია მოკლე და ცალსახა პასუხის გაცემა. ამავდროულად, წარმოქმნილი პრობლემების ბუნება უფრო შეესაბამება ექსპერიმენტული ეკონომიკის თემებს. ამიტომ შემოვიფარგლებით რეკომენდაციით მივმართოთ სპეციალიზებულ ლიტერატურას, მაგალითად, წიგნს, სადაც შესანიშნავად არის განხილული ექსპერიმენტული მეთოდოლოგიის საკითხები და არაერთი შედეგია წარმოდგენილი.

არის თამაშები, რომლებსაც არ აქვთ სუფთა სტრატეგიული წონასწორობა (იხ. მაგალითი 3.1), ამიტომ ჩნდება კითხვა: რა პირობებია საკმარისი ასეთი წონასწორობის არსებობისთვის? მოდით ჩამოვაყალიბოთ და დავამტკიცოთ განცხადება ნეშის წონასწორობის არსებობის შესახებ სუფთა სტრატეგიებში თამაშებში, რომლებიც არ არის სასრული.

განცხადება 2.3. თუ სტრატეგიების ნაკრები თითოეული მოთამაშისთვის ს ტარის არა ცარიელი ამოზნექილი კომპაქტური კომპლექტები ევკლიდეს სივრცეში და თითოეული მოთამაშის ანაზღაურების ფუნქცია და-უწყვეტი შიგნით და არის კვაზი-ჩაზნექილი 5-ში, მაშინ თამაშს აქვს ნეშის წონასწორობა სუფთა სტრატეგიებში.

მტკიცებულება.გავიხსენოთ ფორმულირება კაკუტაის თეორემები, რომელსაც ჩვენ გამოვიყენებთ მტკიცებულებაში. დაე X-არა ცარიელი ამოზნექილი კომპაქტური დაყენება R n, X*არის მისი ქვესიმრავლეების სიმრავლე და/ არის ზედა ნახევრად უწყვეტი გამოსახვა XX*,რომ ყოველი პუნქტისთვის x e Xრამოდენიმე f(x)არა ცარიელი, დახურული და ამოზნექილი. შემდეგ რუკს / აქვს ფიქსირებული წერტილი.

ჩვენი განცხადების დამტკიცების იდეაა ავაშენოთ რუკტი, რომელიც აკმაყოფილებს კაკუტანის თეორემის პირობებს. ამისათვის მოდით ოდნავ ხელახლა განვსაზღვროთ საუკეთესო პასუხის ჩვენება. მოდით, წმინდა ტექნიკურად ვივარაუდოთ, რომ საუკეთესო პასუხი დამოკიდებულია არა მხოლოდ სხვა მოთამაშეების სტრატეგიებზე, არამედ მოთამაშის საკუთარ სტრატეგიაზეც. მოთამაშის საკუთარი სტრატეგიის შეცვლით, სხვა მოთამაშეების ფიქსირებული სტრატეგიების გათვალისწინებით, საუკეთესო პასუხი, რა თქმა უნდა, არ შეიცვლება. ახლა ჩვენ შემოგთავაზებთ აღნიშვნას, რომ აჩვენოს საუკეთესო პასუხი ყველა მოთამაშისთვის, როგორც კარტეზიული პროდუქტი s(s) = s,(s) x s2(s) x... x s n (s).ეს რუკა თითოეულ პროფილს ანიჭებს პროფილების ერთობლიობას, რომელშიც თითოეული მოთამაშეა საუკეთესო გზაპასუხობს სხვა მოთამაშეების სტრატეგიებს. S-ის რუკების ფიქსირებული წერტილი, ე.ი. პროფილი ისეთივე როგორც s e s(s)>განსაზღვრებით არის ნეშის წონასწორობა. ვაჩვენოთ, რომ 5-ის დახატვა აკმაყოფილებს კაკუტანის თეორემის პირობებს. თითოეული პირობის შემოწმება იქნება ცალკე მტკიცებულება.

  • 1. ვაჩვენოთ, რომ კომპლექტი ყველა პროფილი - ამოზნექილი კომპაქტური. ვინაიდან თითოეული S მოთამაშის სტრატეგიების ნაკრები არის არა ცარიელი ამოზნექილი კომპაქტური ნაკრები, მაშინ დეკარტისეული პროდუქტი = ს ტ X S 2 X...x S nარის ამოზნექილი კომპაქტური.
  • 2. ჩვენება აქვს არა ცარიელი სურათები. ვაიერშტრასის თეორემით, უწყვეტი ფუნქცია და-აღწევს თავის მიზანს დახურულ საზღვრებში 5 მაქსიმალური მნიშვნელობა. აქედან გამომდინარე, აქვს არა ცარიელი სურათები.
  • 3. სურათების ჩვენება დახურული და ამოზნექილი. ვინაიდან თითოეული მოთამაშის ანაზღაურებადი ფუნქციაა u tკვაზი-ჩაზნექილი in თუშემდეგ, კვაზი-ჩაზნექილი ფუნქციის თვისებით, სიმრავლე $. = (ს. | u t (s i9 s .) > ) დაფიქსირდა .და კდახურულია, თუ განმარტების დომენი დახურულია და ამოზნექილი, თუ ცარიელი არ არის. რადგან ეს ვინმესთვის მართალია , მაშინ ასევე მართალია, რომ სიმრავლე 5. = (5/1 u t(s", 5 ,) > maxw.(s., .)}

ამოზნექილი. მაგრამ შემდეგ დეკარტის ნამრავლი 5(5) = s x (s) X s 2(S) x... X s n CS) არის დახურული და ამოზნექილი.

4. ვაჩვენოთ, რომ რუკების § ზემოდან ნახევრად უწყვეტი. ჩვენ ვიყენებთ ფუნქციის უწყვეტობის პირობას და,მიერ ს. ამას წინააღმდეგობით დავამტკიცებთ. დავუშვათ, რომ რუკა § ns არის ზედა ნახევრად უწყვეტი. შემდეგ არის სტრატეგიის პროფილების თანმიმდევრობა ს მდა ს მსად T -მიმდევრობის ელემენტის ნომერი, ისეთი, რომ ნებისმიერი ს"" ე ს, ს მ e s(s""), lim s"" = s° e S,მაგრამ ლიმ ს"" = ს° გ ლიმ ს(ს""). ეს ნიშნავს, რომ არსებობს თამაში

t~*ოო t->/და -? ოო

ბედი, რომლისთვისაც s f ° სტრატეგია არ არის საუკეთესო პასუხი s 0-ზე, ე.ი. არის სტრატეგია ს"ისეთივე როგორც და,(ები", s 0 ,) > ჩვენ] s° ;). მაშინ შეგვიძლია ვიპოვოთ e > 0 ისეთი, რომ m,(s/, s 0 ,) > m,(s ; °, s 0 ,) + Ze, საიდანაც

ვინაიდან პირობით ფუნქცია m უწყვეტია, lim s m = s°, lim s"” = s°,

*ოო -*ოო

საკმარისად დიდით უფლება

უტოლობების (2.8)-(2.10) გაერთიანებით ერთ ჯაჭვში მივიღებთ

(2.11) მიმართებებიდან გამომდინარეობს, რომ u,(s", s"") > m,(s/", s"") + ს,მაგრამ ეს ეწინააღმდეგება პირობას s"" е s(s""), რადგან s" იძლევა მკაცრად უფრო დიდ ანაზღაურებას, ვიდრე s/", s"-ის საპასუხოდ. ჩვენ წინააღმდეგობამდე მივედით. ამიტომ, ჩვენი საწყისი ვარაუდი, რომ რუკა s არ არის ზედა ნახევრად უწყვეტი, არასწორი იყო.

ჩვენ ვაჩვენეთ, რომ რუკების აკმაყოფილებს კაკუტანის თეორემის ყველა პირობას, რაც ნიშნავს, რომ მას აქვს ფიქსირებული წერტილი. ეს ფიქსირებული წერტილი არის ნეშის წონასწორობა. განცხადება 2.3 დადასტურებულია. ?

დებულება 2.3, კერძოდ, იძლევა გარანტიას ნეშის წონასწორობის არსებობას მაგალითში 2.7, მაგრამ არა მაგალითში 2.8, სადაც მოთამაშეთა ანაზღაურების ფუნქციები შეწყვეტილია.

„მაგალითი სამსახურიდან.

მათემატიკური მეთოდებიდა მოდელები ეკონომიკაში

მატრიცული თამაშები

შესავალი

ეკონომიკურ პრაქტიკაში ხშირად წარმოიქმნება სიტუაციები, როდესაც სხვადასხვა მხარე სხვადასხვა მიზნებს მისდევს. მაგალითად, ურთიერთობა გამყიდველსა და მყიდველს, მიმწოდებელსა და მომხმარებელს, ბანკსა და მეანაბრეს შორის და ა.შ. ასეთი კონფლიქტური სიტუაციები წარმოიქმნება არა მხოლოდ ეკონომიკაში, არამედ სხვა სახის საქმიანობაშიც. მაგალითად, ჭადრაკის თამაშისას, ქვები, დომინო, ლოტო და ა.შ.

Თამაშიარის კონფლიქტური სიტუაციის მათემატიკური მოდელი, რომელშიც ჩართულია მინიმუმ ორი ადამიანი, რომლებიც იყენებენ რამდენიმეს სხვადასხვა გზითთქვენი მიზნების მისაღწევად. თამაში ჰქვია ორთქლის ოთახი, თუ იგი მოიცავს ორ მოთამაშეს. თამაში ჰქვია ანტაგონისტური, თუ ერთი მოთამაშის მოგება უდრის მეორის წაგებას. ამიტომ, თამაშის დასაყენებლად, საკმარისია ერთი მოთამაშის მოგების მნიშვნელობების დაყენება სხვადასხვა სიტუაციაში.

მოთამაშის მოქმედების ნებისმიერ მეთოდს, არსებული სიტუაციიდან გამომდინარე, ეწოდება სტრატეგია. თითოეულ მოთამაშეს აქვს სტრატეგიების კონკრეტული ნაკრები. თუ სტრატეგიების რაოდენობა სასრულია, მაშინ თამაში ეწოდება საბოლოო, წინააღმდეგ შემთხვევაში - გაუთავებელი . სტრატეგიები ე.წ სუფთა, თუ თითოეული მოთამაშე ირჩევს მხოლოდ ერთ სტრატეგიას კონკრეტული და არა შემთხვევითი გზით.

თამაშის გადაწყვეტაარის სტრატეგიის არჩევა, რომელიც აკმაყოფილებს ოპტიმალური პირობა. ეს პირობა არის, რომ ერთი მოთამაშე იღებს მაქსიმალური მოგება, თუ მეორე იცავს თავის სტრატეგიას. პირიქით, მეორე მოთამაშე იღებს მინიმალური დანაკარგი, თუ პირველი მოთამაშე იცავს თავის სტრატეგიას. ასეთ სტრატეგიებს ე.წ ოპტიმალური . ამრიგად, თამაშის მიზანია თითოეული მოთამაშისთვის ოპტიმალური სტრატეგიის განსაზღვრა.

სუფთა სტრატეგიული თამაში

განვიხილოთ თამაში ორი მოთამაშით და IN.დავუშვათ, რომ მოთამაშე Მას აქვს სტრატეგიები A 1, A 2, …, A mდა მოთამაშე INᲛას აქვს სტრატეგიები B 1, B 2, …, B n.ჩვენ ვივარაუდებთ, რომ მოთამაშის არჩევანია სტრატეგიები A მე,და მოთამაშე INსტრატეგიები ბ ჯცალსახად განსაზღვრავს თამაშის შედეგს, ე.ი. მოგება იჯმოთამაშე და მოგება ბ ijმოთამაშე IN.Აქ i=1,2,…,m, j=1,2,…,n.

უმარტივესი თამაში ორი მოთამაშით არის ნულოვანი ჯამის თამაში. , იმათ. თამაში, რომელშიც მოთამაშეთა ინტერესები პირდაპირ ეწინააღმდეგება. ამ შემთხვევაში, მოთამაშეთა ანაზღაურება დაკავშირებულია თანასწორობით

b ij =-a ij

ეს თანასწორობა ნიშნავს, რომ ერთი მოთამაშის მოგება უდრის მეორის წაგებას. ამ შემთხვევაში საკმარისია გავითვალისწინოთ მხოლოდ ერთ-ერთი მოთამაშის მოგება, მაგალითად, მოთამაშის ა.

სტრატეგიების თითოეული წყვილი A იდა ბ ჯშეესაბამება მოგებას იჯმოთამაშე ა.ყველა ამ მოგების ჩაწერა მოსახერხებელია ე.წ გადახდის მატრიცა

ამ მატრიცის რიგები შეესაბამება მოთამაშის სტრატეგიებს A,და სვეტები - მოთამაშის სტრატეგიები IN.ზოგადად, ასეთი თამაში ე.წ (m×n)-თამაში.


მაგალითი 1.ორი მოთამაშე და INმონეტის აგდება. თუ მონეტის მხარეები ემთხვევა, მაშინ ის იმარჯვებს , ე.ი. მოთამაშე INიხდის მოთამაშეს გარკვეული თანხა 1-ის ტოლია და თუ ისინი არ ემთხვევა, მაშინ მოთამაშე B იგებს, ე.ი. პირიქით, მოთამაშე იხდის მოთამაშეს INიგივე თანხა , ტოლია 1. შექმენით გადახდის მატრიცა.

გამოსავალი.პრობლემის პირობების მიხედვით



მსგავსი სტატიები
 
კატეგორიები