სუფთა და შერეული სტრატეგიები. თამაშების გადაჭრა სუფთა სტრატეგიებით

25.02.2019

თუ თამაშს არ აქვს უნაგირის წერტილი, მაშინ არსებობს სირთულეები თამაშის ფასის და მოთამაშეების ოპტიმალური სტრატეგიების განსაზღვრაში. განვიხილოთ, მაგალითად, თამაში:

ამ თამაშში და. აქედან გამომდინარე, პირველ მოთამაშეს შეუძლია გარანტიას მისცეს 4-ის ტოლი ანაზღაურება, ხოლო მეორეს შეუძლია შეზღუდოს თავისი წაგება 5-მდე. ეს არე. რა უნდა იყოს ამ შემთხვევაში ოპტიმალური სტრატეგიებიმოთამაშეები?

თუ თითოეული მოთამაშე იყენებს ვარსკვლავით მონიშნულ სტრატეგიას ( და ), მაშინ პირველი მოთამაშის მოგება და მეორის წაგება იქნება 5-ის ტოლი. ეს მეორე მოთამაშისთვის არახელსაყრელია, რადგან პირველი იგებს მასზე მეტს. შეუძლია საკუთარი თავის გარანტია. თუმცა, თუ მეორე მოთამაშე გარკვეულწილად გამოავლენს პირველი მოთამაშის განზრახვას გამოიყენოს სტრატეგია, მაშინ მას შეუძლია გამოიყენოს სტრატეგია და შეამციროს პირველი მოთამაშის ანაზღაურება 4-მდე. თუმცა, თუ პირველი მოთამაშე გამოავლენს მეორე მოთამაშის განზრახვას გამოიყენოს სტრატეგია, შემდეგ სტრატეგიის გამოყენებით ის გაზრდის თავის ანაზღაურებას 6-მდე. ამრიგად, იქმნება სიტუაცია, როდესაც თითოეულმა მოთამაშემ საიდუმლო უნდა შეინახოს სტრატეგია, რომლის გამოყენებასაც აპირებს. თუმცა, როგორ გავაკეთოთ ეს? ბოლოს და ბოლოს, თუ თამაში ბევრჯერ ითამაშა და მეორე მოთამაშე მუდმივად იყენებს a-ს სტრატეგიას, მაშინ პირველი მოთამაშე მალე გაიგებს მეორეს განზრახვას და, სტრატეგიის გამოყენების შემდეგ, ექნება დამატებითი ანაზღაურება. ცხადია, მეორე მოთამაშემ ყოველ ახალ თამაშში უნდა შეცვალოს სტრატეგია, მაგრამ ეს ისე უნდა გააკეთოს, რომ პირველმა ვერ გამოიცნოს, რომელ სტრატეგიას გამოიყენებს თითოეულ შემთხვევაში.

შემთხვევითი შერჩევის მექანიზმისთვის, მოთამაშეთა მოგება და ზარალი იქნება შემთხვევითი ცვლადები. თამაშის შედეგი ამ შემთხვევაში შეიძლება შეფასდეს საშუალოდმეორე მოთამაშის დაკარგვა. დავუბრუნდეთ მაგალითს. ასე რომ, თუ მეორე მოთამაშე იყენებს სტრატეგიას და შემთხვევით 0,5 ალბათობით; 0.5, მაშინ პირველი მოთამაშის სტრატეგიით, მისი წაგების საშუალო ღირებულება იქნება:

და პირველი მოთამაშის სტრატეგიით

ამიტომ, მეორე მოთამაშეს შეუძლია შეზღუდოს თავისი საშუალო წაგება 4.5-მდე, მიუხედავად პირველი მოთამაშის მიერ გამოყენებული სტრატეგიისა.

ამრიგად, რიგ შემთხვევებში მიზანშეწონილი აღმოჩნდება არა სტრატეგიის წინასწარ დახატვა, არამედ შემთხვევითი შერჩევის ამა თუ იმ მექანიზმის გამოყენებით. სტრატეგიაზე დაფუძნებული შემთხვევითი შერჩევა, დაურეკა შერეული სტრატეგია, განზრახ სტრატეგიებისგან განსხვავებით, რომლებიც ე.წ სუფთა სტრატეგიები.

მოდით მივცეთ სუფთა და შერეული სტრატეგიების უფრო მკაცრი განმარტება.



დაე, იყოს თამაში უნაგირის წერტილის გარეშე:

პირველი მოთამაშის სუფთა სტრატეგიის გამოყენების სიხშირე აღვნიშნოთ ,-ით (i-th სტრატეგიის გამოყენების ალბათობა). ანალოგიურად, ჩვენ აღვნიშნავთ მეორე მოთამაშის სუფთა სტრატეგიის გამოყენების სიხშირეს ,-ით (j-th სტრატეგიის გამოყენების ალბათობა). უნაგირის წერტილით თამაშისთვის არის გამოსავალი სუფთა სტრატეგიები. უნაგირის წერტილის გარეშე თამაშისთვის არის გამოსავალი შერეულ სტრატეგიებში, ანუ როცა სტრატეგიის არჩევანი ემყარება ალბათობებს. მერე

უამრავი სუფთა პირველი მოთამაშის სტრატეგია;

პირველი მოთამაშის მრავალი შერეული სტრატეგია;

ბევრი სუფთა მე-2 მოთამაშის სტრატეგია;

მე-2 მოთამაშის უამრავი შერეული სტრატეგია.

განვიხილოთ მაგალითი: მოდით იყოს თამაში

მეორე მოთამაშე ირჩევს ალბათობას . მოდით შევაფასოთ მეორე მოთამაშის საშუალო დანაკარგი სტრატეგიების გამოყენებისას და შესაბამისად.

სასრულ თამაშებს შორის, რომლებსაც აქვთ პრაქტიკული ღირებულება, შედარებით იშვიათია თამაშები უნაგირის წერტილით; უფრო დამახასიათებელია შემთხვევა, როდესაც ქვედა და ზედა ფასი - თამაშები განსხვავებულია. ასეთი თამაშების მატრიცების გაანალიზებით, მივედით დასკვნამდე, რომ თუ თითოეულ მოთამაშეს ეძლევა არჩევანი

ერთი - ერთადერთი სტრატეგია., მაშინ, გონივრულად მოქმედი ოპონენტის საფუძველზე, ეს არჩევანი უნდა განისაზღვროს მინიმქსის პრინციპით. ჩვენი მაქსიმალური სტრატეგიის დაცვით, ჩვენ, რა თქმა უნდა, გარანტიას ვაძლევთ ანაზღაურებას თამაშის დაბალ ფასზე, ა, მოწინააღმდეგის ნებისმიერი ქცევისთვის. ჩნდება ბუნებრივი კითხვა: შესაძლებელია თუ არა გარანტირებული მოგცეთ საშუალო ანაზღაურება, ვიდრე ერთი, თუ თქვენ გამოიყენებთ არა მხოლოდ ერთ „სუფთა“ სტრატეგიას, არამედ რამდენიმე სტრატეგიის ალტერნატივას შემთხვევით?

ასეთ კომბინირებულ სტრატეგიებს, რომლებიც შედგება რამდენიმე სუფთა სტრატეგიის გამოყენებაში, რომლებიც მონაცვლეობენ შემთხვევითი კანონის მიხედვით სიხშირეების გარკვეული თანაფარდობით, თამაშების თეორიაში შერეულ სტრატეგიებს უწოდებენ.

ცხადია, ყოველი სუფთა სტრატეგია არის შერეული სტრატეგიის განსაკუთრებული შემთხვევა, რომელშიც ერთის გარდა ყველა სტრატეგია გამოიყენება ნულოვანი სიხშირით, ხოლო ეს - 1 სიხშირით.

გამოდის, რომ არა მხოლოდ სუფთა, არამედ შერეული სტრატეგიების გამოყენებით, შესაძლებელია ყოველი სასრული თამაშისთვის გამოსავლის მიღება, ანუ წყვილი (ზოგადად შერეული) სტრატეგიები ისეთი, რომ როდესაც ორივე მოთამაშე გამოიყენებს მათ, ანაზღაურება იქნება ფასის ტოლითამაში, ხოლო ოპტიმალური სტრატეგიიდან რაიმე ცალმხრივი გადახრის შემთხვევაში, ანაზღაურება შეიძლება შეიცვალოს მხოლოდ გადახრილისთვის არახელსაყრელი მიმართულებით.

აღნიშნული განცხადება არის თამაშების თეორიის ე.წ. მთავარი თეორემის შინაარსი. ეს თეორემა პირველად დაამტკიცა ფონ ნეუმანმა 1928 წელს. თეორემის ცნობილი მტკიცებულებები შედარებით რთულია; ამიტომ წარმოგიდგენთ მხოლოდ მის ფორმულირებას.

ყველა სასრულ თამაშს აქვს მინიმუმ ერთი გამოსავალი (შესაძლოა შერეული სტრატეგიების სფეროში).

გადაწყვეტილების შედეგად მიღებული ანაზღაურება ეწოდება თამაშის ფასს. მთავარი თეორემიდან გამომდინარეობს, რომ ყველა სასრულ თამაშს აქვს ფასი. ცხადია, v თამაშის ღირებულება ყოველთვის შორისაა დაბალი ფასითამაში a და თამაშის ყველაზე მაღალი ფასი:

მართლაც, არსებობს მაქსიმალური გარანტირებული ანაზღაურება, რომელიც ჩვენ შეგვიძლია უზრუნველვყოთ საკუთარი თავისთვის მხოლოდ ჩვენი სუფთა სტრატეგიების გამოყენებით. ვინაიდან შერეული სტრატეგიები მოიცავს, როგორც განსაკუთრებულ შემთხვევაში, ყველა სუფთას, მაშინ, რაც საშუალებას იძლევა, გარდა სუფთა სტრატეგიებისა, ასევე შერეული

სტრატეგია, ჩვენ, ნებისმიერ შემთხვევაში, არ ვაუარესებთ ჩვენს შესაძლებლობებს; შესაბამისად,

ანალოგიურად, მოწინააღმდეგის შესაძლებლობების გათვალისწინებით, ჩვენ ამას ვაჩვენებთ

საიდანაც მოჰყვება საჭირო უტოლობა (3.1).

მოდით შემოვიტანოთ სპეციალური აღნიშვნა შერეული სტრატეგიებისთვის. თუ, მაგალითად, ჩვენი შერეული სტრატეგია შედგება AL სტრატეგიების გამოყენებაში, სიხშირეებით და ჩვენ აღვნიშნავთ ამ სტრატეგიას

ანალოგიურად, მოწინააღმდეგის შერეული სტრატეგია აღინიშნება:

სად არის სტრატეგიების შერეული სიხშირეები

დავუშვათ, რომ ჩვენ ვიპოვნეთ გამოსავალი თამაშისთვის, რომელიც შედგება ორი ოპტიმალური შერეული სტრატეგიისგან S, S. ზოგადად, მოცემული მოთამაშისთვის ხელმისაწვდომი ყველა სუფთა სტრატეგია არ შედის მის ოპტიმალურ შერეულ სტრატეგიაში, არამედ მხოლოდ ზოგიერთი მათგანი. მოთამაშის ოპტიმალურ შერეულ სტრატეგიაში შემავალ სტრატეგიებს მის „სასარგებლო“ სტრატეგიებს დავარქმევთ.

გამოდის, რომ თამაშის გამოსავალს აქვს კიდევ ერთი ღირსშესანიშნავი თვისება: თუ რომელიმე მოთამაშე იცავს თავის ოპტიმალურ შერეულ სტრატეგიას 5 (5). მაშინ ანაზღაურება რჩება უცვლელი და უდრის v თამაშის ფასს, მიუხედავად იმისა, რას აკეთებს სხვა მოთამაშე, თუ ის. მხოლოდ არ სცილდება მის „სასარგებლო“ სტრატეგიებს. მას, მაგალითად, შეუძლია გამოიყენოს თავისი ნებისმიერი „სასარგებლო“ სტრატეგია სუფთა ფორმადა ასევე შეგიძლიათ შეურიოთ ისინი ნებისმიერი პროპორციით.

დავამტკიცოთ ეს განცხადება. დაე, იყოს თამაშის გამოსავალი. კონკრეტულობისთვის, ჩვენ ვივარაუდებთ, რომ ოპტიმალური შერეული სტრატეგია შედგება სამის ნარევისგან

"სასარგებლო" სტრატეგიები შესაბამისად შედგება სამი "სასარგებლო" სტრატეგიის ნაზავისაგან

და ნათქვამია, რომ თუ ჩვენ დავიცავთ S სტრატეგიას, მაშინ მოწინააღმდეგეს შეუძლია გამოიყენოს სტრატეგიები ნებისმიერი პროპორციით, ხოლო ანაზღაურება უცვლელი დარჩება და კვლავ იქნება თამაშის ფასის ტოლი.

A მოთამაშის შერეული სტრატეგია SA არის წმინდა სტრატეგიების გამოყენება A1, A2, ..., Am ალბათობებით p1, p2, ..., pi, ..., pm და ალბათობათა ჯამი 1-ის ტოლია: A მოთამაშის შერეული სტრატეგიები იწერება როგორც მატრიცა ან სტრიქონი SA = (p1, p2, ..., pi, ..., pm) ანალოგიურად, B მოთამაშის შერეული სტრატეგიები აღინიშნება: , ან, SB = (q1, q2, ..., qi, ..., qn ), სადაც სტრატეგიების დადგომის ალბათობების ჯამი 1-ის ტოლია: სუფთა სტრატეგიები შეიძლება ჩაითვალოს შერეული სტრატეგიების განსაკუთრებულ შემთხვევად და შეიძლება იყოს მითითებული როგორც სტრიქონი. რომელშიც 1 შეესაბამება წმინდა სტრატეგიას. მინიმაქსის პრინციპზე დაყრდნობით, ოპტიმალური გადაწყვეტათამაშის (ან გადაწყვეტა): ეს არის ოპტიმალური სტრატეგიების წყვილი S*A , S*B ზოგადად შერეული, შემდეგი თვისებით: თუ ერთ-ერთი მოთამაშე იცავს თავის ოპტიმალურ სტრატეგიას, მაშინ ეს არ შეიძლება იყოს მომგებიანი. მეორე თავისგან გადაუხვიოს. ოპტიმალური გადაწყვეტის შესაბამისი ანაზღაურება ეწოდება თამაშის მნიშვნელობას v. თამაშის ფასი აკმაყოფილებს უთანასწორობას: ? ? v? ? (3.5) სად? და? - თამაშის ქვედა და ზედა ფასები. მართებულია თამაშების თეორიის შემდეგი ძირითადი თეორემა - ნოიმანის თეორემა. ყველა სასრულ თამაშს აქვს მინიმუმ ერთი ოპტიმალური გადაწყვეტა, შესაძლოა შერეულ სტრატეგიებს შორის. მოდით S*A = (p*1, p*2, ..., p*i, ..., p*m) და S*B = (q*1, q*2, ..., q* i, ..., q*n) - ოპტიმალური სტრატეგიების წყვილი. თუ სუფთა სტრატეგია შედის ოპტიმალურ შერეულ სტრატეგიაში არანულოვანი ალბათობით, მაშინ მას აქტიური ეწოდება. მოქმედებს თეორემა აქტიური სტრატეგიების შესახებ: თუ ერთ-ერთი მოთამაშე იცავს თავის ოპტიმალურ შერეულ სტრატეგიას, მაშინ ანაზღაურება რჩება უცვლელი და უდრის v თამაშის ღირებულებას, თუ მეორე მოთამაშე არ სცილდება მის აქტიურ სტრატეგიებს. ამ თეორემას დიდი პრაქტიკული მნიშვნელობა აქვს - ის იძლევა კონკრეტულ მოდელებს ოპტიმალური სტრატეგიების მოსაძებნად უნაგირის წერტილის არარსებობის შემთხვევაში. განვიხილოთ 2×2 თამაში, რომელიც სასრული თამაშის უმარტივესი შემთხვევაა. თუ ასეთ თამაშს აქვს უნაგირის წერტილი, მაშინ ოპტიმალური გამოსავალი არის ამ წერტილის შესაბამისი სუფთა სტრატეგიების წყვილი. თამაში, რომელშიც არ არის უნაგირის წერტილი, თამაშის თეორიის მთავარი თეორემის შესაბამისად, არსებობს ოპტიმალური გადაწყვეტა და განისაზღვრება შერეული სტრატეგიების წყვილი S*A = (p*1, p*2) და S*B. = (q*1, q*2) . მათი საპოვნელად ვიყენებთ თეორემას აქტიურ სტრატეგიებზე. თუ მოთამაშე A იცავს თავის ოპტიმალურ სტრატეგიას S "A, მაშინ მისი საშუალო ანაზღაურება იქნება v თამაშის ფასის ტოლი, არ აქვს მნიშვნელობა რა აქტიურ სტრატეგიას გამოიყენებს მოთამაშე B. 2 × 2 თამაშისთვის, მოწინააღმდეგის ნებისმიერი სუფთა სტრატეგია არის. აქტიური, თუ არ არის უნაგირის წერტილი. მოთამაშის ანაზღაურება (მოთამაშის B წაგება) - შემთხვევითი ცვლადი, მოსალოდნელი ღირებულება(საშუალო) რაც არის თამაშის ფასი. მაშასადამე, A მოთამაშის საშუალო ანაზღაურება (ოპტიმალური სტრატეგია) იქნება v-ის ტოლი მოწინააღმდეგის ორივე 1-ლი და მე-2 სტრატეგიისთვის. დაე, თამაში მიეცეს ანაზღაურების მატრიცით. ​​A მოთამაშის საშუალო ანაზღაურება, თუ ის იყენებს ოპტიმალურ შერეულ სტრატეგიას, ხოლო მოთამაშე B - სუფთა სტრატეგია B1 (ეს შეესაბამება 1 სვეტს. გადახდის მატრიცა P) უდრის v თამაშის მნიშვნელობას: a11 p*1+ a21 p*2= v. მოთამაშე A მიიღებს იგივე საშუალო ანაზღაურებას, თუ მე-2 მოთამაშე იყენებს B2 სტრატეგიას, ე.ი. a12 p*1+ a22 p*2= v. იმის გათვალისწინებით, რომ p * 1 + p * 2 = 1, ვიღებთ განტოლებათა სისტემას ოპტიმალური სტრატეგიის S "A და v თამაშის მნიშვნელობის დასადგენად: (3.6) ამ სისტემის ამოხსნით, ვიღებთ ოპტიმალურ სტრატეგიას (3.7) და თამაშის მნიშვნელობა (3.8) აქტიურ სტრატეგიებზე თეორემის გამოყენებით SВ* - მოთამაშის B ოპტიმალური სტრატეგიის პოვნისას მივიღებთ, რომ A მოთამაშის ნებისმიერი სუფთა სტრატეგიისთვის (A1 ან A2) B მოთამაშის საშუალო დანაკარგი უდრის. v თამაშის ფასი, ანუ (3.9) შემდეგ ოპტიმალური სტრატეგია განისაზღვრება ფორმულებით: (3.10)

სუფთა სტრატეგია- განმსაზღვრელი (შემთხვევის გამოკლებით) მოქმედების გეგმა. წინა თავში განვიხილეთ მხოლოდ სუფთა სტრატეგიები. შერეული სტრატეგიები განხილული იქნება 2.2 ნაწილში, მაგრამ ახლა, თუ სხვა რამ არ არის მითითებული, სტრატეგიაში ყოველთვის ვგულისხმობთ სუფთა სტრატეგიას.

ძალიან ხშირად პრეზენტაციის პროცესში ჩვენ განვმარტავთ ამოხსნის ცნებებს ბიმატრიქსული თამაშების მაგალითებით, ამიტომ მივცემთ შესაბამის განმარტებებს.

განმარტება 2.1. თამაშის დასასრულიარის თამაში, რომელშიც მოთამაშეთა ნაკრები და თითოეული მოთამაშის სტრატეგიების ნაკრები შეიცავს ელემენტების სასრულ რაოდენობას. ორი ადამიანის საბოლოო თამაში ეწოდება ბიმატრიქსის თამაში.

გვარი მომდინარეობს ასეთ თამაშში მოგების ჩაწერის მოსახერხებელი ფორმით - ორმაგი მატრიცის გამოყენებით.

შემდგომი ანალიზისთვის მოსახერხებელია თვითნებური სტრატეგიის პროფილის სტრატეგიების დაყოფა ზოგიერთი /-მოთამაშის სტრატეგიად და ყველა სხვა მოთამაშის ს_ (. ფორმალურად, s = (.y, s,). აქ არ იგულისხმება, რომ ჩვენ ვცვლით სტრატეგიის პროფილის კოორდინატებს, ჩვენ მხოლოდ შემოგვაქვს მისი აღსანიშნავად სხვა გზა.

თამაშის გადაჭრის პირველი კონცეფცია, რომელსაც განვიხილავთ, არის წონასწორობა დომინანტურ სტრატეგიებში.

განმარტება 2.2. /-მოთამაშის სტრატეგია მკაცრად დომინირებსმისი სტრატეგია თუ Uj(s jt s ,) > h,(s", s ,) დარჩენილი მოთამაშეების სტრატეგიების ნებისმიერი s-სთვის. ამ შემთხვევაში სტრატეგია s" ე.წ. მკაცრად დომინირებს.

არსებითად, ეს ნიშნავს, რომ ნებისმიერი დაფიქსირდადარჩენილი მოთამაშეების სტრატეგიების კომპლექტში, მე-ე მოთამაშე, რომელიც ირჩევს სტრატეგიას s, იღებს მკაცრად უფრო დიდი გამარჯვებავიდრე სტრატეგიის არჩევისას". ლოგიკურია ვივარაუდოთ, რომ რაციონალურმა მოთამაშემ არ უნდა აირჩიოს მკაცრად დომინირებული სტრატეგიები.ასეთი ვარაუდი უმარტივეს თამაშებში შეიძლება საკმარისი იყოს თამაშის გამოსავლის მოსაძებნად.

განმარტება 2.3. სტრატეგიების პროფილი s* =(ს*, ს^,..., ს*) ეწოდება ბალანსი შიგნით (მკაცრად) დომინანტური სტრატეგიები, თუ რომელიმე მე-ე მოთამაშისთვის სტრატეგია s” მკაცრად დომინირებს მის ნებისმიერ სხვა სტრატეგიაში.

შეიძლება ჩანდეს, რომ გადაწყვეტის ამ კონცეფციამ შეიძლება გამოიწვიოს მხოლოდ ტრივიალური დასკვნები. თითოეულ მოთამაშეს აქვს ერთი სტრატეგია, რომელიც მას სხვაზე მეტ სარგებელს მოუტანს, მიუხედავად იმისა, თუ როგორ იქცევიან მისი ოპონენტები. მაშინ ის გამოიყენებს ზუსტად ამ სტრატეგიას წონასწორობაში. ყველაფერი საკმაოდ აშკარაა. მაგრამ ზუსტად ეს სიტუაციაა დამახასიათებელი, ალბათ, ყველაზე ცნობილი და ძალიან მნიშვნელოვანი თამაშის "პატიმრების დილემის" რიგი პრაქტიკული სიტუაციების ანალიზისთვის.

მაგალითი 2.1 (პატიმართა დილემა). ორი კრიმინალი სხვადასხვა საკანში იმყოფება და ურთიერთობას ვერ ახერხებს. გამოძიებას აქვს საკმარისი მტკიცებულება, რომ თითოეული მათგანი მსუბუქ დანაშაულზე ერთი წლით გაასამართლოს. მაგრამ დიდი დანაშაულისთვის, რომლისთვისაც დამნაშავეებს ათწლიანი პატიმრობა ემუქრებათ, გამოძიებას არ აქვს საკმარისი მტკიცებულებები. გამოძიების წარმომადგენლები თითოეულ დამნაშავეს სთავაზობენ გარიგებას: დამნაშავე მიიღებს ვადას

ერთი წლით ნაკლები თუ მისცემს ჩვენებას პარტნიორის წინააღმდეგ, რაც საკმარისი იქნება ამ უკანასკნელის მძიმე დანაშაულის ჩასადენად. დავუშვათ, რომ კრიმინალებს მხოლოდ ციხეში გატარებული წლების რაოდენობა ადარდებთ, ყოველი დამატებითი წელი არის სარგებლობის ერთი ერთეულის გამოკლებით. მაშინ დამნაშავეთა ანაზღაურება შეიძლება წარმოდგენილი იყოს შემდეგი ორმაგი მატრიცით:

იმ შემთხვევაში, როდესაც თამაშში მონაწილეები არ არიან დასახელებული, ჩვენ ვივარაუდებთ, რომ პირველი მონაწილის სხვადასხვა სტრატეგიები შეესაბამება ორმაგი მატრიცის რიგებს, ხოლო მეორე მონაწილის სტრატეგიები შეესაბამება სვეტებს. თუ ჩვენს მაგალითში პირველი პატიმარი მისცემს ჩვენებას და მეორე ჩვენებას არ მისცემს, მაშინ პირველი გათავისუფლდება, მეორე კი ათი წლით თავისუფლების აღკვეთას მიიღებს.

ადვილი მისახვედრია, რომ, როგორც არ უნდა მოიქცეს სხვა პატიმარი, მოგება უფრო დიდია (თავისუფლების აღკვეთის ვადა უფრო მოკლეა), თუ ჩვენებას მისცემთ (პირველი მოთამაშისთვის, ორმაგი მატრიცის პირველ რიგში პირველი კოორდინატები მკაცრად არის განსაზღვრული. მეორე მწკრივზე მეტი, მეორე მოთამაშისთვის, პირველი სვეტის მეორე კოორდინატები ორმაგ მატრიცაში მკაცრად მეტია, ვიდრე მეორე სვეტში). შემდეგ დომინანტურ სტრატეგიებში წონასწორობა იქნება სტრატეგიების პროფილი (დამოწმება, ჩვენება).

რაც საინტერესოა ამ მაგალითში არის ის, რომ მოთამაშეები, რომლებიც ირჩევენ ქცევას, რომელიც ზრდის მათ ანაზღაურებას, ხვდებიან ისეთ სიტუაციაში, როდესაც მათი ანაზღაურება დაბალია საპირისპირო სიტუაციასთან შედარებით, სადაც ორივე ირჩევს დუმილს. ახსნა მდგომარეობს ძლიერი გარეგანი ეფექტის არსებობაში, ე.ი. ერთი მოთამაშის მოქმედებების ძლიერი გავლენა მეორე მოთამაშის ანაზღაურებაზე. შედეგად, სტრატეგიების წონასწორობის პროფილი აღმოჩნდება ერთადერთი პარეტოს არაეფექტური ამ თამაშში. გაითვალისწინეთ, რომ პარეტოს ეფექტურობა, რომელიც სასურველია თამაშის მონაწილეთა თვალსაზრისით, შეიძლება არ იყოს სასურველი სოციალური თვალსაზრისით, როგორც ამ შემთხვევაში.

სიტუაციები, როგორიცაა პატიმრის დილემა, ხშირად ხდება ეკონომიკური სიტუაციების ანალიზისას. განვიხილოთ, მაგალითად, კონკურენცია ორ მაღაზიას შორის, რომლებიც ყიდიან პროდუქციის მსგავს კომპლექტს. სიმარტივისთვის, დავუშვათ, რომ მაღაზიებს შეუძლიათ მხოლოდ ორი დონის ფასი - მაღალი ან დაბალი. მომხმარებელს ბუნებრივია ურჩევნია იყიდოს მაღაზიიდან დაბალი ფასებით. შემდეგ მაღაზიების ანაზღაურება, რომელიც ხასიათდება მათი მოგებით, შეიძლება გამოიყურებოდეს, მაგალითად, შემდეგნაირად:


წონასწორობის თვალსაზრისით, აქ სიტუაცია პატიმრის დილემის ანალოგია - წონასწორობა დომინანტურ სტრატეგიებში (დაბალი ფასები, დაბალი ფასები) ერთადერთი პარეტოს არაეფექტური პროფილია (და ასევე სასურველია სოციალური თვალსაზრისით).

პატიმრის დილემის უკვე ნახსენები ფართო პოპულარობა იყო მიზეზი იმისა, რომ მისი მაგალითის გამოყენებით ცდილობდნენ ექსპერიმენტულად შეემოწმებინათ თამაშის თეორიის პროგნოზების სისწორე. ტესტი იყო ეს ორი უცნობებიშესთავაზეს ფულის თამაში პრიზებით (მაგალითად, დოლარებში) ორი მაღაზიის თამაშისთვის მითითებულთან ახლოს. თითოეულმა მონაწილემ მიიღო გადაწყვეტილება ცალკე (ხშირად ანონიმურად) და არ იცოდა სხვა მოთამაშის გადაწყვეტილებები მოგების მიღებამდე. აღმოჩნდა, რომ ასეთ პირობებში, თამაშის ბევრ თამაშში, მოთამაშეები არ მივიდნენ წონასწორულ შედეგამდე, თუ დავუშვებთ, რომ ფულადი პრიზებისწორად შეაფასეთ მათი მოგება. რა თქმა უნდა, ამ ექსპერიმენტების შედეგებიდან არ გამომდინარეობს, რომ თამაშის თეორიის პროგნოზები არასწორია, მაგრამ მხოლოდ ის, რომ მათი ანაზღაურების შეფასებისას მოთამაშეებმა გაითვალისწინეს არაფულადი ფაქტორები - ალტრუიზმის, სამართლიანობის მოსაზრებები და ა.შ. თუ მოთამაშეთა ანაზღაურება სწორად არის შეფასებული, მაშინ მოთამაშეებმა უპირატესობა უნდა სცენ დომინანტურ სტრატეგიას და, შესაბამისად, აირჩიონ იგი (მიკროეკონომიკაში გამოვლენილი პრეფერენციების სულისკვეთებით). მაშასადამე, ამ ტიპის ექსპერიმენტების ღირებულება არ არის თამაშის თეორიული პროგნოზების ტესტირებაში, არამედ ინდივიდების ქმედებებში არამატერიალური მოტივაციის როლის შეფასებაში.

გაცილებით ნაკლებია ვიდრე ძლიერი დომინირების კონცეფცია, თამაშის თეორია იყენებს სუსტი დომინირების კონცეფციას.

განმარტება 2.4. /-მოთამაშის სტრატეგია, სუსტად დომინანტიმისი სტრატეგია თუ მ, (ს, ს ,) > მ ; (sJ, s ,) სხვა მოთამაშეების სტრატეგიების ნებისმიერი ნაკრებისთვის s_j,უფრო მეტიც, სხვა მოთამაშეების სტრატეგიების მინიმუმ ერთი ნაკრებისთვის, უთანასწორობა მკაცრად დაკმაყოფილებულია. შემდეგ სტრატეგია s" ეწოდება სუსტად დომინირებს.

არამკაცრი უთანასწორობის შემთხვევაში, უკვე შეუძლებელია იმის მტკიცება, რომ რაციონალური მოთამაშე არ აირჩევს სუსტად დომინირებულ სტრატეგიას, თუმცა ასეთი ქცევა საკმაოდ ლოგიკური ჩანს. არსებობს, თუმცა იშვიათად გამოიყენება, წონასწორობის განმარტება სუსტად დომინანტურ სტრატეგიებში, ძლიერი დომინირების შემთხვევის ანალოგიური.

განმარტება 2.5. სტრატეგიის პროფილი s* = (s*, Sj,..., s*) ეწოდება წონასწორობა სუსტად დომინანტურ სტრატეგიებშითუ რომელიმე მე-ე მოთამაშისთვის სტრატეგია სუსტად დომინირებს მის ნებისმიერ სხვა სტრატეგიაში.

მაგალითი 2.2 (დახურული მეორე ფასის აუქციონი). მეორე ფასის დახურული აუქციონი ტარდება ორ პირს შორის. აუქციონი ტარდება შემდეგნაირად. თითოეული მონაწილე მიუთითებს არაუარყოფით განაკვეთზე, არ იცის სხვა მონაწილეთა განაკვეთები (კონვერტში). წევრი, რომელმაც გააკეთა უმაღლესი შეთავაზება, იხდის მაქსიმალურ თანხას სხვა მონაწილეთა წინადადებებს შორის (ანუ მეორეს ოდენობა, მაგრამ წინადადების ღირებულება) და იღებს გარკვეულ ნივთს. თუ, მაგალითად, მოთამაშეების წინადადებები იყო 100 და 90, მაშინ მონაწილე, რომელმაც წინადადება 100 გააკეთა, იგებს აუქციონს, ის იძენს ნივთს 90-ად - მეორე ბიდის ზომაზე. მიეცით საშუალება თითოეულ მონაწილეს ჰქონდეს საგნის შეფასება, გამოხატული ფულადი ერთეულები, v2> 0. ეს შეფასებები ცნობილია ყველა მონაწილისთვის. მოდით, თამაშის აღწერის სიმარტივისთვის, თუ ორივე მონაწილე მიუთითებს ერთსა და იმავე სიჩქარეზე, მაშინ ობიექტი გადადის პირველ მონაწილეზე.

ამ თამაშში პირველი მოთამაშის სტრატეგია იქნება მისი ფსონის ზომა. ვინაიდან მაჩვენებელი არაუარყოფითია, ყველა შესაძლო სტრატეგიის ნაკრები

5, = 0 = u,(o, s 2) > w,(s, s 2) = u, - s 2 v x სუსტად დომინირებს სტრატეგია s,.

ჩვენ ვაჩვენეთ, რომ პირველი მოთამაშისთვის სტრატეგია ფსონად ქულის დასახელების სუსტად დომინირებს ნებისმიერ სხვა სტრატეგიაზე. ადვილია იმის შემოწმება, რომ მსგავსი განცხადება მართალია მეორე მოთამაშისთვისაც. ჩვენ აღვნიშნავთ, რომ ჩვენს მსჯელობაში არასდროს გამოგვიყენებია ის ფაქტი, რომ მოთამაშემ იცის სხვა მოთამაშის შეფასება და, შესაბამისად, არასრული ინფორმაციის მქონე თამაშის შემთხვევაში. დახურული აუქციონითქვენი შეფასების დასახელების მეორე ფასი არანაკლებ მომგებიანი იქნება, ვიდრე ნებისმიერი სხვა ფსონის გაკეთება.

შეიძლება ჩანდეს, რომ გამყიდველისთვის წამგებიანია მეორე ფასის აუქციონის მოწყობა, როდესაც მას შეუძლია მოაწყოს პირველი ფასის აუქციონი და მიიღოს არა მეორე, არამედ პირველი შეთავაზების ღირებულება. თუმცა, წონასწორობაში პირველი ფასის აუქციონის შემთხვევაში ტარიფების ღირებულება უფრო დაბალი იქნება. აუქციონების შემოსავლიანობის შესახებ დაწვრილებით თავში ვისაუბრებთ. 5. ამასობაში აღვნიშნავთ, რომ მეორე ფასის აუქციონი ძალიან პოპულარულია და ფართოდ გამოიყენება, მაგალითად, კომპანიების მიერ. Googleდა „იანდექსი“ ინტერნეტში კონტექსტური რეკლამის გაყიდვისას.

წონასწორობა დომინანტურ სტრატეგიებში არსებობს მხოლოდ მცირე კლასითამაშები. როგორც წესი, მოთამაშეებს არ აქვთ ერთი სტრატეგია, რომელიც დომინირებს ყველა დანარჩენზე. მაგრამ დომინირების კონცეფცია საშუალებას გაძლევთ იპოვოთ გადაწყვეტილებები თამაშების უფრო ფართო კლასში. ამისათვის თქვენ უნდა განახორციელოთ თანმიმდევრული მსჯელობა მოთამაშეების ქმედებებზე. ჩვენ უკვე აღვნიშნეთ, რომ რაციონალური მოთამაშე არ აირჩევს მკაცრად დომინირებულ სტრატეგიას. მაგრამ ეს ნიშნავს, რომ სხვა მოთამაშეს შეუძლია გააანალიზოს თამაში, იგნორირებას უკეთებს მოწინააღმდეგის მიერ ასეთი სტრატეგიის არჩევის შესაძლებლობას. შესაძლოა, ზოგიერთი ანალიზი გამოავლენს, რომ სხვა მოთამაშეს აქვს დომინირებული სტრატეგია, რომელიც არ იყო დომინირებული თავდაპირველ თამაშში. და ა.შ. მოდით მივცეთ ოფიციალური განმარტება.

პროცესი მკაცრად დომინირებული სტრატეგიების თანმიმდევრული გამორიცხვადაყენებულია შემდეგნაირად. მოდით გამოვრიცხოთ მოთამაშეების ყველა მკაცრად დომინირებული სტრატეგია განხილვისაგან, ე.ი. განიხილეთ ახალი თამაში, რომელშიც ყველა დომინირებული სტრატეგია გამორიცხულია მოთამაშეთა შესაძლო სტრატეგიების ნაკრებიდან. შემდეგ ამ ახალი თამაშიჩვენ აღმოვფხვრით ყველა მკაცრად დომინირებულ სტრატეგიას და ა.შ.

შესაძლებელია, რომ ასეთი პროცესი დასრულდეს მაშინ, როდესაც მოთამაშეებს დარჩებათ რამდენიმე სტრატეგია, მაგრამ შესაძლებელია, რომ თითოეულ მოთამაშეს ჰქონდეს მხოლოდ ერთი გამორიცხული სტრატეგია, მაშინ ლოგიკურია ამ სტრატეგიების ნაკრები განიხილოს როგორც თამაშის გადაწყვეტა. .

განმარტება 2.6. თუ ძლიერად დომინირებული სტრატეგიების თანმიმდევრული აღმოფხვრის შედეგად თითოეულ მოთამაშეს რჩება ერთი სტრატეგია, მაშინ ამ სტრატეგიების პროფილი ე.წ. დომინანტური წონასწორობა.

მაგალით 1.1-ში ჩვენ მივიღეთ სწორედ ასეთი წონასწორობა. განვიხილოთ კიდევ ერთი მაგალითი.


სტრატეგიის პროფილი (N, P) არის ერთადერთი ნეშის წონასწორობა ამ თამაშში. მაგრამ გაითვალისწინეთ, რომ P-ს არჩევისთვის, მეორე მოთამაშე დარწმუნებული უნდა იყოს, რომ პირველი მოთამაშე არ აირჩევს B. მაგრამ პირველი მოთამაშის ანაზღაურება იგივეა, თუ მეორე მოთამაშე აირჩევს II-ს. გარდა ამისა, B არჩევით პირველ მოთამაშეს შეიძლება არ შეეშინდეს, რომ მეორე მოთამაშე აირჩევს L. შესაძლოა რაციონალურმა მეორე მოთამაშემ იფიქროს C სტრატეგიის არჩევაზე.

მეორე კითხვა, რომელზეც ჯერ კიდევ არ არის ნაპოვნი ცალსახა პასუხი: როგორ მიდიან მოთამაშეები ნეშის წონასწორობამდე?

იდეალური თეორიული სცენარი ასეთია. მოთამაშეები დამოუკიდებლად ქმნიან მოლოდინს სხვა მოთამაშეების ქმედებებთან დაკავშირებით და შემდეგ ირჩევენ მოქმედებებს, რომლებიც მაქსიმალურად გაზრდის მათ ანაზღაურებას მოცემული მოლოდინების გათვალისწინებით. თუ, ამ შემთხვევაში, მოლოდინი შეესაბამება მოთამაშეების მიერ რეალურად არჩეულ მოქმედებებს, მაშინ ვიღებთ ნეშის წონასწორობას. მსჯელობის ეს ხაზი საშუალებას გვაძლევს ვუწოდოთ ნეშის წონასწორობა სიტუაცია თვითრეალიზებული მოლოდინები.მაგრამ საიდან მოდის მოლოდინი? და რომელი ნეშის წონასწორობა, თუ არის რამდენიმე, აირჩევა აღწერილი პროცესის შედეგად? განხილული სცენარის ფარგლებში ეს კითხვები პასუხგაუცემელი რჩება.

კიდევ ერთი მიდგომა მოიცავს მოთამაშის ვარჯიშის არსებობას. მოთამაშეები ან თეორიულად სწავლობენ მოცემულ თამაშს (წარმოიდგინეთ სტუდენტები ეკონომიკის ფაკულტეტი), ან აქვს მსგავსი ურთიერთქმედების გამოცდილება (მაგალითად, გამოცდილი მუშაკი მოდის ახალი გუნდი), რაც მათ საშუალებას აძლევს სწორად ჩამოაყალიბონ მოლოდინები და აირჩიონ ოპტიმალური ქცევა. ეს სცენარი ხელს უწყობს მოლოდინების ფორმირების ახსნას, მაგრამ ის, პირველ რიგში, ამცირებს ფარგლებს თამაშის მოდელებიმხოლოდ სტანდარტულ, შესწავლილ და ხშირად წარმოქმნილ ურთიერთქმედების სიტუაციებს, მეორეც, შეიძლება გამოიწვიოს ის ფაქტი, რომ ერთჯერადი და განმეორებითი ურთიერთქმედების სიტუაციები არ გამოირჩევიან და ეს უკანასკნელი მნიშვნელოვნად განსხვავდება თამაშის თეორიის ფარგლებში სტრატეგიებისა და გადაწყვეტის მეთოდების მიხედვით. , რაზეც უფრო დეტალურად იქნება განხილული.თქვა თავში. 4.

მესამე სცენარი არის ის, რომ არსებობს წინასწარი შეთანხმება მოთამაშეებს შორის, ან ჩვეულებები, ან კანონები, ან ინსტრუქციები მესამე მხარის მხრიდან, რომლებიც არეგულირებენ მოთამაშეთა ურთიერთქმედებას. ამ შემთხვევაში, შეთანხმებები ან ინსტრუქციები შეიძლება არ იყოს სავალდებულო, მაგრამ თუ რეკომენდირებულია ნეშის წონასწორობის თამაში, მაშინ არცერთ მოთამაშეს არ აქვს სურვილი (მარტო) გადაუხვიოს დადგენილ ქცევას. ნათელია, რომ ასეთი სცენარი ყველა სიტუაციაში შეუძლებელია. გარდა ამისა, ხელშეკრულების დადების ან მესამე მხარის ჩართვის პროცესი შეიძლება გახდეს თამაშის ნაწილი.

და ბოლოს, მესამე ბუნებრივი კითხვა, რომელიც ჩნდება ნეშის წონასწორობის კონცეფციის შესწავლისას, არის შემდეგი: არის თუ არა რაიმე ემპირიული მტკიცებულება იმისა, რომ რეალური მოთამაშეები ჩვეულებრივ ირჩევენ წონასწორობის სტრატეგიებს? აქ ისევ უკიდურესად რთულია მოკლე და ცალსახა პასუხის გაცემა. ამავდროულად, წარმოქმნილი პრობლემების ბუნება უფრო შეესაბამება ექსპერიმენტული ეკონომიკის საგანს. ამიტომ, ჩვენ შემოვიფარგლებით რეკომენდაციით, მივმართოთ სპეციალიზებულ ლიტერატურას, მაგალითად, წიგნს, სადაც შესანიშნავად არის გაანალიზებული ექსპერიმენტული მეთოდოლოგიის კითხვები და წარმოდგენილია არაერთი შედეგი.

არის თამაშები, რომლებსაც არ აქვთ წონასწორობა წმინდა სტრატეგიებში (იხ. მაგალითი 3.1), ამიტომ ჩნდება კითხვა: რა პირობებია საკმარისი ასეთი წონასწორობის არსებობისთვის? მოდით ჩამოვაყალიბოთ და დავამტკიცოთ მტკიცება ნეშის წონასწორობის არსებობის შესახებ წმინდა სტრატეგიებში თამაშებში, რომლებიც არ არის სასრული.

განცხადება 2.3. თუ სტრატეგიების ნაკრები თითოეული მოთამაშისთვის ს ტარის არა ცარიელი ამოზნექილი კომპაქტები ევკლიდეს სივრცეში და თითოეული მოთამაშის ანაზღაურების ფუნქცია და -უწყვეტი შიგნით და კვაზი-ჩაზნექილი 5-ში, მაშინ თამაშს აქვს ნეშის წონასწორობა სუფთა სტრატეგიებში.

მტკიცებულება.გაიხსენეთ ფორმულირება კაკუტაის თეორემები, რომელსაც ჩვენ გამოვიყენებთ მტკიცებულებაში. დაე იყოს X-არა ცარიელი ამოზნექილი კომპაქტური დაყენება R n, X*არის მისი ქვესიმრავლეების სიმრავლე და/ არის ასეთი ზედა ნახევრად უწყვეტი გამოსახვა X in x*,რომ ყოველი პუნქტისთვის x e xრამოდენიმე f(x)არა ცარიელი, დახურული და ამოზნექილი. შემდეგ რუკს / აქვს ფიქსირებული წერტილი.

ჩვენი მტკიცების დამტკიცების იდეაა ავაშენოთ რუკტი, რომელიც აკმაყოფილებს კაკუტანის თეორემის პირობებს. ამისათვის ჩვენ ოდნავ ხელახლა განვსაზღვრავთ საუკეთესო პასუხის ჩვენებას. ჩვენ, წმინდა ტექნიკურად, ვივარაუდებთ, რომ საუკეთესო პასუხი დამოკიდებულია არა მხოლოდ სხვა მოთამაშეების სტრატეგიებზე, არამედ მოთამაშის საკუთარ სტრატეგიაზეც. მოთამაშის საკუთარი სტრატეგიის შეცვლით, სხვა მოთამაშეების სტრატეგიების დაფიქსირებით, საუკეთესო პასუხი, რა თქმა უნდა, არ შეიცვლება. ახლა მოდით შემოვიტანოთ ნოტაცია საუკეთესო პასუხის ჩვენებისთვის ყველა მოთამაშისთვის, როგორც დეკარტის პროდუქტი s(s) = s,(s) x s 2 (s) x... x s n (s).ეს რუკა თითოეულ პროფილზე ანიჭებს პროფილების ერთობლიობას, რომელშიც თითოეული მოთამაშე საუკეთესო გზაპასუხობს სხვა მოთამაშეების სტრატეგიებს. რუკების S-ის ფიქსირებული წერტილი, ე.ი. პროფილი ისეთივე როგორც s e s(s)>განსაზღვრებით არის ნეშის წონასწორობა. ვაჩვენოთ, რომ გამოსახვა 5 აკმაყოფილებს კაკუტანის თეორემის პირობებს. თითოეული პირობის შემოწმება იქნება ცალკე მტკიცებულება.

  • 1. ვაჩვენოთ, რომ კომპლექტი ყველა პროფილი - ამოზნექილი კომპაქტური. ვინაიდან, თითოეული S მოთამაშის სტრატეგიების სიმრავლის დამტკიცების პირობით, არის არა ცარიელი ამოზნექილი კომპაქტური სიმრავლეები, მაშინ დეკარტისეული პროდუქტი = ს ტ X S2 X...x S nარის ამოზნექილი კომპაქტური.
  • 2. ჩვენება აქვს არა ცარიელი სურათები. ვაიერშტრასის თეორემით, უწყვეტი ფუნქცია და -აღწევს დახურულ შემოსაზღვრულ კომპლექტზე 5, საკუთარ მაქსიმალური მნიშვნელობა. შესაბამისად, აქვს არა ცარიელი სურათები.
  • 3. სურათების ჩვენება დახურული და ამოზნექილი. ყოველი მოთამაშის ანაზღაურების ფუნქციიდან გამომდინარე u tკვაზი-ჩაზნექილი in თუშემდეგ, კვაზი-ჩაზნექილი ფუნქციის თვისებით, სიმრავლე $. = (ს. | u t (s i9 s .) > ) ფიქსირებულისთვის .და კდახურულია, როდესაც განმარტების დომენი დახურულია და ამოზნექილია, თუ ცარიელი არ არის. ვინაიდან ეს მართალია ნებისმიერისთვის , მაშინ ასევე მართალია, რომ სიმრავლე 5. = (5/1 u t(s", 5 ,) > maxw.(s., .)}

ამოზნექილი. მაგრამ შემდეგ დეკარტის ნამრავლი 5(5) = s x (s) X s2(S) x... x s n CS) არის დახურული და ამოზნექილი.

4. ვაჩვენოთ, რომ რუკების § ზემოდან ნახევრად უწყვეტი. ჩვენ ვიყენებთ უწყვეტობის პირობას ფუნქციისთვის და,მიერ ს. წინააღმდეგობით დავამტკიცებთ. დავუშვათ, რომ ჩვენება § ns არის ზედა ნახევრად უწყვეტი. შემდეგ არის სტრატეგიის პროფილების თანმიმდევრობა ს მდა ს მ,სადაც t -მიმდევრობის ელემენტის ნომერი, ისეთი, რომ ნებისმიერი ს"" ე ს, ს მ e s(s""), lim s"" = s° e S,მაგრამ ლიმ ს"" = ს° გ ლიმ ს(ს""). ეს ნიშნავს, რომ არსებობს ა

t~*ოო t->/და -? ოო

კლდე, რომლისთვისაც s f ° სტრატეგია არ არის საუკეთესო პასუხი s 0-ზე, ე.ი. არის სტრატეგია ს"ისეთივე როგორც და,(ები", s 0 ,) > ჩვენ] s°;). მაშინ შეიძლება იპოვოთ e > 0 ისეთი, რომ m,(s/, s 0 ,) > m,(s ; °, s 0 ,) + Ze, საიდანაც

ვინაიდან, ვარაუდით, ფუნქცია m უწყვეტია, lim s m = s°, lim s"” = s°,

*ოო -*ოო

საკმარისად დიდით უფლება

უტოლობების (2.8)-(2.10) გაერთიანებით ერთ ჯაჭვში მივიღებთ

(2.11) მიმართებებიდან გამომდინარეობს, რომ u,(s", s"") > m,(s/", s"") + ს,მაგრამ ეს ეწინააღმდეგება პირობას s"" e s(s""), რადგან s" იძლევა მკაცრად უფრო დიდ ანაზღაურებას, ვიდრე s/", s"-ის საპასუხოდ. მათ წინააღმდეგობამდე მივიდნენ. ამიტომ, ჩვენი თავდაპირველი ვარაუდი, რომ s არ არის ზედა ნახევრად უწყვეტი, მცდარი იყო.

ჩვენ ვაჩვენეთ, რომ რუკების აკმაყოფილებს კაკუტანის თეორემის ყველა პირობას და, შესაბამისად, აქვს ფიქსირებული წერტილი. ეს ფიქსირებული წერტილი არის ნეშის წონასწორობა. მტკიცება 2.3 დადასტურებულია. ?

განცხადება 2.3, კერძოდ, იძლევა გარანტიას ნეშის წონასწორობის არსებობას მაგალითში 2.7, მაგრამ არა მაგალითში 2.8, სადაც მოთამაშეთა ანაზღაურების ფუნქციები შეწყვეტილია.

„მაგალითი სამსახურიდან.

მოთამაშის მიერ მოქმედების არჩევანი ეწოდება გადაადგილება. არის მოძრაობები პირადი(მოთამაშე შეგნებულად იღებს გადაწყვეტილებას) და შემთხვევითი(თამაშის შედეგი არ არის დამოკიდებული მოთამაშის ნებაზე). წესების ერთობლიობა, რომელიც განსაზღვრავს, რომელი ნაბიჯი უნდა გააკეთოს მოთამაშემ, ეწოდება სტრატეგია. არის სტრატეგიები სუფთა(მოთამაშის არა შემთხვევითი გადაწყვეტილებები) და შერეული(სტრატეგია შეიძლება ჩაითვალოს შემთხვევით ცვლადად).

უნაგირის წერტილი

AT თამაშის თეორიას.ტ. ( უნაგირის ელემენტი) - ეს ყველაზე დიდი ელემენტისვეტი თამაშის მატრიცები, რომელიც ასევე არის შესაბამისი მწკრივის ყველაზე პატარა ელემენტი (in ორკაციანი ნულოვანი ჯამის თამაში). ამრიგად, ამ დროს ერთი მოთამაშის მაქსიმუმი უდრის მეორის მინიმქსს; S.t. არის წერტილი წონასწორობა.

მინიმალური თეორემა

მინიმალური სტრატეგია ე.წ მინიმალური სტრატეგია.

პრინციპი, რომელიც კარნახობს მოთამაშეებს ყველაზე "ფრთხილი" მაქსიმინისა და მინიმქსის სტრატეგიების არჩევას ე.წ. მინიმაქსის პრინციპი. ეს პრინციპი გამომდინარეობს გონივრული დაშვებიდან, რომ თითოეული მოთამაშე ცდილობს მიაღწიოს მოწინააღმდეგის საპირისპირო მიზნებს.

მოთამაშე ირჩევს თავის მოქმედებებს, იმ ვარაუდით, რომ მოწინააღმდეგე იმოქმედებს არახელსაყრელი გზით, ე.ი. შეეცდება ზიანი მიაყენოს.

დაკარგვის ფუნქცია

დაკარგვის ფუნქციაარის ფუნქცია, რომელიც სტატისტიკური გადაწყვეტილებების თეორიაში ახასიათებს დაკვირვებულ მონაცემებზე დაყრდნობით არასწორი გადაწყვეტილების მიღების გამო დანაკარგებს. თუ ჩარევის ფონზე სიგნალის პარამეტრის შეფასების პრობლემა მოგვარებულია, მაშინ დაკარგვის ფუნქცია არის შეუსაბამობის საზომი. ნამდვილი ღირებულებასავარაუდო პარამეტრი და პარამეტრის შეფასება

მოთამაშის ოპტიმალური შერეული სტრატეგიაარის მისი სუფთა სტრატეგიების გამოყენების სრული ნაკრები თამაშის მრავალჯერად გამეორებაში იმავე პირობებში მოცემული ალბათობით.

მოთამაშის შერეული სტრატეგია არის მისი სუფთა სტრატეგიების გამოყენების სრული ნაკრები თამაშის მრავალჯერადი გამეორების შემთხვევაში იმავე პირობებში მოცემული ალბათობით.

1. თუ მწკრივის ყველა ელემენტი არ აღემატება სხვა რიგის შესაბამის ელემენტებს, მაშინ თავდაპირველი მწკრივი შეიძლება წაიშალოს ანაზღაურების მატრიციდან. ანალოგიურად, სვეტებისთვის.

2. თამაშის ფასი უნიკალურია.

Doc-in:ვთქვათ არის 2 თამაშის ფასი და , რომლებიც მიიღწევა წყვილზე და შესაბამისად, მაშინ

3. თუ ერთი და იგივე რიცხვი დაემატება ანაზღაურების მატრიცის ყველა ელემენტს, მაშინ ოპტიმალური შერეული სტრატეგიები არ შეიცვლება და ამ რიცხვით გაიზრდება თამაშის ფასი.

Doc-in:
, სად

4. თუ ანაზღაურების მატრიცის ყველა ელემენტი გამრავლდება იმავე რიცხვზე, რომელიც არ არის ნულის ტოლი, თამაშის ფასი გამრავლდება ამ რიცხვზე და ოპტიმალური სტრატეგიები არ შეიცვლება.



მსგავსი სტატიები
 
კატეგორიები