სტანდარტული გადახრა არის მისი პრაქტიკული მნიშვნელობა. სტანდარტული გადახრის გამოთვლა Microsoft Excel-ში

17.10.2019

ინსტრუქცია

მოდით იყოს რამდენიმე რიცხვი, რომელიც ახასიათებს - ან ერთგვაროვან სიდიდეებს. მაგალითად, გაზომვების, აწონვის, სტატისტიკური დაკვირვების შედეგები და ა.შ. წარმოდგენილი ყველა რაოდენობა უნდა გაიზომოს ერთი და იგივე გაზომვით. სტანდარტული გადახრის დასადგენად, გააკეთეთ შემდეგი.

დაადგინეთ ყველა რიცხვის საშუალო არითმეტიკული: დაამატეთ ყველა რიცხვი და გაყავით ჯამი რიცხვების საერთო რაოდენობაზე.

განსაზღვრეთ რიცხვების დისპერსიულობა (გაფანტვა): შეკრიბეთ ადრე აღმოჩენილი გადახრების კვადრატები და მიღებული ჯამი გაყავით რიცხვების რაოდენობაზე.

პალატაში შვიდი პაციენტია 34, 35, 36, 37, 38, 39 და 40 გრადუს ცელსიუს ტემპერატურაზე.

საჭიროა საშუალოდან საშუალო გადახრის დადგენა.
გადაწყვეტილება:
"პალატაში": (34+35+36+37+38+39+40)/7=37 ºС;

ტემპერატურის გადახრები საშუალოდან (ამ შემთხვევაში, ნორმალური მნიშვნელობა): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, გამოდის: -3, -2, -1, 0, 1, 2, 3 (ºС);

ადრე მიღებული რიცხვების ჯამი გაყავით მათ რიცხვზე. გაანგარიშების სიზუსტისთვის უმჯობესია გამოიყენოთ კალკულატორი. გაყოფის შედეგი არის ჯამების საშუალო არითმეტიკული.

დიდი ყურადღება მიაქციეთ გაანგარიშების ყველა ეტაპს, რადგან შეცდომა ერთ-ერთ გაანგარიშებაში მაინც გამოიწვევს არასწორ საბოლოო ინდიკატორს. შეამოწმეთ მიღებული გამოთვლები თითოეულ ეტაპზე. საშუალო არითმეტიკულს აქვს იგივე მეტრი, რაც რიცხვების ჯამებს, ანუ თუ განსაზღვრავთ საშუალო დასწრებას, მაშინ ყველა მაჩვენებელი იქნება "ადამიანი".

გაანგარიშების ეს მეთოდი გამოიყენება მხოლოდ მათემატიკურ და სტატისტიკურ გამოთვლებში. მაგალითად, კომპიუტერულ მეცნიერებაში საშუალო არითმეტიკას განსხვავებული გამოთვლის ალგორითმი აქვს. საშუალო არითმეტიკული ძალიან პირობითი მაჩვენებელია. ის აჩვენებს მოვლენის ალბათობას, იმ პირობით, რომ მას აქვს მხოლოდ ერთი ფაქტორი ან მაჩვენებელი. ყველაზე სიღრმისეული ანალიზისთვის ბევრი ფაქტორი უნდა იყოს გათვალისწინებული. ამისთვის გამოიყენება უფრო ზოგადი რაოდენობების გამოთვლა.

საშუალო არითმეტიკული არის ცენტრალური ტენდენციის ერთ-ერთი საზომი, რომელიც ფართოდ გამოიყენება მათემატიკასა და სტატისტიკურ გამოთვლებში. რამდენიმე მნიშვნელობის საშუალო არითმეტიკული მნიშვნელობის პოვნა ძალიან მარტივია, მაგრამ თითოეულ დავალებას აქვს თავისი ნიუანსი, რომელთა ცოდნა უბრალოდ აუცილებელია სწორი გამოთვლების შესასრულებლად.

ასეთი ექსპერიმენტების რაოდენობრივი შედეგები.

როგორ მოვძებნოთ საშუალო არითმეტიკული

რიცხვების მასივისთვის საშუალო არითმეტიკული მნიშვნელობის ძიება უნდა დაიწყოს ამ მნიშვნელობების ალგებრული ჯამის განსაზღვრით. მაგალითად, თუ მასივი შეიცავს ციფრებს 23, 43, 10, 74 და 34, მაშინ მათი ალგებრული ჯამი იქნება 184. წერისას საშუალო არითმეტიკული აღინიშნება ასო მ (mu) ან x (x ზოლით) . შემდეგი, ალგებრული ჯამი უნდა გაიყოს მასივის რიცხვების რაოდენობაზე. ამ მაგალითში ხუთი რიცხვი იყო, ამიტომ საშუალო არითმეტიკული იქნება 184/5 და იქნება 36.8.

უარყოფით რიცხვებთან მუშაობის თავისებურებები

თუ მასივში არის უარყოფითი რიცხვები, მაშინ საშუალო არითმეტიკული იპოვება მსგავსი ალგორითმის გამოყენებით. განსხვავებაა მხოლოდ პროგრამირების გარემოში გაანგარიშებისას, ან თუ დავალებაში არის დამატებითი პირობები. ამ შემთხვევებში, სხვადასხვა ნიშნის მქონე რიცხვების საშუალო არითმეტიკული მნიშვნელობის პოვნა სამ საფეხურამდე მოდის:

1. საერთო არითმეტიკული საშუალოს პოვნა სტანდარტული მეთოდით;
2. უარყოფითი რიცხვების საშუალო არითმეტიკულის პოვნა.
3. დადებითი რიცხვების საშუალო არითმეტიკულის გამოთვლა.

თითოეული მოქმედების პასუხები იწერება მძიმით გამოყოფილი.

ბუნებრივი და ათობითი წილადები

თუ რიცხვთა მასივი წარმოდგენილია ათობითი წილადებით, ამოხსნა ხდება მთელი რიცხვების საშუალო არითმეტიკული გამოთვლის მეთოდის მიხედვით, მაგრამ შედეგი მცირდება ამოცანის მოთხოვნების შესაბამისად პასუხის სიზუსტისთვის.

ბუნებრივ წილადებთან მუშაობისას ისინი უნდა შემცირდეს საერთო მნიშვნელამდე, რომელიც მრავლდება მასივის რიცხვების რაოდენობაზე. პასუხის მრიცხველი იქნება თავდაპირველი წილადი ელემენტების მოცემული მრიცხველების ჯამი.

გაკვეთილი ნომერი 4

თემა: „აღწერითი სტატისტიკა. ნიშან-თვისების მრავალფეროვნების ინდიკატორები აგრეგატში "

სტატისტიკურ პოპულაციაში ნიშან-თვისების მრავალფეროვნების ძირითადი კრიტერიუმებია: ლიმიტი, ამპლიტუდა, სტანდარტული გადახრა, რხევის კოეფიციენტი და ვარიაციის კოეფიციენტი. წინა გაკვეთილზე განიხილეს, რომ საშუალო მნიშვნელობები იძლევა მხოლოდ შესწავლილი მახასიათებლის განზოგადებას მთლიანობაში და არ ითვალისწინებს მისი ცალკეული ვარიანტების მნიშვნელობებს: მინიმალური და მაქსიმალური მნიშვნელობები, საშუალოზე მაღალი. , საშუალოზე დაბალი და ა.შ.

მაგალითი. ორი განსხვავებული რიცხვითი მიმდევრობის საშუალო მნიშვნელობები: -100; -ოცი; 100; 20 და 0.1; -0,2; 0.1 არის ზუსტად იგივე და ტოლიო.თუმცა, ამ შედარებითი საშუალო თანმიმდევრობების მონაცემთა გაფანტვის დიაპაზონი ძალიან განსხვავებულია.

ნიშან-თვისების მრავალფეროვნების ჩამოთვლილი კრიტერიუმების განსაზღვრა, უპირველეს ყოვლისა, ხორციელდება სტატისტიკური პოპულაციის ცალკეული ელემენტებისთვის მისი მნიშვნელობის გათვალისწინებით.

ნიშან-თვისების ცვალებადობის გაზომვის ინდიკატორებია აბსოლუტურიდა ნათესავი. ვარიაციის აბსოლუტურ მაჩვენებლებს მიეკუთვნება: ვარიაციის დიაპაზონი, ლიმიტი, სტანდარტული გადახრა, ვარიაცია. ცვალებადობის კოეფიციენტი და რხევის კოეფიციენტი ეხება ცვალებადობის შედარებით ზომებს.

ლიმიტი (ლიმი) -ეს არის კრიტერიუმი, რომელიც განისაზღვრება ვარიაციის სერიის ვარიანტის უკიდურესი მნიშვნელობებით. სხვა სიტყვებით რომ ვთქვათ, ეს კრიტერიუმი შემოიფარგლება ატრიბუტის მინიმალური და მაქსიმალური მნიშვნელობებით:

ამპლიტუდა (ამ)ან ვარიაციების დიაპაზონი -ეს არის განსხვავება უკიდურესობებს შორის. ამ კრიტერიუმის გაანგარიშება ხორციელდება მისი მინიმალური მნიშვნელობის გამოკლებით ატრიბუტის მაქსიმალური მნიშვნელობიდან, რაც შესაძლებელს ხდის შეაფასოს ვარიანტის დისპერსიის ხარისხი:

ლიმიტისა და ამპლიტუდის მინუსი, როგორც ცვალებადობის კრიტერიუმი, არის ის, რომ ისინი მთლიანად დამოკიდებულია ვარიაციის სერიების მახასიათებლის უკიდურეს მნიშვნელობებზე. ამ შემთხვევაში, სერიებში ატრიბუტის მნიშვნელობების რყევები არ არის გათვალისწინებული.

სტატისტიკურ პოპულაციაში ნიშან-თვისების მრავალფეროვნების ყველაზე სრული დახასიათება მოცემულია იმით სტანდარტული გადახრა(სიგმა), რომელიც არის ვარიანტის გადახრის ზოგადი ზომა მისი საშუალო მნიშვნელობიდან. სტანდარტული გადახრა ასევე ხშირად მოიხსენიება როგორც სტანდარტული გადახრა.

სტანდარტული გადახრის საფუძველია თითოეული ვარიანტის შედარება ამ პოპულაციის საშუალო არითმეტიკასთან. ვინაიდან მთლიანობაში ყოველთვის იქნება მასზე ნაკლები და მეტი ვარიანტები, მაშინ "" ნიშნის მქონე გადახრების ჯამი ანაზღაურდება "" ნიშნის მქონე გადახრების ჯამით, ე.ი. ყველა გადახრის ჯამი არის ნული. განსხვავებების ნიშნების ზემოქმედების თავიდან აცილების მიზნით, აღებულია ვარიანტის გადახრები საშუალო არითმეტიკული კვადრატიდან, ე.ი. . კვადრატული გადახრების ჯამი არ არის ნულის ტოლი. კოეფიციენტის მისაღებად, რომელსაც შეუძლია ცვალებადობის გაზომვა, აიღეთ კვადრატების ჯამის საშუალო - ეს მნიშვნელობა ე.წ. დისპერსია:

განმარტებით, დისპერსია არის მახასიათებლის ინდივიდუალური მნიშვნელობების გადახრების საშუალო კვადრატი მისი საშუალო მნიშვნელობიდან. დისპერსია კვადრატული სტანდარტული გადახრა.

დისპერსია არის განზომილებიანი სიდიდე (დასახელებული). ასე რომ, თუ რიცხვების სერიის ვარიანტები გამოხატულია მეტრებში, მაშინ დისპერსია იძლევა კვადრატულ მეტრს; თუ ვარიანტები გამოიხატება კილოგრამებში, მაშინ ვარიაცია იძლევა ამ ზომის კვადრატს (კგ 2) და ა.შ.

Სტანდარტული გადახრაარის სხვაობის კვადრატული ფესვი:

, მაშინ წილადის მნიშვნელში დისპერსიისა და სტანდარტული გადახრის გაანგარიშებისას ნაცვლადაუცილებელია დააყენოს.

სტანდარტული გადახრის გაანგარიშება შეიძლება დაიყოს ექვს ეტაპად, რომელიც უნდა განხორციელდეს გარკვეული თანმიმდევრობით:

სტანდარტული გადახრის გამოყენება:

ა) ვარიაციული სერიების რყევის მსჯელობა და არითმეტიკული საშუალებების ტიპურობის (წარმომადგენლობითობის) შედარებითი შეფასება. ეს აუცილებელია დიფერენციალური დიაგნოზის დროს ნიშნების სტაბილურობის დადგენისას.

ბ) ვარიაციული სერიის რეკონსტრუქციისთვის, ე.ი. მისი სიხშირის პასუხის აღდგენა საფუძველზე სამი სიგმას წესი. ინტერვალში (М±3σ) არის სერიის ყველა ვარიანტის 99,7%, ინტერვალში (М±2σ) - 95,5% და ინტერვალში (М±1σ) - 68.3% რიგის ვარიანტი(ნახ. 1).

გ) ამომხტარი ვარიანტების იდენტიფიცირება

დ) ნორმისა და პათოლოგიის პარამეტრების დადგენა სიგმა შეფასების გამოყენებით

ე) ვარიაციის კოეფიციენტის გამოთვლა

ე) საშუალო არითმეტიკული ცდომილების გამოთვლა.

ნებისმიერი ზოგადი პოპულაციის დასახასიათებლად, რომელსაც აქვსნორმალური განაწილების ტიპი საკმარისია ვიცოდეთ ორი პარამეტრი: საშუალო არითმეტიკული და სტანდარტული გადახრა.

სურათი 1. სამი სიგმის წესი

მაგალითი.

პედიატრიაში სტანდარტული გადახრა გამოიყენება ბავშვების ფიზიკური განვითარების შესაფასებლად კონკრეტული ბავშვის მონაცემების შესაბამის სტანდარტულ ინდიკატორებთან შედარების გზით. სტანდარტად აღებულია ჯანმრთელი ბავშვების ფიზიკური განვითარების საშუალო არითმეტიკული მაჩვენებლები. ინდიკატორების შედარება სტანდარტებთან ხორციელდება სპეციალური ცხრილების მიხედვით, რომლებშიც მოცემულია სტანდარტები მათ შესაბამის სიგმასკალებთან ერთად. ითვლება, რომ თუ ბავშვის ფიზიკური განვითარების მაჩვენებელი სტანდარტის (საშუალო არითმეტიკული) ფარგლებშია ±σ, მაშინ ბავშვის ფიზიკური განვითარება (ამ ინდიკატორის მიხედვით) შეესაბამება ნორმას. თუ ინდიკატორი ±2σ სტანდარტის ფარგლებშია, მაშინ არის ნორმიდან უმნიშვნელო გადახრა. თუ მაჩვენებელი სცილდება ამ საზღვრებს, მაშინ ბავშვის ფიზიკური განვითარება მკვეთრად განსხვავდება ნორმისგან (პათოლოგია შესაძლებელია).

აბსოლუტურ მნიშვნელობებში გამოხატული ვარიაციის ინდიკატორების გარდა, სტატისტიკური კვლევა იყენებს ფარდობით მნიშვნელობებში გამოხატულ ვარიაციულ ინდიკატორებს. რხევის კოეფიციენტი -ეს არის ვარიაციის დიაპაზონის თანაფარდობა თვისების საშუალო მნიშვნელობასთან. ცვალებადობის კოეფიციენტი -ეს არის სტანდარტული გადახრის თანაფარდობა მახასიათებლის საშუალო მნიშვნელობასთან. როგორც წესი, ეს მნიშვნელობები გამოხატულია პროცენტულად.

ცვალებადობის ფარდობითი ინდიკატორების გამოთვლის ფორმულები:

ზემოთ მოყვანილი ფორმულებიდან ჩანს, რომ რაც უფრო დიდია კოეფიციენტი ნულთან ახლოს, მით უფრო მცირეა ნიშან-თვისებების მნიშვნელობების ცვალებადობა. Უფრო , მით უფრო ცვალებადია ნიშანი.

სტატისტიკურ პრაქტიკაში ყველაზე ხშირად გამოიყენება ცვალებადობის კოეფიციენტი. იგი გამოიყენება არა მხოლოდ ვარიაციის შედარებითი შეფასებისთვის, არამედ მოსახლეობის ჰომოგენურობის დასახასიათებლად. ნაკრები ითვლება ერთგვაროვანად, თუ ვარიაციის კოეფიციენტი არ აღემატება 33%-ს (ნორმასთან ახლოს განაწილებისთვის). არითმეტიკულად, σ-სა და საშუალო არითმეტიკული შეფარდება გამორიცხავს ამ მახასიათებლების აბსოლუტური მნიშვნელობის გავლენას, ხოლო პროცენტული თანაფარდობა ცვალებადობის კოეფიციენტს უგანზომილებიან (უსახელო) მნიშვნელობად აქცევს.

ცვალებადობის კოეფიციენტის მიღებული მნიშვნელობა ფასდება ნიშან-თვისების მრავალფეროვნების ხარისხის სავარაუდო გრადაციების მიხედვით:

სუსტი - 10% -მდე

საშუალო - 10 - 20%

ძლიერი - 20% -ზე მეტი

ცვალებადობის კოეფიციენტის გამოყენება მიზანშეწონილია იმ შემთხვევებში, როდესაც აუცილებელია ზომითა და განზომილებით განსხვავებული მახასიათებლების შედარება.

განსხვავება ცვალებადობის კოეფიციენტსა და სხვა გაფანტვის კრიტერიუმებს შორის ნათლად არის ნაჩვენები მაგალითი.

ცხრილი 1

სამრეწველო საწარმოს თანამშრომელთა შემადგენლობა

მაგალითში მოცემული სტატისტიკური მახასიათებლების საფუძველზე შეიძლება დავასკვნათ, რომ საწარმოს თანამშრომელთა ასაკობრივი შემადგენლობა და განათლების დონე შედარებით ერთგვაროვანია, გამოკითხული კონტინგენტის დაბალი პროფესიული სტაბილურობით. ადვილი მისახვედრია, რომ ამ სოციალური ტენდენციების სტანდარტული გადახრის მიხედვით შეფასების მცდელობა გამოიწვევს მცდარ დასკვნას, ხოლო ბუღალტრული აღრიცხვის მახასიათებლების „სამუშაო გამოცდილება“ და „ასაკი“ სააღრიცხვო მახასიათებლთან „განათლება“ შედარების მცდელობა ზოგადად იქნება. არასწორია ამ მახასიათებლების ჰეტეროგენურობის გამო.

მედიანა და პროცენტები

რიგითი (რანგის) განაწილებისთვის, სადაც სერიის შუა კრიტერიუმია მედიანა, სტანდარტული გადახრა და დისპერსიული არ შეიძლება იყოს ვარიანტის დისპერსიის მახასიათებლებად.

იგივე ეხება ღია ვარიაციულ სერიებს. ეს გარემოება განპირობებულია იმით, რომ გადახრები, რომლის მიხედვითაც გამოითვლება დისპერსია და σ, ითვლება საშუალო არითმეტიკულიდან, რომელიც არ გამოითვლება ღია ვარიაციულ სერიებში და თვისებრივი მახასიათებლების განაწილების სერიებში. ამიტომ, განაწილების შეკუმშული აღწერისთვის გამოიყენება სხვა სკატერის პარამეტრი - კვანტილი(სინონიმი - "პროცენტილი"), შესაფერისია ხარისხობრივი და რაოდენობრივი მახასიათებლების აღსაწერად მათი განაწილების ნებისმიერი ფორმით. ეს პარამეტრი ასევე შეიძლება გამოყენებულ იქნას რაოდენობრივი მახასიათებლების ხარისხობრივად გადაქცევისთვის. ამ შემთხვევაში, ასეთი ქულები ენიჭება იმის მიხედვით, თუ რომელი რიგის კვანტილი შეესაბამება ამა თუ იმ კონკრეტულ ვარიანტს.

ბიოსამედიცინო კვლევის პრაქტიკაში ყველაზე ხშირად გამოიყენება შემდეგი კვანტილები:

- მედიანა;

, არის კვარტლები (კვარტლები), სად არის ქვედა მეოთხედი, ზედა მეოთხედი.

კვანტილები ყოფენ ვარიაციულ სერიაში შესაძლო ცვლილებების არეალს გარკვეულ ინტერვალებად. მედიანა (კვანტილი) არის ვარიანტი, რომელიც არის ვარიაციის სერიის შუაში და ყოფს ამ სერიას შუაზე, ორ თანაბარ ნაწილად ( 0,5 და 0,5 ). მეოთხედი ყოფს სერიას ოთხ ნაწილად: პირველი ნაწილი (ქვედა მეოთხედი) არის ოფციების გამიჯვნა, რომელთა რიცხვითი მნიშვნელობები არ აღემატება ამ სერიაში შესაძლო მაქსიმუმის 25%-ს, მეოთხედი გამოყოფს ვარიანტებს 50-მდე რიცხვითი მნიშვნელობით. მაქსიმალური შესაძლო პროცენტის პროცენტი. ზედა მეოთხედი () გამოყოფს ვარიანტებს მაქსიმალური შესაძლო მნიშვნელობების 75%-მდე.

ასიმეტრიული განაწილების შემთხვევაში საშუალო არითმეტიკასთან შედარებით ცვლადი, მის დასახასიათებლად გამოიყენება მედიანა და კვარტილები.ამ შემთხვევაში გამოიყენება საშუალო მნიშვნელობის ჩვენების შემდეგი ფორმა - მე (;). Მაგალითად, შესასწავლ ნიშანს - „პერიოდი, როცა ბავშვმა დამოუკიდებლად დაიწყო სიარული“ - საკვლევ ჯგუფში ასიმეტრიული განაწილებაა. ამავდროულად, ქვედა მეოთხედი () შეესაბამება სიარულის დაწყებას - 9,5 თვე, მედიანა - 11 თვე, ზედა მეოთხედი () - 12 თვე. შესაბამისად, მითითებული ატრიბუტის საშუალო ტენდენციის მახასიათებელი წარმოდგენილი იქნება როგორც 11 (9.5; 12) თვე.

კვლევის შედეგების სტატისტიკური მნიშვნელოვნების შეფასება

მონაცემების სტატისტიკური მნიშვნელოვნება გაგებულია, როგორც მათი შესაბამისობის ხარისხი ჩვენებულ რეალობასთან, ე.ი. სტატისტიკურად მნიშვნელოვანი ის მონაცემებია, რომლებიც არ ამახინჯებენ და სწორად ასახავს ობიექტურ რეალობას.

კვლევის შედეგების სტატისტიკური მნიშვნელობის შეფასება ნიშნავს იმის დადგენას, თუ რა ალბათობით არის შესაძლებელი ნიმუშ პოპულაციაზე მიღებული შედეგების გადატანა მთელ პოპულაციაზე. სტატისტიკური მნიშვნელოვნების შეფასება აუცილებელია იმის გასაგებად, თუ რამდენად შეიძლება ფენომენის ნაწილის გამოყენება ფენომენის მთლიანობაში და მის შაბლონებზე შესაფასებლად.

კვლევის შედეგების სტატისტიკური მნიშვნელოვნების შეფასება შედგება:

1. წარმომადგენლობითობის შეცდომები (საშუალო და ფარდობითი მნიშვნელობების შეცდომები) - ;

2. საშუალო ან ფარდობითი მნიშვნელობების ნდობის ზღვრები;

3. საშუალო ან ფარდობით მნიშვნელობებს შორის სხვაობის სანდოობა კრიტერიუმის მიხედვით .

საშუალო არითმეტიკული ცდომილებაან წარმომადგენლობითი შეცდომაახასიათებს საშუალო რყევებს. უნდა აღინიშნოს, რომ რაც უფრო დიდია ნიმუშის ზომა, მით უფრო მცირეა საშუალო მნიშვნელობების გავრცელება. საშუალო სტანდარტული შეცდომა გამოითვლება ფორმულით:

თანამედროვე სამეცნიერო ლიტერატურაში საშუალო არითმეტიკული წარმომადგენლობის შეცდომასთან ერთად იწერება:

ან სტანდარტულ გადახრასთან ერთად:

მაგალითად, განვიხილოთ ქვეყნის 1500 ურბანული პოლიკლინიკის მონაცემები (ზოგადი მოსახლეობა). პოლიკლინიკაში მომსახურე პაციენტების საშუალო რაოდენობა შეადგენს 18150 ადამიანს. ობიექტების 10%-ის შემთხვევითი შერჩევა (150 პოლიკლინიკა) იძლევა პაციენტების საშუალო რაოდენობას, რომელიც უტოლდება 20051 ადამიანს. შერჩევის შეცდომა, რომელიც აშკარად დაკავშირებულია იმ ფაქტთან, რომ 1500-ვე პოლიკლინიკა არ იყო შეტანილი ნიმუშში, უდრის განსხვავებას ამ საშუალო მაჩვენებლებს შორის - ზოგადი საშუალო ( გენი) და ნიმუშის საშუალო ( სბ). თუ ჩვენ შევქმნით იმავე ზომის სხვა ნიმუშს ჩვენი პოპულაციისგან, ის მისცემს სხვადასხვა რაოდენობის შეცდომას. ყველა ეს სანიმუშო საშუალება, საკმარისად დიდი ნიმუშებით, ჩვეულებრივ ნაწილდება საერთო საშუალოზე, საკმარისად დიდი რაოდენობის გამეორებით ერთი და იგივე რაოდენობის ობიექტების ნიმუშის ზოგადი პოპულაციისგან. საშუალო სტანდარტული შეცდომა არის სანიმუშო საშუალებების გარდაუვალი გავრცელება ზოგადი საშუალოს გარშემო.

იმ შემთხვევაში, როდესაც კვლევის შედეგები წარმოდგენილია ფარდობითი მნიშვნელობებით (მაგალითად, პროცენტები), გააზიარეთ სტანდარტული შეცდომა:

სადაც P არის მაჩვენებელი %, n არის დაკვირვებების რაოდენობა.

შედეგი ნაჩვენებია როგორც (P ± m)%. Მაგალითად,გამოჯანმრთელების პროცენტი პაციენტებს შორის იყო (95.2±2.5).

თუ ელემენტების რაოდენობა პოპულაციაში, მაშინ საშუალოს სტანდარტული შეცდომების გამოთვლისას და წილადის მნიშვნელში წილის ნაცვლად, ნაცვლადაუცილებელია დააყენოს.

ნორმალური განაწილებისთვის (ნიმუშების საშუალო განაწილება ნორმალურია), ცნობილია, თუ რამდენი პოპულაცია ხვდება საშუალოს ირგვლივ ნებისმიერ ინტერვალში. Კერძოდ:

პრაქტიკაში პრობლემა მდგომარეობს იმაში, რომ ჩვენთვის უცნობია ზოგადი პოპულაციის მახასიათებლები და ნიმუში კეთდება სწორედ მათი შეფასების მიზნით. ეს ნიშნავს, რომ თუ ავიღებთ იმავე ზომის ნიმუშებს საერთო პოპულაციიდან, მაშინ 68.3% შემთხვევაში ინტერვალი შეიცავს მნიშვნელობას (შემთხვევათა 95,5%-ში იქნება ინტერვალზე და 99,7%-ში ინტერვალზე).

ვინაიდან ფაქტობრივად მხოლოდ ერთი ნიმუშია მიღებული, ეს განცხადება ჩამოყალიბებულია ალბათობის მიხედვით: 68,3% ალბათობით, ატრიბუტის საშუალო მნიშვნელობა საერთო პოპულაციაში შედის ინტერვალში, ალბათობით 95,5%. - ინტერვალში და ა.შ.

პრაქტიკაში, ასეთი ინტერვალი აგებულია ნიმუშის მნიშვნელობის გარშემო, რომელიც მოცემული (საკმარისად მაღალი) ალბათობით - ნდობის ალბათობა -„დაფარავს“ ამ პარამეტრის ნამდვილ მნიშვნელობას ზოგად პოპულაციაში. ამ ინტერვალს ე.წ ნდობის ინტერვალი.

ნდობის ალბათობა არის ნდობის ხარისხი, რომ ნდობის ინტერვალი ნამდვილად შეიცავს პარამეტრის ნამდვილ (უცნობ) მნიშვნელობას პოპულაციაში.

მაგალითად, თუ ნდობის დონე უდრის 90%-ს, ეს ნიშნავს, რომ 100-დან 90 ნიმუში იძლევა პარამეტრის სწორ შეფასებას საერთო პოპულაციაში. შესაბამისად, შეცდომის ალბათობა, ე.ი. ნიმუშის ზოგადი საშუალოს არასწორი შეფასება, პროცენტულად ტოლია: . ამ მაგალითისთვის ეს ნიშნავს, რომ 100-დან 10 ნიმუში არასწორ შეფასებას იძლევა.

ცხადია, ნდობის ხარისხი (ნდობის ალბათობა) დამოკიდებულია ინტერვალის ზომაზე: რაც უფრო ფართოა ინტერვალი, მით უფრო მაღალია ნდობა, რომ მასში მოხვდება უცნობი მნიშვნელობა ზოგადი პოპულაციისთვის. პრაქტიკაში, მინიმუმ ორჯერ მეტი შერჩევის შეცდომა მიიღება ნდობის ინტერვალის შესაქმნელად, რათა უზრუნველყოს მინიმუმ 95.5% ნდობა.

საშუალო და ფარდობითი მნიშვნელობების ნდობის ზღვრების დადგენა საშუალებას გვაძლევს ვიპოვოთ მათი ორი უკიდურესი მნიშვნელობა - მინიმალური შესაძლო და მაქსიმალური შესაძლო, რომლის ფარგლებშიც შესასწავლი მაჩვენებელი შეიძლება მოხდეს მთელ ზოგად პოპულაციაში. ამის საფუძველზე, ნდობის ლიმიტები (ან ნდობის ინტერვალი)- ეს არის საშუალო ან ფარდობითი მნიშვნელობების საზღვრები, რომელთა მიღმაც შემთხვევითი რყევების გამო, უმნიშვნელო ალბათობაა.

ნდობის ინტერვალი შეიძლება გადაიწეროს შემდეგნაირად: , სად არის ნდობის კრიტერიუმი.

საშუალო არითმეტიკული საზღვრები საერთო პოპულაციაში განისაზღვრება ფორმულით:

გენი = მ აირჩიეთ + ტ მ

ფარდობითი მნიშვნელობისთვის:

გენი = პ აირჩიეთ + ტმ

სადაც გენიდა გენი- საშუალო და ფარდობითი მნიშვნელობების მნიშვნელობები ზოგადი მოსახლეობისთვის; აირჩიეთდა აირჩიეთ- შერჩევის პოპულაციაზე მიღებული საშუალო და ფარდობითი მნიშვნელობების მნიშვნელობები; და - საშუალო და ფარდობითი მნიშვნელობების შეცდომები; - ნდობის კრიტერიუმი (სიზუსტის კრიტერიუმი, რომელიც დგინდება კვლევის დაგეგმვისას და შეიძლება იყოს 2 ან 3-ის ტოლი); ტმ- ეს არის ნდობის ინტერვალი ან Δ - ნიმუშის კვლევაში მიღებული ინდიკატორის ზღვრული შეცდომა.

უნდა აღინიშნოს, რომ კრიტერიუმის ღირებულება გარკვეულწილად, ის დაკავშირებულია უშეცდომო პროგნოზის (p) ალბათობასთან, გამოხატული პროცენტებში. მას ირჩევს თავად მკვლევარი, რომელსაც ხელმძღვანელობს საჭირო სიზუსტით შედეგის მოპოვების აუცილებლობით. ასე რომ, 95,5%-იანი ცდომილების პროგნოზის ალბათობისთვის, კრიტერიუმის მნიშვნელობა არის 2, 99.7%-ისთვის - 3.

ნდობის ინტერვალის მოცემული შეფასებები მისაღებია მხოლოდ 30-ზე მეტი დაკვირვების მქონე სტატისტიკური პოპულაციებისთვის, პოპულაციის უფრო მცირე ზომის შემთხვევაში (პატარა ნიმუშები) გამოიყენება სპეციალური ცხრილები, რათა განისაზღვროს t კრიტერიუმი. ამ ცხრილებში სასურველი მნიშვნელობა არის პოპულაციის ზომის შესაბამისი ხაზის კვეთაზე (n-1), და მკვლევარის მიერ არჩეული უშეცდომო პროგნოზის ალბათობის დონის შესაბამისი სვეტი (95.5%; 99.7%). სამედიცინო კვლევაში, ნებისმიერი ინდიკატორის ნდობის ლიმიტების დადგენისას, უშეცდომოდ პროგნოზის ალბათობა არის 95,5% ან მეტი. ეს ნიშნავს, რომ შერჩევის პოპულაციაზე მიღებული ინდიკატორის მნიშვნელობა უნდა მოიძებნოს ზოგად პოპულაციაში მინიმუმ 95.5% შემთხვევაში.

    კითხვები გაკვეთილის თემაზე:

    სტატისტიკურ პოპულაციაში ნიშან-თვისების მრავალფეროვნების ინდიკატორების შესაბამისობა.

    ვარიაციის აბსოლუტური მაჩვენებლების ზოგადი მახასიათებლები.

    სტანდარტული გადახრა, გაანგარიშება, გამოყენება.

    ვარიაციის შედარებითი მაჩვენებლები.

    მედიანა, მეოთხედი ქულა.

    კვლევის შედეგების სტატისტიკური მნიშვნელოვნების შეფასება.

    საშუალო არითმეტიკული ცდომილება, გამოთვლის ფორმულა, გამოყენების მაგალითი.

    წილის გაანგარიშება და მისი სტანდარტული შეცდომა.

    ნდობის ალბათობის კონცეფცია, გამოყენების მაგალითი.

10. ნდობის ინტერვალის ცნება, მისი გამოყენება.

    სატესტო დავალებები თემაზე: პასუხების ნიმუში:

1. ცვალებადობის აბსოლუტური მაჩვენებლებია

1) ვარიაციის კოეფიციენტი

2) რხევის კოეფიციენტი

4) მედიანა

2. ცვალებადობის შედარებითი მაჩვენებლებია

1) დისპერსია

4) ვარიაციის კოეფიციენტი

3. კრიტერიუმი, რომელიც განისაზღვრება ვარიაციული სერიების ვარიანტის უკიდურესი მნიშვნელობებით

2) ამპლიტუდა

3) დისპერსია

4) ვარიაციის კოეფიციენტი

4. ექსტრემალური ვარიანტის განსხვავება არის

2) ამპლიტუდა

3) სტანდარტული გადახრა

4) ვარიაციის კოეფიციენტი

5. ცალკეული მნიშვნელოვანი მნიშვნელობების გადახრების საშუალო კვადრატი მისი საშუალო მნიშვნელობიდან არის

1) რხევის კოეფიციენტი

2) მედიანა

3) დისპერსია

6. ცვალებადობის დიაპაზონის თანაფარდობა მახასიათებლის საშუალო მნიშვნელობასთან არის

1) ვარიაციის კოეფიციენტი

2) სტანდარტული გადახრა

4) რხევის კოეფიციენტი

7. საშუალო კვადრატული გადახრის თანაფარდობა მახასიათებლის საშუალო მნიშვნელობასთან არის

1) დისპერსია

2) ვარიაციის კოეფიციენტი

3) რხევის კოეფიციენტი

4) ამპლიტუდა

8. ვარიანტი, რომელიც იმყოფება ვარიაციის სერიის შუაში და ყოფს მას ორ თანაბარ ნაწილად არის

1) მედიანა

3) ამპლიტუდა

9. სამედიცინო კვლევებში, ნებისმიერი ინდიკატორის ნდობის ზღვრების დადგენისას, უშეცდომო წინასწარმეტყველების ალბათობა მიღებულია

10. თუ 100-დან 90 ნიმუში იძლევა პარამეტრის სწორ შეფასებას ზოგად პოპულაციაში, მაშინ ეს ნიშნავს, რომ ნდობის ალბათობა თანაბარი

11. იმ შემთხვევაში, თუ 100-დან 10 ნიმუში იძლევა არასწორ შეფასებას, შეცდომის ალბათობა არის

12. საშუალო ან ფარდობითი მნიშვნელობების საზღვრები, არის მცირე ალბათობა, რომ გადავიდეთ საზღვრებს მიღმა შემთხვევითი რხევების გამო - ეს

1) ნდობის ინტერვალი

2) ამპლიტუდა

4) ვარიაციის კოეფიციენტი

13. მცირე ნიმუშად ითვლება ის მოსახლეობა, რომელშიც

1) n არის 100-ზე ნაკლები ან ტოლი

2) n არის 30-ზე ნაკლები ან ტოლი

3) n არის 40-ზე ნაკლები ან ტოლი

4) n ახლოს არის 0-თან

14. უპრობლემოდ პროგნოზის ალბათობისთვის 95% კრიტერიუმის ღირებულება ადგენს

15. უპრობლემოდ პროგნოზის ალბათობისთვის 99% კრიტერიუმის ღირებულება ადგენს

16. ნორმალურთან ახლოს განაწილებისთვის, მოსახლეობა განიხილება ჰომოგენურად, თუ ცვალებადობის კოეფიციენტი არ აღემატება

17. ვარიანტების განცალკევება, რომელთა რიცხვითი მნიშვნელობები არ აღემატება ამ მწკრივში არსებული მაქსიმუმის 25%-ს

2) ქვედა მეოთხედი

3) ზედა მეოთხედი

4) მეოთხედი

18. მონაცემებს, რომლებიც არ ამახინჯებენ და სწორად ასახავს ობიექტურ რეალობას, ე.წ.

1) შეუძლებელია

2) თანაბრად შესაძლებელია

3) საიმედო

4) შემთხვევითი

19. სამი სიგმის წესის მიხედვით, ნიშნის ნორმალური განაწილებით შიგნით
განთავსდება

1) 68.3% ვარიანტი

Სტანდარტული გადახრა

ვარიაციის ყველაზე სრულყოფილი მახასიათებელი არის სტანდარტული გადახრა, ĸᴏᴛᴏᴩᴏᴇ ეწოდება სტანდარტს (ან სტანდარტულ გადახრას). Სტანდარტული გადახრა() უდრის არითმეტიკული საშუალოდან ინდივიდუალური მახასიათებლების მნიშვნელობების გადახრების საშუალო კვადრატის კვადრატულ ფესვს:

სტანდარტული გადახრა მარტივია:

შეწონილი სტანდარტული გადახრა გამოიყენება დაჯგუფებული მონაცემებისთვის:

საშუალო კვადრატსა და საშუალო წრფივ გადახრებს შორის ნორმალური განაწილების პირობებში ხდება შემდეგი კავშირი: ~ 1.25.

სტანდარტული გადახრა, როგორც ცვალებადობის მთავარი აბსოლუტური საზომი, გამოიყენება ნორმალური განაწილების მრუდის ორდინატების მნიშვნელობების დასადგენად, ნიმუშის დაკვირვების ორგანიზებასთან და სინჯის მახასიათებლების სიზუსტის დადგენასთან დაკავშირებულ გამოთვლებში, აგრეთვე ერთგვაროვან პოპულაციაში ნიშან-თვისების ვარიაციის საზღვრების შეფასება.

18. დისპერსია, მისი ტიპები, სტანდარტული გადახრა.

შემთხვევითი ცვლადის ვარიაცია- მოცემული შემთხვევითი ცვლადის გავრცელების საზომი, ანუ მისი გადახრა მათემატიკური მოლოდინიდან. სტატისტიკაში, აღნიშვნა ან ხშირად გამოიყენება. დისპერსიის კვადრატული ფესვი ეწოდება სტანდარტული გადახრა, სტანდარტული გადახრაან სტანდარტული გავრცელება.

ტოტალური დისპერსია (σ2) ზომავს თვისების ცვალებადობას მთელ პოპულაციაში ყველა იმ ფაქტორის გავლენის ქვეშ, რამაც გამოიწვია ეს ცვალებადობა. ამავდროულად, დაჯგუფების მეთოდის წყალობით შესაძლებელია დაჯგუფების მახასიათებლის გამო ცვალებადობის იზოლირება და გაზომვა, და ვარიაცია, რომელიც წარმოიქმნება გაუთვალისწინებელი ფაქტორების გავლენის ქვეშ.

ჯგუფთაშორისი ვარიაცია (σ 2 მ.გრ) ახასიათებს სისტემურ ვარიაციებს, ანუ განსხვავებებს შესწავლილი ნიშან-თვისების ღირებულებაში, რომელიც წარმოიქმნება ნიშან-თვისების - დაჯგუფების საფუძვლიანი ფაქტორის გავლენით.

სტანდარტული გადახრა(სინონიმები: სტანდარტული გადახრა, სტანდარტული გადახრა, სტანდარტული გადახრა; დაკავშირებული ტერმინები: სტანდარტული გადახრა, სტანდარტული გავრცელება) - ალბათობის თეორიასა და სტატისტიკაში, შემთხვევითი ცვლადის მნიშვნელობების დისპერსიის ყველაზე გავრცელებული მაჩვენებელი მის მათემატიკური მოლოდინის მიმართ. მნიშვნელობების ნიმუშების შეზღუდული მასივებით, მათემატიკური მოლოდინის ნაცვლად, გამოიყენება ნიმუშების ნაკრების საშუალო არითმეტიკული.

სტანდარტული გადახრა იზომება შემთხვევითი ცვლადის ერთეულებში და გამოიყენება საშუალო არითმეტიკული ცდომილების გამოთვლაში, ნდობის ინტერვალების აგებაში, ჰიპოთეზების სტატისტიკურ ტესტირებაში და შემთხვევით ცვლადებს შორის წრფივი ურთიერთობის გაზომვისას. იგი განისაზღვრება, როგორც შემთხვევითი ცვლადის დისპერსიის კვადრატული ფესვი.

Სტანდარტული გადახრა:

Სტანდარტული გადახრა(შემთხვევითი ცვლადის სტანდარტული გადახრის შეფასება xმის მათემატიკურ მოლოდინთან შედარებით, მისი დისპერსიის მიუკერძოებელი შეფასებით):

სად არის დისპერსია; - მე-ე ნიმუში ელემენტი; - ნიმუშის ზომა; - ნიმუშის საშუალო არითმეტიკული:

უნდა აღინიშნოს, რომ ორივე შეფასება მიკერძოებულია. ზოგად შემთხვევაში, მიუკერძოებელი შეფასების გაკეთება შეუძლებელია. ამავდროულად, მიკერძოებული დისპერსიის შეფასებაზე დაფუძნებული შეფასება თანმიმდევრულია.

19. რეჟიმისა და მედიანის განსაზღვრის არსი, ფარგლები და პროცედურა.

სტატისტიკაში ძალაუფლების კანონის საშუალო მაჩვენებლების გარდა, განსხვავებული ატრიბუტის სიდიდისა და განაწილების სერიების შიდა სტრუქტურის შედარებითი მახასიათებლისთვის გამოიყენება სტრუქტურული საშუალოები, რომლებიც ძირითადად წარმოდგენილია რეჟიმი და მედიანა.

მოდა- ეს სერიის ყველაზე გავრცელებული ვარიანტია. მოდას იყენებენ, მაგალითად, ტანსაცმლის, ფეხსაცმლის ზომის განსაზღვრისას, რომლებიც ყველაზე დიდი მოთხოვნაა მყიდველებს შორის. დისკრეტული სერიის რეჟიმი არის ყველაზე მაღალი სიხშირის ვარიანტი. ინტერვალის ვარიაციის სერიის რეჟიმის გაანგარიშებისას ძალზე მნიშვნელოვანია ჯერ მოდალური ინტერვალის განსაზღვრა (მაქსიმალური სიხშირით), შემდეგ კი ატრიბუტის მოდალური მნიშვნელობის მნიშვნელობა ფორმულის მიხედვით:

§ - მოდის ღირებულება

§ - მოდალური ინტერვალის ქვედა ზღვარი

§ - ინტერვალის მნიშვნელობა

§ - მოდალური ინტერვალის სიხშირე

§ - მოდალის წინა ინტერვალის სიხშირე

§ - მოდალის შემდგომი ინტერვალის სიხშირე

მედიანა -მახასიათებლის ეს მნიშვნელობა, ĸᴏᴛᴏᴩᴏᴇ მდგომარეობს რანჟირებული სერიის ბაზაში და ყოფს ამ სერიას ორ ნაწილად, ტოლი რაოდენობით.

მედიანას დასადგენად დისკრეტულ სერიაშისიხშირეების არსებობისას ჯერ გამოითვლება სიხშირეების ნახევრად ჯამი, შემდეგ კი დგინდება, თუ რომელი ვარიანტის მნიშვნელობა მოდის მასზე. (თუ დახარისხებული მწკრივი შეიცავს უცნაურ მახასიათებლებს, მაშინ მედიანური რიცხვი გამოითვლება ფორმულით:

M e \u003d (n (მახასიათებლების რაოდენობა აგრეგატში) + 1) / 2,

ლუწი რაოდენობის მახასიათებლის შემთხვევაში, მედიანა ტოლი იქნება სერიის შუაში მდებარე ორი მახასიათებლის საშუალოდ).

მედიანას გამოთვლისას ინტერვალის ვარიაციის სერიებისთვისჯერ განსაზღვრეთ მედიანური ინტერვალი, რომლის ფარგლებშიც მდებარეობს მედიანა, შემდეგ კი მედიანის მნიშვნელობა ფორმულის მიხედვით:

§ - სასურველი მედიანა

§ - ინტერვალის ქვედა ზღვარი, რომელიც შეიცავს მედიანას

§ - ინტერვალის მნიშვნელობა

§ - სიხშირეების ჯამი ან სერიის წევრების რაოდენობა

§ - მედიანას წინა ინტერვალების დაგროვილი სიხშირეების ჯამი

§ - მედიანური ინტერვალის სიხშირე

მაგალითი. იპოვნეთ რეჟიმი და მედიანა.

გადაწყვეტილება: ამ მაგალითში მოდალური ინტერვალი 25-30 წლის ასაკობრივ ჯგუფშია, ვინაიდან ეს ინტერვალი ყველაზე მაღალი სიხშირითაა (1054).

მოდით გამოვთვალოთ რეჟიმის მნიშვნელობა:

ეს ნიშნავს, რომ სტუდენტების მოდალური ასაკია 27 წელი.

გამოვთვალოთ მედიანა. მედიანური ინტერვალი არის 25-30 წლის ასაკობრივ ჯგუფში, ვინაიდან ამ ინტერვალის ფარგლებში არსებობს ვარიანტი, რომელიც მოსახლეობას ორ თანაბარ ნაწილად ყოფს (Σf i /2 = 3462/2 = 1731). შემდეგი, ჩვენ ვცვლით აუცილებელ ციფრულ მონაცემებს ფორმულაში და ვიღებთ მედიანას მნიშვნელობას:

ეს ნიშნავს, რომ სტუდენტების ერთი ნახევარი 27,4 წლამდე, ხოლო მეორე ნახევარი 27,4 წელზე უფროსია.

გარდა რეჟიმისა და მედიანისა, გამოიყენება ისეთი ინდიკატორები, როგორიცაა კვარტილები, რომლებიც ყოფს რანჟირებულ სერიებს 4 თანაბარ ნაწილად, დეცილებს - 10 ნაწილად და პროცენტებს - 100 ნაწილად.

20. შერჩევითი დაკვირვების ცნება და მისი ფარგლები.

შერჩევითი დაკვირვებავრცელდება უწყვეტი დაკვირვების გამოყენებისას ფიზიკურად შეუძლებელიადიდი რაოდენობით მონაცემების გამო ან ეკონომიკურად მიუღებელია. ფიზიკური შეუძლებლობა ხდება, მაგალითად, მგზავრთა ნაკადების, საბაზრო ფასების, ოჯახის ბიუჯეტის შესწავლისას. ეკონომიკური მიზანშეწონილობა ხდება საქონლის ხარისხის შეფასებისას, რომელიც დაკავშირებულია მათ განადგურებასთან, მაგალითად, გასინჯვა, აგურის ტესტირება სიძლიერისთვის და ა.შ.

დაკვირვებისთვის შერჩეული სტატისტიკური ერთეულებია ნიმუშის ჩარჩოან სინჯის აღებადა მათი მთელი მასივი - საერთო მოსახლეობა(GS). სადაც ერთეულების რაოდენობა ნიმუშშიდანიშნოს და ყველა HS-ში - . დამოკიდებულება n/nდაურეკა შედარებითი ზომაან ნიმუშის წილი.

შერჩევის შედეგების ხარისხი დამოკიდებულია ნიმუშის წარმომადგენლობა, ანუ იმაზე, თუ რამდენად წარმომადგენლობითია იგი HS-ში. ნიმუშის წარმომადგენლობითობის უზრუნველსაყოფად აუცილებელია, რომ ერთეულების შემთხვევითი შერჩევის პრინციპი, რომელიც ვარაუდობს, რომ HS ერთეულის ჩართვა ნიმუშში არ შეიძლება იყოს რაიმე სხვა ფაქტორის გავლენის მოხდენა, გარდა შემთხვევითობისა.

არსებობს შემთხვევითი შერჩევის 4 გზანიმუშის მისაღებად:

  1. ფაქტიურად შემთხვევითიშერჩევა ან ''ლოტოს მეთოდი'', როდესაც სერიული ნომრები ენიჭება სტატისტიკურ მნიშვნელობებს, შეყვანილია გარკვეულ ობიექტებზე (მაგალითად, კეგებზე), რომლებიც შემდეგ შერეულია გარკვეულ კონტეინერში (მაგალითად, ჩანთაში) და შერჩეულია შემთხვევით. პრაქტიკაში, ეს მეთოდი ხორციელდება შემთხვევითი რიცხვების გენერატორის ან შემთხვევითი რიცხვების მათემატიკური ცხრილების გამოყენებით.
  2. მექანიკურიშერჩევა, რომლის მიხედვითაც თითოეული ( N/n)- საერთო მოსახლეობის ღირებულება. მაგალითად, თუ ის შეიცავს 100,000 მნიშვნელობას და გსურთ აირჩიოთ 1,000, მაშინ ყოველი 100,000 / 1000 = მე-100 მნიშვნელობა მოხვდება ნიმუშში. უფრო მეტიც, თუ ისინი არ არიან რეიტინგში, მაშინ პირველი ასეულიდან შემთხვევით ირჩევენ პირველს, ხოლო დანარჩენების რიცხვი ასით მეტი იქნება. მაგალითად, თუ პირველი ერთეული იყო ნომერი 19, მაშინ შემდეგი უნდა იყოს ნომერი 119, შემდეგ ნომერი 219, შემდეგ ნომერი 319 და ა.შ. თუ საერთო მოსახლეობის ერთეულები რანჟირებულია, მაშინ ჯერ 50-ე შეირჩევა, მერე 150, მერე 250 და ა.შ.
  3. ჰეტეროგენული მონაცემთა მასივიდან მნიშვნელობების შერჩევა ხორციელდება სტრატიფიცირებული(სტრატიფიცირებული) მეთოდი, როდესაც ზოგადი პოპულაცია ადრე იყოფა ერთგვაროვან ჯგუფებად, რომლებზეც გამოიყენება შემთხვევითი ან მექანიკური შერჩევა.
  4. შერჩევის სპეციალური მეთოდია სერიალიშერჩევა, რომელშიც არჩეულია არა ცალკეული სიდიდეები შემთხვევით ან მექანიკურად, არამედ მათი სერიები (მიმდევრობა ზოგიერთი რიცხვიდან ზოგიერთამდე ზედიზედ), რომლის ფარგლებშიც ტარდება უწყვეტი დაკვირვება.

ნიმუშის დაკვირვების ხარისხი ასევე დამოკიდებულია შერჩევის ტიპი: გაიმეორაან არაგანმეორებადი.ზე ხელახალი შერჩევასტატისტიკური მნიშვნელობები ან მათი სერიები, რომლებიც მოხვდა ნიმუშში, გამოყენების შემდეგ უბრუნდება ზოგად პოპულაციას, აქვს შანსი მოხვდეს ახალ ნიმუშში. ამავდროულად, საერთო პოპულაციის ყველა მნიშვნელობას აქვს იგივე ალბათობა, რომ მოხვდეს ნიმუშში. არ განმეორებადი შერჩევანიშნავს, რომ ნიმუშში შეტანილი სტატისტიკური მნიშვნელობები ან მათი სერიები გამოყენების შემდეგ არ უბრუნდება ზოგად პოპულაციას და, შესაბამისად, მომდევნო ნიმუშში მოხვედრის ალბათობა იზრდება ამ უკანასკნელის დარჩენილი მნიშვნელობებისთვის.

განმეორებითი შერჩევა იძლევა უფრო ზუსტ შედეგებს და ამიტომ გამოიყენება უფრო ხშირად. მაგრამ არის სიტუაციები, როდესაც მისი გამოყენება შეუძლებელია (მგზავრთა ნაკადის შესწავლა, მომხმარებელთა მოთხოვნა და ა.შ.) და შემდეგ ტარდება ხელახალი შერჩევა.

21. დაკვირვების შერჩევის შეზღუდვის შეცდომა, შერჩევის საშუალო შეცდომა, მათი გამოთვლის რიგი.

დეტალურად განვიხილოთ სანიმუშო პოპულაციის ფორმირების ზემოაღნიშნული მეთოდები და წარმომადგენლობითი შეცდომები, რომლებიც წარმოიქმნება ამ შემთხვევაში. ფაქტობრივად - შემთხვევითინიმუში ეფუძნება საერთო პოპულაციის ერთეულების არჩევას შემთხვევითობის გარეშე, თანმიმდევრულობის ელემენტების გარეშე. ტექნიკურად, სათანადო შემთხვევითი შერჩევა ხორციელდება წილისყრით (მაგალითად, ლატარიებით) ან შემთხვევითი რიცხვების ცხრილით.

შერჩევითი დაკვირვების პრაქტიკაში ფაქტობრივად შემთხვევითი შერჩევა "სუფთა სახით" იშვიათად გამოიყენება, მაგრამ ის არის საწყისი შერჩევის სხვა ტიპებს შორის, იგი ახორციელებს შერჩევითი დაკვირვების ძირითად პრინციპებს. მოდით განვიხილოთ შერჩევის მეთოდის თეორიის რამდენიმე კითხვა და მარტივი შემთხვევითი ნიმუშის შეცდომის ფორმულა.

შერჩევის შეცდომა- ϶ᴛᴏ განსხვავება პარამეტრის მნიშვნელობას საერთო პოპულაციაში და მის მნიშვნელობას შორის, რომელიც გამოითვლება ნიმუშის დაკვირვების შედეგებით. მნიშვნელოვანია აღინიშნოს, რომ საშუალო რაოდენობრივი მახასიათებლისთვის, შერჩევის შეცდომა განისაზღვრება

ინდიკატორს ჩვეულებრივ უწოდებენ შერჩევის ზღვრულ შეცდომას. ნიმუშის საშუალო არის შემთხვევითი ცვლადი, რომელსაც შეუძლია მიიღოს სხვადასხვა მნიშვნელობები იმისდა მიხედვით, თუ რომელი ერთეულია ნიმუშში. ამიტომ, შერჩევის შეცდომები ასევე შემთხვევითი ცვლადებია და შეიძლება სხვადასხვა მნიშვნელობების მიღება. ამ მიზეზით, დადგენილია შესაძლო შეცდომების საშუალო - ნიშნავს შერჩევის შეცდომას, რომელიც დამოკიდებულია:

ნიმუშის ზომა: რაც უფრო დიდია რიცხვი, მით უფრო მცირეა საშუალო შეცდომა;

შესწავლილი ნიშან-თვისების ცვლილების ხარისხი: რაც უფრო მცირეა ნიშან-თვისების ვარიაცია და, შესაბამისად, ვარიაცია, მით უფრო მცირეა შერჩევის საშუალო შეცდომა.

ზე შემთხვევითი ხელახალი შერჩევაგამოითვლება საშუალო შეცდომა. პრაქტიკაში, ზოგადი დისპერსია ზუსტად არ არის ცნობილი, მაგრამ ალბათობის თეორიაში დადასტურებულია, რომ . ვინაიდან საკმარისად დიდი n-ის მნიშვნელობა ახლოს არის 1-თან, შეგვიძლია ვივარაუდოთ, რომ . შემდეგ უნდა გამოითვალოს შერჩევის საშუალო შეცდომა: . მაგრამ მცირე ნიმუშის შემთხვევაში (ნ<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

ზე შემთხვევითი შერჩევამოცემული ფორმულები შესწორებულია მნიშვნელობით. მაშინ შერჩევის არარსებობის საშუალო შეცდომა არის: და . იმიტომ რომ ყოველთვის ნაკლებია, მაშინ კოეფიციენტი () ყოველთვის 1-ზე ნაკლებია. ეს ნიშნავს, რომ საშუალო ცდომილება არაგანმეორებადი შერჩევისას ყოველთვის ნაკლებია, ვიდრე განმეორებითი შერჩევისას. მექანიკური სინჯის აღებაგამოიყენება, როდესაც მოსახლეობა გარკვეულწილად არის დალაგებული (მაგალითად, ამომრჩეველთა სიები ანბანური თანმიმდევრობით, ტელეფონის ნომრები, სახლის ნომრები, ბინები). ერთეულების შერჩევა ხორციელდება გარკვეული ინტერვალით, რომელიც უდრის ნიმუშის პროცენტის ორმხრივობას. ასე რომ, 2% ნიმუშით, შერჩეულია ყოველი 50 ერთეული = 1 / 0.02, 5%, თითოეული 1 / 0.05 = 20 ერთეული საერთო პოპულაციის.

საწყისი ირჩევა სხვადასხვა გზით: შემთხვევით, შუა ინტერვალიდან, საწყისის ცვლილებით. მთავარია სისტემატური შეცდომების თავიდან აცილება. მაგალითად, 5%-იანი ნიმუშით, თუ პირველ ერთეულად აირჩევა მე-13, მაშინ შემდეგი 33, 53, 73 და ა.შ.

სიზუსტის თვალსაზრისით, მექანიკური შერჩევა ახლოს არის სათანადო შემთხვევით შერჩევისას. ამ მიზეზით, სათანადო შემთხვევითი შერჩევის ფორმულები გამოიყენება მექანიკური შერჩევის საშუალო შეცდომის დასადგენად.

ზე ტიპიური შერჩევაგამოკითხული მოსახლეობა წინასწარ იყოფა ერთგვაროვან, ერთი ტიპის ჯგუფებად. მაგალითად, საწარმოების კვლევისას ეს არის სექტორები, ქვესექტორები, მოსახლეობის შესწავლისას ეს არის სფეროები, სოციალური ან ასაკობრივი ჯგუფები. შემდეგი, თითოეული ჯგუფისგან დამოუკიდებელი არჩევანი კეთდება მექანიკური ან შემთხვევითი გზით.

ტიპიური ნიმუშის აღება უფრო ზუსტ შედეგებს იძლევა, ვიდრე სხვა მეთოდები. ზოგადი პოპულაციის ტიპიზაცია უზრუნველყოფს თითოეული ტიპოლოგიური ჯგუფის წარმოდგენას ნიმუშში, რაც შესაძლებელს ხდის გამოირიცხოს ჯგუფთაშორისი დისპერსიის გავლენა საშუალო შერჩევის შეცდომაზე. მაშასადამე, ტიპიური ნიმუშის შეცდომის პოვნისას დისპერსიების დამატების წესის მიხედვით (), ძალზე მნიშვნელოვანია გავითვალისწინოთ მხოლოდ ჯგუფური ვარიაციების საშუალო მაჩვენებელი. შემდეგ შერჩევის საშუალო შეცდომა: განმეორებითი შერჩევით, არაგანმეორებადი შერჩევით , სად არის ნიმუშში შიდა ჯგუფური ვარიაციების საშუალო.

სერიული (ან წყობილი) შერჩევაგამოიყენება, როდესაც პოპულაცია იყოფა სერიებად ან ჯგუფებად შერჩევის კვლევის დაწყებამდე. ეს სერიები არის მზა პროდუქტების პაკეტები, სტუდენტური ჯგუფები, გუნდები. გამოკვლევისთვის სერიები შეირჩევა მექანიკურად ან შემთხვევით და სერიის ფარგლებში ტარდება ერთეულების სრული გამოკვლევა. ამ მიზეზით, შერჩევის საშუალო ცდომილება დამოკიდებულია მხოლოდ ჯგუფთაშორისი (შუალედური) დისპერსიაზე, რომელიც გამოითვლება ფორმულით: სადაც r არის შერჩეული სერიების რაოდენობა; არის i-ე სერიის საშუალო. სერიული შერჩევის საშუალო ცდომილება გამოითვლება: ხელახალი შერჩევით, არაგანმეორებადი შერჩევით , სადაც R არის სერიების საერთო რაოდენობა. კომბინირებულიშერჩევა არის განხილული შერჩევის მეთოდების ერთობლიობა.

შერჩევის ნებისმიერი მეთოდის საშუალო შერჩევის შეცდომა ძირითადად დამოკიდებულია ნიმუშის აბსოლუტურ ზომაზე და, უფრო მცირე ზომით, ნიმუშის პროცენტზე. დავუშვათ, რომ 225 დაკვირვება ხდება პირველ შემთხვევაში 4500 ერთეული მოსახლეობისგან, ხოლო მეორე შემთხვევაში 225000 ერთეულიდან. დისპერსიები ორივე შემთხვევაში უდრის 25-ს. მაშინ, პირველ შემთხვევაში, 5%-იანი შერჩევით, შერჩევის შეცდომა იქნება: მეორე შემთხვევაში, 0.1% შერჩევით, ტოლი იქნება:

შერჩევის პროცენტის 50-ჯერ შემცირებით, შერჩევის შეცდომა ოდნავ გაიზარდა, ვინაიდან ნიმუშის ზომა არ შეცვლილა. დავუშვათ, რომ ნიმუშის ზომა გაიზარდა 625 დაკვირვებამდე. ამ შემთხვევაში, შერჩევის შეცდომაა: შერჩევის 2,8-ჯერ ზრდა საერთო პოპულაციის იგივე ზომით ამცირებს შერჩევის შეცდომის ზომას 1,6-ჯერ მეტით.

22.საარჩევნო პოპულაციის ფორმირების მეთოდები და გზები.

სტატისტიკაში გამოიყენება ნიმუშების ნაკრების ფორმირების სხვადასხვა მეთოდი, რომელიც განისაზღვრება კვლევის მიზნებით და დამოკიდებულია კვლევის ობიექტის სპეციფიკაზე.

სანიმუშო გამოკითხვის ჩატარების მთავარი პირობაა საერთო პოპულაციის თითოეული ერთეულის შერჩევის თანაბარი შესაძლებლობების პრინციპის დარღვევით გამოწვეული სისტემატური შეცდომების თავიდან აცილება. სისტემური შეცდომების პრევენცია მიიღწევა ნიმუშის პოპულაციის ფორმირების მეცნიერულად დაფუძნებული მეთოდების გამოყენების შედეგად.

ზოგადი პოპულაციიდან ერთეულების შერჩევის შემდეგი გზები არსებობს: 1) ინდივიდუალური შერჩევა - ცალკეული ერთეულები შერჩეულია ნიმუშში; 2) ჯგუფის შერჩევა - ხარისხობრივად ერთგვაროვანი ჯგუფები ან შესასწავლი ერთეულების სერია ხვდება ნიმუშში; 3) კომბინირებული შერჩევა არის ინდივიდუალური და ჯგუფური შერჩევის ერთობლიობა. შერჩევის მეთოდები განისაზღვრება შერჩევის პოპულაციის ფორმირების წესით.

ნიმუში უნდა იყოს:

  • სათანადო შემთხვევითიმდგომარეობს იმაში, რომ ნიმუში ყალიბდება ზოგადი პოპულაციის ცალკეული ერთეულების შემთხვევითი (არაგანზრახ) შერჩევის შედეგად. ამ შემთხვევაში, ნიმუშის კომპლექტში შერჩეული ერთეულების რაოდენობა ჩვეულებრივ განისაზღვრება ნიმუშის მიღებული პროპორციის საფუძველზე. ნიმუშის წილი არის n ნიმუშის პოპულაციაში ერთეულების რაოდენობის თანაფარდობა საერთო პოპულაციის ერთეულების რაოდენობასთან N, ᴛ.ᴇ.
  • მექანიკურიმდგომარეობს იმაში, რომ ნიმუშში ერთეულების შერჩევა ხდება საერთო პოპულაციისგან, დაყოფილია თანაბარ ინტერვალებად (ჯგუფებად). ამ შემთხვევაში, საერთო პოპულაციაში ინტერვალის ზომა უდრის შერჩევის წილის საპასუხო ნაწილს. ასე რომ, 2%-იანი ნიმუშით ირჩევა ყოველი 50-ე ერთეული (1:0.02), 5%-იანი ნიმუშით, ყოველი მე-20 ერთეული (1:0.05) და ა.შ. ᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, შერჩევის მიღებული პროპორციის შესაბამისად, საერთო პოპულაცია, როგორც ეს იყო, მექანიკურად იყოფა თანაბარ ჯგუფებად. ნიმუშის თითოეული ჯგუფიდან არჩეულია მხოლოდ ერთი ერთეული.
  • ტიპიური -რომელშიც ზოგადი მოსახლეობა პირველად იყოფა ერთგვაროვან ტიპურ ჯგუფებად. გარდა ამისა, თითოეული ტიპიური ჯგუფიდან, ნიმუშის ერთეულების ინდივიდუალური შერჩევა ხდება შემთხვევითი ან მექანიკური ნიმუშით. ტიპიური ნიმუშის მნიშვნელოვანი მახასიათებელია ის, რომ ის იძლევა უფრო ზუსტ შედეგებს ნიმუშში ერთეულების შერჩევის სხვა მეთოდებთან შედარებით;
  • სერიალი- რომელშიც ზოგადი მოსახლეობა იყოფა იმავე ზომის ჯგუფებად - სერია. სერიები არჩეულია ნიმუშების კომპლექტში. სერიის ფარგლებში ტარდება სერიაში მოხვედრილი ერთეულების უწყვეტი დაკვირვება;
  • კომბინირებული- ნიმუში უნდა იყოს ორეტაპიანი. ამ შემთხვევაში, ზოგადი მოსახლეობა პირველ რიგში იყოფა ჯგუფებად. შემდეგ ხდება ჯგუფების შერჩევა და ამ უკანასკნელის ფარგლებში ცალკეული ერთეულების შერჩევა.

სტატისტიკაში განასხვავებენ ნიმუშში ერთეულების შერჩევის შემდეგ მეთოდებს:

  • ერთი ეტაპინიმუში - თითოეული შერჩეული ერთეული დაუყოვნებლივ ექვემდებარება კვლევას მოცემულ საფუძველზე (ფაქტობრივად შემთხვევითი და სერიული ნიმუშები);
  • მრავალსაფეხურიანიშერჩევა - შერჩევა ხდება ცალკეული ჯგუფების საერთო პოპულაციისგან, ხოლო ცალკეული ერთეულები შერჩეულია ჯგუფებიდან (ტიპიური ნიმუში ერთეულების შერჩევის მექანიკური მეთოდით შერჩევის პოპულაციაში).

გარდა ამისა, განასხვავებენ:

  • ხელახალი შერჩევა- დაბრუნებული ბურთის სქემის მიხედვით. ამავდროულად, ნიმუშში მოხვედრილი თითოეული ერთეული ან სერია უბრუნდება ზოგად პოპულაციას და, შესაბამისად, აქვს ნიმუშში ხელახლა ჩართვის შანსი;
  • არაგანმეორებადი შერჩევა- დაუბრუნებელი ბურთის სქემის მიხედვით. მას აქვს უფრო ზუსტი შედეგები იგივე ნიმუშის ზომისთვის.

23. კრიტიკული ნიმუშის ზომის განსაზღვრა (სტუდენტის ცხრილის გამოყენება).

შერჩევის თეორიის ერთ-ერთი სამეცნიერო პრინციპი არის საკმარისი რაოდენობის ერთეულების შერჩევის უზრუნველყოფა. თეორიულად, ამ პრინციპის დაცვის უკიდურესი მნიშვნელობა წარმოდგენილია ალბათობის თეორიის ზღვრული თეორემების მტკიცებულებებში, რაც საშუალებას იძლევა დაადგინოს რამდენი ერთეული უნდა შეირჩეს ზოგადი პოპულაციისგან, რათა ის საკმარისი იყოს და უზრუნველყოს ნიმუშის წარმომადგენლობა.

ნიმუშის სტანდარტული შეცდომის შემცირება და, შესაბამისად, შეფასების სიზუსტის ზრდა, ყოველთვის ასოცირდება ნიმუშის ზომის ზრდასთან, ამასთან დაკავშირებით, უკვე ნიმუშის დაკვირვების ორგანიზების ეტაპზე, აუცილებელია გადაწყვიტოს რა უნდა იყოს ნიმუშის ზომა, რათა უზრუნველყოს დაკვირვების შედეგების საჭირო სიზუსტე. უაღრესად მნიშვნელოვანი ნიმუშის ზომის გაანგარიშება აგებულია ფორმულების გამოყენებით, რომლებიც მიღებულია ზღვრული შერჩევის შეცდომების ფორმულებიდან (A), რომლებიც შეესაბამება ამა თუ იმ ტიპს და შერჩევის მეთოდს. ასე რომ, შემთხვევითი განმეორებითი ნიმუშის ზომისთვის (n), გვაქვს:

ამ ფორმულის არსი მდგომარეობს იმაში, რომ უაღრესად მნიშვნელოვანი რიცხვის შემთხვევითი ხელახალი შერჩევით, ნიმუშის ზომა პირდაპირპროპორციულია ნდობის კოეფიციენტის კვადრატთან. (t2)და ვარიაციის მახასიათებლის (?2) ვარიაცია და უკუპროპორციულია შერჩევის ზღვრული შეცდომის კვადრატის (?2). კერძოდ, როდესაც ზღვრული შეცდომა გაორმაგდება, ნიმუშის საჭირო ზომა უნდა შემცირდეს ოთხჯერ. სამი პარამეტრიდან ორს (t და?) ადგენს მკვლევარი. ამავე დროს მკვლევარი მიზნიდან გამომდინარე

და შერჩევის კვლევის მიზნებმა უნდა გადაწყვიტოს კითხვა: რა რაოდენობრივ კომბინაციაშია უკეთესი ამ პარამეტრების ჩართვა საუკეთესო ვარიანტის უზრუნველსაყოფად? ერთ შემთხვევაში ის შეიძლება უფრო კმაყოფილი იყოს მიღებული შედეგების სანდოობით (t), ვიდრე სიზუსტის საზომით (?), მეორეში კი პირიქით. ზღვრული შერჩევის შეცდომის მნიშვნელობასთან დაკავშირებით საკითხის გადაჭრა უფრო რთულია, რადგან მკვლევარს არ აქვს ეს მაჩვენებელი ნიმუშის დაკვირვების შემუშავების ეტაპზე, ამასთან დაკავშირებით, პრაქტიკაში ჩვეულებრივია შერჩევის ზღვრული შეცდომის დაყენება. როგორც წესი, ნიშან-თვისების მოსალოდნელი საშუალო დონის 10%-ის ფარგლებში. სავარაუდო საშუალო დონის დადგენა შესაძლებელია სხვადასხვა გზით: მსგავსი წინა კვლევების მონაცემების გამოყენებით, ან შერჩევის ჩარჩოდან მონაცემების გამოყენებით და მცირე საპილოტე ნიმუშის აღებით.

ყველაზე ძნელი დასადგენია ნიმუშის დაკვირვების შემუშავებისას არის მესამე პარამეტრი ფორმულაში (5.2) - შერჩევის პოპულაციის ვარიაცია. ამ შემთხვევაში, აუცილებელია გამოიყენოს მკვლევარისთვის ხელმისაწვდომი წინა მსგავსი და საპილოტე გამოკითხვები.

უაღრესად მნიშვნელოვანი შერჩევის ზომის განსაზღვრის საკითხი უფრო რთულდება, თუ შერჩევის კვლევა მოიცავს შერჩევის ერთეულების რამდენიმე მახასიათებლის შესწავლას. ამ შემთხვევაში, თითოეული მახასიათებლის საშუალო დონეები და მათი ცვალებადობა, როგორც წესი, განსხვავებულია და ამ მხრივ, შესაძლებელია გადაწყვიტოთ რომელი მახასიათებლის დისპერსიას მივცეთ უპირატესობა მხოლოდ მიზნის გათვალისწინებით. და კვლევის მიზნები.

ნიმუშის დაკვირვების შედგენისას გათვალისწინებულია შერჩევის დასაშვები შეცდომის წინასწარ განსაზღვრული მნიშვნელობა კონკრეტული კვლევის მიზნებისა და დაკვირვების შედეგებზე დაფუძნებული დასკვნების ალბათობის შესაბამისად.

ზოგადად, ნიმუშის საშუალო მნიშვნელობის ზღვრული შეცდომის ფორმულა საშუალებას გაძლევთ განსაზღვროთ:

‣‣‣ საერთო პოპულაციის მაჩვენებლების შესაძლო გადახრების სიდიდე შერჩეული პოპულაციის ინდიკატორებისგან;

‣‣‣ ნიმუშის საჭირო ზომა, რომელიც უზრუნველყოფს საჭირო სიზუსტეს, რომელშიც შესაძლო შეცდომის საზღვრები არ აღემატება გარკვეულ მითითებულ მნიშვნელობას;

‣‣‣ ალბათობა იმისა, რომ ნიმუშის შეცდომას ექნება მოცემული ზღვარი.

სტუდენტური განაწილებაალბათობის თეორიაში, ეს არის აბსოლუტურად უწყვეტი განაწილების ერთპარამეტრიანი ოჯახი.

24. დინამიკის სერია (ინტერვალი, მომენტი), დინამიკის სერიის დახურვა.

დინამიკის სერია- ეს არის სტატისტიკური მაჩვენებლების მნიშვნელობები, რომლებიც წარმოდგენილია გარკვეული ქრონოლოგიური თანმიმდევრობით.

თითოეული დროის სერია შეიცავს ორ კომპონენტს:

1) დროის პერიოდის ინდიკატორები(წლები, კვარტლები, თვეები, დღეები ან თარიღები);

2) შესწავლილი ობიექტის დამახასიათებელი ინდიკატორებიდროის პერიოდებისთვის ან შესაბამის თარიღებზე, რომლებიც ე.წ რიცხვის დონეები.

სერიის დონეები გამოხატულია როგორც აბსოლუტური, ისე საშუალო ან ფარდობითი მნიშვნელობებით. ინდიკატორების ბუნებაზე დამოკიდებულების გათვალისწინებით, აგებულია აბსოლუტური, ფარდობითი და საშუალო მნიშვნელობების დინამიური სერიები. ფარდობითი და საშუალო მნიშვნელობების დინამიური სერია აგებულია აბსოლუტური სიდიდეების წარმოებული სერიების საფუძველზე. არსებობს დინამიკის ინტერვალური და მომენტური სერიები.

დინამიური ინტერვალის სერიაშეიცავს ინდიკატორების მნიშვნელობებს გარკვეული პერიოდის განმავლობაში. ინტერვალის სერიებში, დონეები შეიძლება შეჯამდეს, ფენომენის მოცულობის მიღება უფრო გრძელი პერიოდის განმავლობაში, ან ე.წ. დაგროვილი ჯამები.

დინამიური მომენტების სერიაასახავს ინდიკატორების მნიშვნელობებს დროის გარკვეულ მომენტში (დროის თარიღი). მომენტების სერიებში მკვლევარი შეიძლება დაინტერესდეს მხოლოდ ფენომენთა სხვაობით, რაც ასახავს სერიის დონის ცვლილებას გარკვეულ თარიღებს შორის, ვინაიდან დონეების ჯამს აქ რეალური შინაარსი არ გააჩნია. კუმულაციური ჯამები აქ არ არის გათვლილი.

დროის სერიების სწორი აგების ყველაზე მნიშვნელოვანი პირობაა სერიის დონის შედარებასხვადასხვა პერიოდს ეხება. დონეები უნდა იყოს წარმოდგენილი ერთგვაროვანი რაოდენობით, ფენომენის სხვადასხვა ნაწილის დაფარვის ერთნაირი სისრულე უნდა იყოს.

რეალური დინამიკის დამახინჯების თავიდან აცილების მიზნით, სტატისტიკურ კვლევაში (დროის სერიების დახურვა) ტარდება წინასწარი გამოთვლები, რომლებიც წინ უსწრებს დროის სერიების სტატისტიკურ ანალიზს. ქვეშ დინამიკის რიგების დახურვაჩვეულებრივია გავიგოთ კომბინაცია ორი ან მეტი რიგის ერთ რიგში, რომელთა დონეები გამოითვლება სხვადასხვა მეთოდოლოგიის მიხედვით ან არ შეესაბამება ტერიტორიულ საზღვრებს და ა.შ. დინამიკის სერიის დახურვა ასევე შეიძლება გულისხმობდეს დინამიკის სერიის აბსოლუტური დონეების საერთო საფუძვლამდე შემცირებას, რაც გამორიცხავს დინამიკის სერიის დონეების შეუთავსებლობას.

25. დინამიკის, კოეფიციენტების, ზრდისა და ზრდის ტემპების სერიის შედარებაობის კონცეფცია.

დინამიკის სერია- ეს არის სტატისტიკური მაჩვენებლების სერია, რომელიც ახასიათებს ბუნებრივ და სოციალურ ფენომენების განვითარებას დროში. რუსეთის სტატისტიკის სახელმწიფო კომიტეტის მიერ გამოქვეყნებული სტატისტიკური კრებულები შეიცავს დიდი რაოდენობით დროის სერიებს ცხრილის სახით. დინამიკის სერია საშუალებას იძლევა გამოავლინოს შესწავლილი ფენომენების განვითარების შაბლონები.

დროის სერია შეიცავს ორი ტიპის ინდიკატორს. დროის ინდიკატორები(წლები, კვარტლები, თვეები და ა.შ.) ან დროის წერტილები (წლის დასაწყისში, ყოველი თვის დასაწყისში და ა.შ.). მწკრივის დონის ინდიკატორები. დროის სერიების დონეების ინდიკატორები გამოიხატება აბსოლუტურ მნიშვნელობებში (წარმოება ტონებში ან რუბლებში), ფარდობითი მნიშვნელობები (ურბანული მოსახლეობის წილი) და საშუალო მნიშვნელობები (ინდუსტრიის მუშაკების საშუალო ხელფასი წლების მიხედვით და ა.შ. .). ცხრილის სახით, დროის სერია შეიცავს ორ სვეტს ან ორ რიგს.

დროის სერიების სწორი აგება გულისხმობს რიგი მოთხოვნების შესრულებას:

  1. დინამიკის სერიის ყველა მაჩვენებელი უნდა იყოს მეცნიერულად დასაბუთებული, სანდო;
  2. დინამიკის სერიის ინდიკატორები დროში უნდა იყოს შესადარებელი, ᴛ.ᴇ. უნდა გამოითვალოს ერთი და იგივე პერიოდისთვის ან იმავე თარიღებზე;
  3. რიგი დინამიკის მაჩვენებლები შედარებადი უნდა იყოს მთელ ტერიტორიაზე;
  4. დინამიკის სერიის ინდიკატორები შინაარსით უნდა იყოს შესადარებელი, ᴛ.ᴇ. გამოითვლება ერთიანი მეთოდოლოგიით, ანალოგიურად;
  5. დინამიკის სერიის ინდიკატორები შედარებადი უნდა იყოს განხილული ფერმების სპექტრში. დინამიკის სერიის ყველა ინდიკატორი უნდა იყოს მოცემული იმავე საზომ ერთეულებში.

სტატისტიკური მაჩვენებლები შეიძლება ახასიათებდეს ან შესწავლილი პროცესის შედეგებს გარკვეული პერიოდის განმავლობაში, ან შესწავლილი ფენომენის მდგომარეობა დროის გარკვეულ მომენტში, ᴛ.ᴇ. ინდიკატორები არის ინტერვალური (პერიოდული) და მომენტალური. შესაბამისად, თავდაპირველად დინამიკის სერია არის ინტერვალი ან მომენტი. დინამიკის მომენტების სერია, თავის მხრივ, მოდის თანაბარი და არათანაბარი დროის ინტერვალებით.

დინამიკის საწყისი სერია გარდაიქმნება საშუალო მნიშვნელობებისა და ფარდობითი მნიშვნელობების სერიად (ჯაჭვი და ბაზა). ასეთ დროის სერიებს წარმოებული დროის სერიებს უწოდებენ.

დინამიკის სერიაში საშუალო დონის გამოთვლის მეთოდი განსხვავებულია, დინამიკის სერიის ტიპებიდან გამომდინარე. მაგალითების გამოყენებით განიხილეთ დროის სერიების ტიპები და ფორმულები საშუალო დონის გამოსათვლელად.

აბსოლუტური მოგება (Δy) აჩვენე რამდენი ერთეული შეიცვალა სერიის შემდგომი დონე წინასთან შედარებით (სვეტი 3. - ჯაჭვის აბსოლუტური ნამატები) ან საწყის დონესთან შედარებით (სვეტი 4. - ძირითადი აბსოლუტური ნამატები). გაანგარიშების ფორმულები შეიძლება დაიწეროს შემდეგნაირად:

სერიის აბსოლუტური მნიშვნელობების შემცირებით, იქნება "კლება", "კლება", შესაბამისად.

ზრდის აბსოლუტური ტემპები მიუთითებს იმაზე, რომ, მაგალითად, 1998 წ. პროდუქტის "A" წარმოება გაიზარდა 1997 წელთან შედარებით. 4 ათასი ტონით და 1994 წელთან შედარებით ᴦ. - 34 ათასი ტონით; სხვა წლებისთვის იხილეთ ცხრილი. 11,5 გრ.
მასპინძლობს ref.rf
3 და 4.

ზრდის ფაქტორიგვიჩვენებს რამდენჯერ შეიცვალა სერიის დონე წინასთან შედარებით (სვეტი 5 - ჯაჭვის ზრდის ან დაცემის ფაქტორები) ან საწყის დონესთან შედარებით (სვეტი 6 - ძირითადი ზრდის ან კლების ფაქტორები). გაანგარიშების ფორმულები შეიძლება დაიწეროს შემდეგნაირად:

ზრდის ტემპებიაჩვენეთ რამდენი პროცენტია სერიის შემდეგი დონე წინასთან შედარებით (სვეტი 7 - ჯაჭვის ზრდის ტემპები) ან საწყის დონესთან შედარებით (სვეტი 8 - ზრდის ძირითადი ტემპები). გაანგარიშების ფორმულები შეიძლება დაიწეროს შემდეგნაირად:

ასე, მაგალითად, 1997 წელს ᴦ. პროდუქციის "A" წარმოების მოცულობა 1996 წელთან შედარებით ᴦ. შეადგინა 105,5% (

Ზრდის ტემპიაჩვენეთ რამდენი პროცენტით გაიზარდა საანგარიშო პერიოდის დონე წინასთან შედარებით (სვეტი 9 - ჯაჭვის ზრდის ტემპები) ან საწყის დონესთან შედარებით (სვეტი 10 - ზრდის ძირითადი ტემპები). გაანგარიშების ფორმულები შეიძლება დაიწეროს შემდეგნაირად:

T pr \u003d T p - 100% ან T pr \u003d აბსოლუტური ზრდა / წინა პერიოდის დონე * 100%

ასე, მაგალითად, 1996 წელს ᴦ. 1995 წელთან შედარებით ᴦ. პროდუქტი "A" 3,8%-ით (103,8% - 100%) ან (8:210)x100%-ით მეტი იყო წარმოებული და 1994 წელთან შედარებით ᴦ. - 9%-ით (109% - 100%).

თუ სერიაში აბსოლუტური დონეები შემცირდება, მაშინ მაჩვენებელი იქნება 100%-ზე ნაკლები და, შესაბამისად, იქნება კლების მაჩვენებელი (ზრდის ტემპი მინუს ნიშნით).

აბსოლუტური ღირებულება 1%-იანი ზრდა(გრ.
მასპინძლობს ref.rf
11) გვიჩვენებს რამდენი ერთეულის წარმოებაა საჭირო მოცემულ პერიოდში, რათა წინა პერიოდის დონემ გაიზარდოს 1%-ით. ჩვენს მაგალითში, 1995 წელს ᴦ. საჭირო იყო 2,0 ათასი ტონა წარმოება, ხოლო 1998 წ. - 2,3 ათასი ტონა, ᴛ.ᴇ. ბევრად დიდი.

1% ზრდის აბსოლუტური მნიშვნელობის სიდიდის დასადგენად ორი გზა არსებობს:

§ წინა პერიოდის დონე გაყოფილი 100-ზე;

§ ჯაჭვის აბსოლუტური ზრდა გაყოფილი ჯაჭვის ზრდის შესაბამის ტემპებზე.

1%-იანი ზრდის აბსოლუტური მნიშვნელობა =

დინამიკაში, განსაკუთრებით ხანგრძლივი პერიოდის განმავლობაში, მნიშვნელოვანია ზრდის ტემპის ერთობლივი ანალიზი ყოველი პროცენტული ზრდის ან შემცირების შინაარსით.

გაითვალისწინეთ, რომ დროის სერიების ანალიზის განხილული მეთოდოლოგია გამოიყენება როგორც დროის სერიებისთვის, რომელთა დონეები გამოხატულია აბსოლუტური მნიშვნელობებით (ტ, ათასი რუბლი, თანამშრომელთა რაოდენობა და ა.შ.), ასევე დროის სერიებისთვის, დონეები რომლებიც გამოიხატება ფარდობითი მაჩვენებლებით (ჯართის %, ნახშირის ნაცრის % შემცველობა და ა.შ.) ან საშუალო მნიშვნელობებში (საშუალო მოსავლიანობა ც/ჰა, საშუალო ხელფასი და ა.შ.).

განხილულ ანალიტიკურ მაჩვენებლებთან ერთად, რომლებიც გამოითვლება ყოველი წლის წინა ან საწყის დონესთან შედარებით, დროის სერიების გაანალიზებისას უაღრესად მნიშვნელოვანია პერიოდის საშუალო ანალიტიკური მაჩვენებლების გამოთვლა: სერიის საშუალო დონე, საშუალო წლიური აბსოლუტური ზრდა. (კლება) და საშუალო წლიური ზრდის ტემპი და ზრდის ტემპი .

ზემოთ განხილული იქნა დინამიკის სერიის საშუალო დონის გამოთვლის მეთოდები. დინამიკის ინტერვალურ სერიაში, რომელსაც ჩვენ განვიხილავთ, სერიის საშუალო დონე გამოითვლება საშუალო არითმეტიკული მარტივი ფორმულით:

პროდუქტის საშუალო წლიური გამოშვება 1994-1998 წწ. შეადგინა 218,4 ათასი ტონა.

საშუალო წლიური აბსოლუტური ზრდა ასევე გამოითვლება საშუალო არითმეტიკული ფორმულით

სტანდარტული გადახრა - კონცეფცია და ტიპები. კატეგორიის კლასიფიკაცია და მახასიათებლები "სტანდარტული გადახრა" 2017, 2018 წ.

ბრძენმა მათემატიკოსებმა და სტატისტიკოსებმა გამოიგონეს უფრო საიმედო მაჩვენებელი, თუმცა ოდნავ განსხვავებული მიზნით - საშუალო წრფივი გადახრა. ეს მაჩვენებელი ახასიათებს მონაცემთა ნაკრების მნიშვნელობების გავრცელების ზომას მათი საშუალო მნიშვნელობის გარშემო.

მონაცემების გავრცელების საზომის საჩვენებლად, ჯერ უნდა დაადგინოთ, თუ რასთან ჩაითვლება ეს გავრცელება - ჩვეულებრივ, ეს არის საშუალო მნიშვნელობა. შემდეგი, თქვენ უნდა გამოთვალოთ რამდენად შორს არის გაანალიზებული მონაცემთა ნაკრების მნიშვნელობები საშუალოდან. ნათელია, რომ თითოეული მნიშვნელობა შეესაბამება გადახრის გარკვეულ რაოდენობას, მაგრამ ჩვენ ასევე გვაინტერესებს ზოგადი შეფასება, რომელიც მოიცავს მთელ მოსახლეობას. აქედან გამომდინარე, საშუალო გადახრა გამოითვლება ჩვეულებრივი არითმეტიკული საშუალო ფორმულის გამოყენებით. მაგრამ! მაგრამ იმისათვის, რომ გამოვთვალოთ გადახრების საშუალო რაოდენობა, ისინი ჯერ უნდა დაემატოს. და თუ დავამატებთ დადებით და უარყოფით რიცხვებს, ისინი გააუქმებენ ერთმანეთს და მათი ჯამი ნულისკენ მიისწრაფვის. ამის თავიდან ასაცილებლად, ყველა გადახრები აღებულია მოდულით, ანუ ყველა უარყოფითი რიცხვი ხდება დადებითი. ახლა საშუალო გადახრა აჩვენებს მნიშვნელობების გავრცელების განზოგადებულ ზომას. შედეგად, საშუალო წრფივი გადახრა გამოითვლება ფორმულით:

არის საშუალო წრფივი გადახრა,

x- გაანალიზებული მაჩვენებელი, თავზე ტირეთი - ინდიკატორის საშუალო მნიშვნელობა,

არის მნიშვნელობების რაოდენობა გაანალიზებულ მონაცემთა ბაზაში,

შემაჯამებელი ოპერატორი, იმედი მაქვს, არავის აშინებს.

საშუალო წრფივი გადახრა, რომელიც გამოითვლება მითითებული ფორმულით, ასახავს საშუალო აბსოლუტურ გადახრას საშუალო მნიშვნელობიდან ამ პოპულაციისთვის.

სურათზე წითელი ხაზი არის საშუალო მნიშვნელობა. თითოეული დაკვირვების გადახრები საშუალოდან მითითებულია პატარა ისრებით. ისინი აღებულია მოდულით და შეჯამებულია. შემდეგ ყველაფერი იყოფა მნიშვნელობების რაოდენობაზე.

სურათის დასასრულებლად საჭიროა კიდევ ერთი მაგალითის მოყვანა. ვთქვათ, არის კომპანია, რომელიც აწარმოებს კალმებს ნიჩბებისთვის. თითოეული ჭრილი უნდა იყოს 1,5 მეტრი სიგრძის, მაგრამ რაც მთავარია, ყველა ერთნაირი უნდა იყოს, ან მინიმუმ პლუს-მინუს 5 სმ. თუმცა დაუდევარი მუშები აჭრიან 1,2 მ, შემდეგ 1,8 მ. კომპანიის დირექტორმა გადაწყვიტა ჩაეტარებინა კალმების სიგრძის სტატისტიკური ანალიზი. ავარჩიე 10 ცალი და გავზომე მათი სიგრძე, ვიპოვე საშუალო და გამოვთვალე საშუალო წრფივი გადახრა. საშუალო სწორი აღმოჩნდა - 1,5 მ, მაგრამ საშუალო წრფივი გადახრა იყო 0,16 მ. ასე რომ, გამოდის, რომ ყოველი ჭრა უფრო გრძელი ან მოკლეა ვიდრე საჭიროა საშუალოდ 16 სმ-ით. სალაპარაკოა. მუშებთან ერთად. ფაქტობრივად, მე არ მინახავს ამ ინდიკატორის რეალური გამოყენება, ამიტომ მე თვითონ მოვიყვანე მაგალითი. თუმცა, სტატისტიკაში ასეთი მაჩვენებელია.

დისპერსია

საშუალო წრფივი გადახრის მსგავსად, დისპერსიაც ასახავს იმას, თუ რამდენად ვრცელდება მონაცემები საშუალოზე.

დისპერსიის გამოთვლის ფორმულა ასე გამოიყურება:

(ვარიაციის სერიებისთვის (შეწონილი ვარიაცია))

(დაჯგუფებული მონაცემებისთვის (მარტივი ვარიაცია))

სად: σ 2 - დისპერსია, Xi– ვაანალიზებთ კვადრატულ ინდიკატორს (ფუნქციური მნიშვნელობა), – ინდიკატორის საშუალო მნიშვნელობას, f i – მნიშვნელობების რაოდენობას გაანალიზებულ მონაცემთა ნაკრებში.

დისპერსია არის გადახრების საშუალო კვადრატი.

ჯერ გამოითვლება საშუალო, შემდეგ იღებენ განსხვავებას თითოეულ საბაზისო ხაზსა და საშუალოს შორის, კვადრატში, მრავლდება შესაბამისი მახასიათებლის მნიშვნელობის სიხშირეზე, ემატება და შემდეგ იყოფა პოპულაციაში მნიშვნელობების რაოდენობაზე.

თუმცა, მისი სუფთა სახით, როგორიცაა, მაგალითად, საშუალო არითმეტიკული ან ინდექსი, დისპერსია არ გამოიყენება. ეს უფრო დამხმარე და შუალედური მაჩვენებელია, რომელიც გამოიყენება სხვა ტიპის სტატისტიკური ანალიზისთვის.

დისპერსიის გამოთვლის გამარტივებული გზა

სტანდარტული გადახრა

მონაცემთა ანალიზისთვის დისპერსიის გამოსაყენებლად მისგან იღებენ კვადრატულ ფესვს. გამოდის ე.წ სტანდარტული გადახრა.

სხვათა შორის, სტანდარტულ გადახრას ასევე უწოდებენ სიგმას - ბერძნული ასოდან, რომელიც აღნიშნავს მას.

სტანდარტული გადახრა, ცხადია, ასევე ახასიათებს მონაცემთა დისპერსიის ზომას, მაგრამ ახლა (განსხვავებით დისპერსიისგან) შესაძლებელია მისი შედარება თავდაპირველ მონაცემებთან. როგორც წესი, სტატისტიკაში საშუალო კვადრატული ინდიკატორები უფრო ზუსტ შედეგებს იძლევა, ვიდრე ხაზოვანი. მაშასადამე, სტანდარტული გადახრა არის მონაცემთა გაფანტვის უფრო ზუსტი საზომი, ვიდრე საშუალო წრფივი გადახრა.

X i -შემთხვევითი (მიმდინარე) მნიშვნელობები;

შემთხვევითი ცვლადების საშუალო მნიშვნელობა ნიმუშში გამოითვლება ფორმულით:

Ისე, დისპერსია არის გადახრების საშუალო კვადრატი . ანუ საშუალო მნიშვნელობა ჯერ გამოითვლება, შემდეგ აღებულია განსხვავება თითოეულ ორიგინალსა და საშუალო მნიშვნელობას შორის, კვადრატში , ემატება და შემდეგ იყოფა მოცემულ პოპულაციაში მნიშვნელობების რაოდენობაზე.

განსხვავება ინდივიდუალურ მნიშვნელობასა და საშუალოს შორის ასახავს გადახრის ზომას. ის კვადრატულია იმისთვის, რომ ყველა გადახრები იქცეს ექსკლუზიურად პოზიტიურ რიცხვებად და თავიდან აიცილოს დადებითი და უარყოფითი გადახრების ორმხრივი გაუქმება მათი შეჯამებისას. შემდეგ, კვადრატული გადახრების გათვალისწინებით, ჩვენ უბრალოდ გამოვთვალეთ საშუალო არითმეტიკული.

ჯადოსნური სიტყვა "დისპერსიის" მინიშნება მხოლოდ ამ სამ სიტყვაშია: საშუალო - კვადრატი - გადახრები.

სტანდარტული გადახრა (RMS)

დისპერსიის კვადრატული ფესვის აღებით მივიღებთ ე.წ. სტანდარტული გადახრა".არის სახელები "სტანდარტული გადახრა" ან "სიგმა" (ბერძნული ასოს სახელიდან σ .). სტანდარტული გადახრის ფორმულა არის:

Ისე, განსხვავება არის სიგმა კვადრატში, ან - სტანდარტული გადახრა კვადრატში.

სტანდარტული გადახრა, ცხადია, ასევე ახასიათებს მონაცემთა დისპერსიის ზომას, მაგრამ ახლა (განსხვავებით დისპერსიისგან) ის შეიძლება შევადაროთ თავდაპირველ მონაცემებს, რადგან მათ აქვთ იგივე საზომი ერთეულები (ეს ნათელია გაანგარიშების ფორმულიდან). ვარიაციის დიაპაზონი არის განსხვავება უკიდურეს მნიშვნელობებს შორის. სტანდარტული გადახრა, როგორც გაურკვევლობის საზომი, ასევე ჩართულია მრავალ სტატისტიკურ გამოთვლებში. მისი დახმარებით დგინდება სხვადასხვა შეფასებისა და პროგნოზების სიზუსტის ხარისხი. თუ ვარიაცია ძალიან დიდია, მაშინ სტანდარტული გადახრაც დიდი იქნება, შესაბამისად, პროგნოზი იქნება არაზუსტი, რაც გამოიხატება, მაგალითად, ძალიან ფართო ნდობის ინტერვალებით.

ამიტომ უძრავი ქონების შეფასებაში სტატისტიკური მონაცემების დამუშავების მეთოდებში, ამოცანის საჭირო სიზუსტიდან გამომდინარე, გამოიყენება ორი ან სამი სიგმის წესი.

ორი სიგმის წესისა და სამი სიგმის წესის შესადარებლად, ვიყენებთ ლაპლასის ფორმულას:

F - F,

სადაც Ф(x) არის ლაპლასის ფუნქცია;



მინიმალური ღირებულება

β = მაქსიმალური მნიშვნელობა

s = სიგმა მნიშვნელობა (სტანდარტული გადახრა)

a = საშუალო მნიშვნელობა

ამ შემთხვევაში, ლაპლასის ფორმულის კონკრეტული ფორმა გამოიყენება, როდესაც შემთხვევითი X ცვლადის მნიშვნელობების α და β საზღვრები თანაბრად დაშორებულია განაწილების ცენტრიდან a = M(X) გარკვეული მნიშვნელობით d: a = a-d. , b = a+d. ან (1) ფორმულა (1) განსაზღვრავს X შემთხვევითი ცვლადის მოცემული გადახრის ალბათობას ნორმალური განაწილების კანონით მისი მათემატიკური მოლოდინიდან М(X) = a. თუ (1) ფორმულაში ზედიზედ ავიღებთ d = 2s და d = 3s, მაშინ მივიღებთ: (2), (3).

ორი სიგმას წესი

თითქმის საიმედოდ (0,954 სარწმუნოობის ალბათობით) შეიძლება ითქვას, რომ X შემთხვევითი ცვლადის ყველა მნიშვნელობა ნორმალური განაწილების კანონით გადახრილია მისი მათემატიკური მოლოდინიდან M(X) = a ოდენობით არაუმეტეს 2s (ორი სტანდარტი). გადახრები). ნდობის ალბათობა (Pd) არის მოვლენების ალბათობა, რომლებიც პირობითად მიიღება სანდო (მათი ალბათობა 1-თან ახლოსაა).

ორი სიგმის წესი გეომეტრიულად წარმოვადგინოთ. ნახ. 6 გვიჩვენებს გაუსის მრუდი განაწილების ცენტრით a. მთელი მრუდით და Ox ღერძით შემოსაზღვრული ფართობი არის 1 (100%), ხოლო მრუდი ტრაპეციის ფართობი a-2s და a+2s აბსცისებს შორის, ორი სიგმას წესის მიხედვით, არის 0.954 (95.4%). მთლიანი ფართობიდან). დაჩრდილული ადგილების ფართობი უდრის 1-0,954 = 0,046 (მთლიანი ფართობის >5%). ამ განყოფილებებს ეწოდება შემთხვევითი ცვლადის კრიტიკული დიაპაზონი. შემთხვევითი ცვლადის მნიშვნელობები, რომლებიც მოხვდება კრიტიკულ რეგიონში, ნაკლებად სავარაუდოა და პრაქტიკაში პირობითად შეუძლებელია.

პირობითად შეუძლებელი მნიშვნელობების ალბათობას შემთხვევითი ცვლადის მნიშვნელოვნების დონე ეწოდება. მნიშვნელოვნების დონე დაკავშირებულია ნდობის დონესთან ფორმულით:

სადაც q არის მნიშვნელოვნების დონე, გამოხატული პროცენტულად.

სამი სიგმის წესი

პრობლემების გადაჭრისას, რომლებიც საჭიროებენ უფრო დიდ სანდოობას, როდესაც ნდობის ალბათობა (Pd) მიიღება 0,997 (უფრო ზუსტად, 0,9973) ტოლი, ორ სიგმას წესის ნაცვლად, ფორმულის მიხედვით (3), გამოიყენება წესი. სამი სიგმა.



Მიხედვით სამი სიგმის წესი 0,9973 ნდობის დონით, კრიტიკული ზონა იქნება ატრიბუტის მნიშვნელობების ფართობი ინტერვალის გარეთ (a-3s, a+3s). მნიშვნელოვნების დონეა 0,27%.

სხვა სიტყვებით რომ ვთქვათ, ალბათობა იმისა, რომ გადახრის აბსოლუტური მნიშვნელობა სამჯერ გადააჭარბებს სტანდარტულ გადახრას, არის ძალიან მცირე, კერძოდ 0,0027=1-0,9973. ეს ნიშნავს, რომ მხოლოდ 0.27% შემთხვევაში ეს შეიძლება მოხდეს. ასეთი მოვლენები, წარმოუდგენელი მოვლენების შეუძლებლობის პრინციპიდან გამომდინარე, შეიძლება ჩაითვალოს პრაქტიკულად შეუძლებლად. იმათ. მაღალი სიზუსტის ნიმუშის აღება.

ეს არის სამი სიგმას წესის არსი:

თუ შემთხვევითი ცვლადი ჩვეულებრივ განაწილებულია, მაშინ მისი გადახრის აბსოლუტური მნიშვნელობა მათემატიკური მოლოდინიდან არ აღემატება სამჯერ სტანდარტულ გადახრას (RMS).

პრაქტიკაში სამი სიგმის წესი გამოიყენება შემდეგნაირად: თუ შესწავლილი შემთხვევითი ცვლადის განაწილება უცნობია, მაგრამ ზემოთ მოცემულ წესში მითითებული პირობა დაკმაყოფილებულია, მაშინ არსებობს საფუძველი ვივარაუდოთ, რომ შესწავლილი ცვლადი განაწილებულია ნორმალურად; წინააღმდეგ შემთხვევაში, ის ჩვეულებრივ არ არის განაწილებული.

მნიშვნელოვნების დონე აღებულია რისკის ნებადართული ხარისხისა და დავალების მიხედვით. უძრავი ქონების შეფასებისთვის, ჩვეულებრივ, ნაკლებად ზუსტი ნიმუში იღება, ორი სიგმა წესის დაცვით.



მსგავსი სტატიები
 
კატეგორიები