Vypočítajte rýchlosť. Výpočet smerodajnej odchýlky v programe Microsoft Excel

11.10.2019

$ X $. Na začiatok si pripomeňme nasledujúcu definíciu:

Definícia 1

Populácia- súbor náhodne vybraných objektov daného typu, nad ktorými sa vykonávajú pozorovania s cieľom získať špecifické hodnoty náhodnej premennej, uskutočňované za konštantných podmienok pri štúdiu jednej náhodnej premennej daného typu.

Definícia 2

Všeobecný rozptyl-- aritmetický priemer kvadrátov odchýlok hodnôt variantu populácie od ich strednej hodnoty.

Nech hodnoty možnosti $x_1,\ x_2,\bodky,x_k$ majú frekvencie $n_1,\ n_2,\bodky ,n_k$. Potom sa všeobecný rozptyl vypočíta pomocou vzorca:

Uvažujme o špeciálnom prípade. Nech sú všetky možnosti $x_1,\ x_2,\bodky ,x_k$ rôzne. V tomto prípade $n_1,\ n_2,\bodky ,n_k=1$. Zistili sme, že v tomto prípade sa všeobecný rozptyl vypočíta pomocou vzorca:

Tento pojem sa spája aj s pojmom všeobecná smerodajná odchýlka.

Definícia 3

Všeobecná štandardná odchýlka

\[(\sigma )_g=\sqrt(D_g)\]

Ukážkový rozptyl

Dostaňme vzorku populácie vzhľadom na náhodnú premennú $X$. Na začiatok si pripomeňme nasledujúcu definíciu:

Definícia 4

Vzorová populácia-- časť vybraných objektov z bežnej populácie.

Definícia 5

Ukážkový rozptyl-- aritmetický priemer hodnôt vzorky populácie.

Nech hodnoty možnosti $x_1,\ x_2,\bodky,x_k$ majú frekvencie $n_1,\ n_2,\bodky ,n_k$. Potom sa rozptyl vzorky vypočíta pomocou vzorca:

Uvažujme o špeciálnom prípade. Nech sú všetky možnosti $x_1,\ x_2,\bodky ,x_k$ rôzne. V tomto prípade $n_1,\ n_2,\bodky ,n_k=1$. Zistili sme, že v tomto prípade sa rozptyl vzorky vypočíta pomocou vzorca:

S týmto konceptom súvisí aj koncept výberovej smerodajnej odchýlky.

Definícia 6

Štandardná odchýlka vzorky-- druhá odmocnina zo všeobecného rozptylu:

\[(\sigma )_в=\sqrt(D_в)\]

Opravený rozptyl

Na nájdenie opraveného rozptylu $S^2$ je potrebné vynásobiť výberový rozptyl zlomkom $\frac(n)(n-1)$, tzn.

Tento pojem je tiež spojený s pojmom korigovaná smerodajná odchýlka, ktorá sa nachádza podľa vzorca:

V prípade, že hodnoty variantov nie sú diskrétne, ale predstavujú intervaly, potom sa vo vzorcoch na výpočet všeobecných alebo vzorových rozptylov hodnota $x_i$ považuje za hodnotu stredu intervalu do ktorý $x_i.$ patrí.

Príklad problému na nájdenie rozptylu a štandardnej odchýlky

Príklad 1

Vzorová populácia je definovaná nasledujúcou distribučnou tabuľkou:

Obrázok 1.

Nájdite pre ňu výberový rozptyl, výberovú smerodajnú odchýlku, opravený rozptyl a opravenú smerodajnú odchýlku.

Na vyriešenie tohto problému najprv vytvoríme výpočtovú tabuľku:

Obrázok 2

Hodnota $\overline(x_в)$ (priemer vzorky) v tabuľke sa zistí podľa vzorca:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15,25\]

Nájdite vzorový rozptyl pomocou vzorca:

Vzorová štandardná odchýlka:

\[(\sigma )_в=\sqrt(D_в)\približne 5,12\]

Opravený rozptyl:

\[(S^2=\frac(n)(n-1)D)_в=\frac(20)(19)\cdot 26.1875\približne 27.57\]

Opravená štandardná odchýlka.

V tomto článku budem hovoriť o ako nájsť smerodajnú odchýlku. Tento materiál je mimoriadne dôležitý pre úplné pochopenie matematiky, takže učiteľ matematiky by mal venovať jeho štúdiu samostatnú alebo dokonca niekoľko hodín. V tomto článku nájdete odkaz na podrobný a zrozumiteľný video návod, ktorý vysvetľuje, čo je štandardná odchýlka a ako ju nájsť.

Smerodajná odchýlka umožňuje vyhodnotiť rozptyl hodnôt získaných meraním určitého parametra. Označené symbolom (grécke písmeno "sigma").

Vzorec na výpočet je pomerne jednoduchý. Ak chcete nájsť štandardnú odchýlku, musíte vziať druhú odmocninu z rozptylu. Takže teraz sa musíte opýtať: "Čo je rozptyl?"

Čo je rozptyl

Definícia rozptylu vyzerá takto. Disperzia je aritmetický priemer druhej mocniny odchýlok hodnôt od priemeru.

Ak chcete nájsť odchýlku, vykonajte nasledujúce výpočty postupne:

  • Určte priemer (jednoduchý aritmetický priemer radu hodnôt).
  • Potom odpočítajte priemer od každej hodnoty a odmocnite výsledný rozdiel (dostanete štvorcový rozdiel).
  • Ďalším krokom je výpočet aritmetického priemeru výsledných štvorcových rozdielov (prečo presne štvorce nájdete nižšie).

Pozrime sa na príklad. Povedzme, že sa vy a vaši priatelia rozhodnete zmerať výšku svojich psov (v milimetroch). Ako výsledok meraní ste dostali nasledujúce miery výšky (v kohútiku): 600 mm, 470 mm, 170 mm, 430 mm a 300 mm.

Vypočítajme priemer, rozptyl a smerodajnú odchýlku.

Najprv zistime priemernú hodnotu. Ako už viete, na tento účel musíte sčítať všetky namerané hodnoty a rozdeliť ich počtom meraní. Priebeh výpočtu:

Priemer mm.

Priemer (aritmetický priemer) je teda 394 mm.

Teraz musíme určiť odchýlka výšky každého psa od priemeru:

nakoniec na výpočet rozptylu, odmocníme každý z výsledných rozdielov a potom nájdeme aritmetický priemer získaných výsledkov:

Rozptyl mm2.

Disperzia je teda 21704 mm2.

Ako nájsť smerodajnú odchýlku

Ako teda môžeme teraz vypočítať štandardnú odchýlku, keď poznáme rozptyl? Ako si pamätáme, vezmite z toho druhú odmocninu. To znamená, že štandardná odchýlka sa rovná:

Mm (zaokrúhlené na najbližšie celé číslo v mm).

Pomocou tejto metódy sme zistili, že niektorí psi (napríklad rotvajleri) sú veľmi veľké psy. Existujú však aj veľmi malí psi (napríklad jazvečíky, ale nemali by ste im to povedať).

Najzaujímavejšie je, že smerodajná odchýlka nesie užitočné informácie. Teraz môžeme ukázať, ktoré zo získaných výsledkov merania výšky sú v intervale, ktorý dostaneme, ak vynesieme smerodajnú odchýlku od priemeru (na jeho obe strany).

To znamená, že pomocou štandardnej odchýlky získame „štandardnú“ metódu, ktorá nám umožňuje zistiť, ktorá z hodnôt je normálna (štatistický priemer) a ktorá je mimoriadne veľká alebo naopak malá.

Čo je štandardná odchýlka

Ale... všetko bude trochu iné, ak to rozoberieme vzorkaúdajov. V našom príklade sme uvažovali všeobecná populácia. To znamená, že našich 5 psov boli jediné psy na svete, ktoré nás zaujímali.

Ak sú však údaje vzorkou (hodnoty vybrané z veľkej populácie), výpočty je potrebné vykonať inak.

Ak existujú hodnoty, potom:

Všetky ostatné výpočty sa vykonávajú podobne, vrátane určenia priemeru.

Napríklad, ak je našich päť psov len vzorkou populácie psov (všetkých psov na planéte), musíme ich rozdeliť 4, nie 5, menovite:

Ukážkový rozptyl = mm 2.

V tomto prípade sa štandardná odchýlka vzorky rovná mm (zaokrúhlené na najbližšie celé číslo).

Dá sa povedať, že sme urobili „opravu“ v prípade, že naše hodnoty sú len malou vzorkou.

Poznámka. Prečo presne štvorcové rozdiely?

Prečo však pri výpočte rozptylu berieme presne druhú mocninu rozdielov? Povedzme, že pri meraní nejakého parametra ste dostali nasledujúcu sadu hodnôt: 4; 4; -4; -4. Ak jednoducho spočítame absolútne odchýlky od priemeru (rozdiely)... záporné hodnoty sa vyrušia s kladnými:

.

Ukazuje sa, že táto možnosť je zbytočná. Potom možno stojí za to vyskúšať absolútne hodnoty odchýlok (to znamená moduly týchto hodnôt)?

Na prvý pohľad to dopadne dobre (výsledná hodnota sa mimochodom nazýva stredná absolútna odchýlka), ale nie vo všetkých prípadoch. Skúsme iný príklad. Nech výsledok merania bude v nasledujúcom súbore hodnôt: 7; 1; -6; -2. Potom je priemerná absolútna odchýlka:

Wow! Opäť sme dostali výsledok 4, aj keď rozdiely majú oveľa väčší rozptyl.

Teraz sa pozrime, čo sa stane, ak odmocníme rozdiely (a potom vezmeme druhú odmocninu ich súčtu).

Pre prvý príklad to bude:

.

Pre druhý príklad to bude:

Teraz je to úplne iná vec! Čím väčší je rozptyl rozdielov, tým väčšia je štandardná odchýlka... o čo sme sa snažili.

V skutočnosti táto metóda využíva rovnakú myšlienku ako pri výpočte vzdialenosti medzi bodmi, len sa aplikuje iným spôsobom.

A z matematického hľadiska poskytuje používanie druhých mocnín a odmocnín viac výhod, ako by sme mohli získať z hodnôt absolútnych odchýlok, vďaka čomu je štandardná odchýlka použiteľná aj na iné matematické problémy.

Sergey Valerievich vám povedal, ako nájsť štandardnú odchýlku

Smerodajná odchýlka je klasickým ukazovateľom variability z deskriptívnej štatistiky.

Smerodajná odchýlka, smerodajná odchýlka, smerodajná odchýlka, výberová smerodajná odchýlka (angl. smerodajná odchýlka, STD, STDev) - veľmi častý ukazovateľ rozptylu v popisnej štatistike. Ale pretože technická analýza je podobná štatistike, tento ukazovateľ sa môže (a mal by) použiť v technickej analýze na zistenie miery rozptylu ceny analyzovaného nástroja v čase. Označuje sa gréckym symbolom Sigma „σ“.

Ďakujeme Karlovi Gaussovi a Pearsonovi za to, že nám umožnili použiť štandardnú odchýlku.

Použitím štandardná odchýlka v technickej analýze, otočíme to "disperzný index""V „ukazovateľ volatility“, pričom sa zachováva význam, ale menia sa pojmy.

Čo je štandardná odchýlka

Ale okrem pomocných pomocných výpočtov, štandardná odchýlka je celkom prijateľná pre nezávislý výpočet a aplikácie v technickej analýze. Ako poznamenal aktívny čitateľ nášho časopisu lopúch, “ Stále nechápem, prečo štandardná odchýlka nie je zahrnutá v súbore štandardných ukazovateľov domácich obchodných centier«.

naozaj, štandardná odchýlka môže merať variabilitu nástroja klasickým a „čistým“ spôsobom. Bohužiaľ, tento ukazovateľ nie je v analýze cenných papierov taký bežný.

Použitie štandardnej odchýlky

Ručný výpočet smerodajnej odchýlky nie je veľmi zaujímavý, ale užitočné pre skúsenosti. Štandardná odchýlka môže byť vyjadrená vzorec STD=√[(∑(x-x ) 2)/n] , čo znie ako odmocnina zo súčtu druhých mocnín rozdielov medzi prvkami vzorky a priemerom, vydelená počtom prvkov vo vzorke.

Ak počet prvkov vo vzorke presiahne 30, potom menovateľ zlomku pod koreňom nadobudne hodnotu n-1. Inak sa používa n.

Krok za krokom výpočet smerodajnej odchýlky:

  1. vypočítajte aritmetický priemer vzorky údajov
  2. odčítajte tento priemer od každého prvku vzorky
  3. umocníme všetky výsledné rozdiely
  4. spočítajte všetky výsledné štvorce
  5. vydeľte výsledné množstvo počtom prvkov vo vzorke (alebo n-1, ak n>30)
  6. vypočítajte druhú odmocninu výsledného kvocientu (tzv disperzia)

Lekcia č.4

Téma: „Popisná štatistika. Indikátory diverzity vlastností v súhrne"

Hlavné kritériá pre diverzitu charakteristiky v štatistickej populácii sú: limit, amplitúda, štandardná odchýlka, koeficient oscilácie a koeficient variácie. V predchádzajúcej lekcii sa diskutovalo o tom, že priemerné hodnoty poskytujú iba zovšeobecnenú charakteristiku charakteristiky študovanej v súhrne a nezohľadňujú hodnoty jej jednotlivých variantov: minimálne a maximálne hodnoty, nadpriemerné, nižšie priemer atď.

Príklad. Priemerné hodnoty dvoch rôznych číselných radov: -100; -20; 100; 20 a 0,1; -0,2; 0,1 sú úplne rovnaké a rovnakéO.Avšak rozsahy rozptylu týchto relatívnych stredných sekvenčných údajov sú veľmi odlišné.

Určenie uvedených kritérií pre diverzitu ukazovateľa sa primárne vykonáva s prihliadnutím na jeho hodnotu v jednotlivých prvkoch štatistického súboru.

Indikátory na meranie variácie vlastnosti sú absolútne A príbuzný. Medzi absolútne ukazovatele variácie patria: rozsah variácie, limit, štandardná odchýlka, rozptyl. Koeficient variácie a koeficient oscilácie sa vzťahujú na relatívne miery variácie.

Limit (lim) – Toto je kritérium, ktoré je určené extrémnymi hodnotami variantu v sérii variácií. Inými slovami, toto kritérium je obmedzené minimálnymi a maximálnymi hodnotami atribútu:

amplitúda (am) alebo rozsah variácií - Toto je rozdiel medzi extrémnymi možnosťami. Výpočet tohto kritéria sa vykonáva odpočítaním jeho minimálnej hodnoty od maximálnej hodnoty atribútu, čo nám umožňuje odhadnúť stupeň rozptylu možnosti:

Nevýhodou limitu a amplitúdy ako kritérií variability je, že úplne závisia od extrémnych hodnôt charakteristiky v rade variácií. V tomto prípade sa nezohľadňujú kolísanie hodnôt atribútov v rámci série.

Najúplnejší popis diverzity vlastnosti v štatistickej populácii poskytuje smerodajná odchýlka(sigma), čo je všeobecná miera odchýlky opcie od jej priemernej hodnoty. Štandardná odchýlka sa často nazýva smerodajná odchýlka.

Smerodajná odchýlka je založená na porovnaní každej možnosti s aritmetickým priemerom danej populácie. Keďže v súhrne bude vždy možností aj menej aj viac ako je, súčet odchýlok so znamienkom "" bude zrušený súčtom odchýlok so znamienkom "", t.j. súčet všetkých odchýlok je nula. Aby sa predišlo vplyvu znamienok rozdielov, berú sa odchýlky od štvorca aritmetického priemeru, t.j. . Súčet štvorcových odchýlok sa nerovná nule. Ak chcete získať koeficient, ktorý dokáže merať variabilitu, zoberte priemer súčtu štvorcov – táto hodnota sa nazýva odchýlky:

Disperzia je v podstate priemerný štvorec odchýlok jednotlivých hodnôt charakteristiky od jej priemernej hodnoty. Disperzia štvorec štandardnej odchýlky.

Rozptyl je rozmerová veličina (pomenovaná). Ak sú teda varianty číselného radu vyjadrené v metroch, potom rozptyl udáva metre štvorcové; ak sú možnosti vyjadrené v kilogramoch, potom rozptyl udáva druhú mocninu tejto miery (kg 2) atď.

Smerodajná odchýlka– druhá odmocnina rozptylu:

, potom pri výpočte rozptylu a smerodajnej odchýlky v menovateli zlomku namiestotreba dať.

Výpočet štandardnej odchýlky možno rozdeliť do šiestich etáp, ktoré sa musia vykonať v určitom poradí:

Aplikácia štandardnej odchýlky:

a) na posudzovanie variability variačných radov a porovnávacie posúdenie typickosti (reprezentatívnosti) aritmetických priemerov. To je nevyhnutné v diferenciálnej diagnostike pri určovaní stability symptómov.

b) rekonštruovať variačný rad, t.j. obnovenie jeho frekvenčnej odozvy na základe tri sigma pravidlá. V intervale (М±3σ) 99,7 % všetkých variantov série sa nachádza v intervale (М±2σ) - 95,5 % a v rozsahu (М±1σ) - 68,3 % možnosť riadkov(obr. 1).

c) na identifikáciu „vyskakovacích“ možností

d) určiť parametre normy a patológie pomocou sigma odhadov

e) na výpočet variačného koeficientu

f) na výpočet priemernej chyby aritmetického priemeru.

Charakterizovať akúkoľvek populáciu, ktorá mátyp normálneho rozdelenia , stačí poznať dva parametre: aritmetický priemer a smerodajnú odchýlku.

Obrázok 1. Pravidlo Three Sigma

Príklad.

V pediatrii sa štandardná odchýlka používa na hodnotenie fyzického vývoja detí porovnaním údajov konkrétneho dieťaťa s príslušnými štandardnými ukazovateľmi. Ako štandard sa berie aritmetický priemer telesného vývoja zdravých detí. Porovnanie ukazovateľov s normami sa vykonáva pomocou špeciálnych tabuliek, v ktorých sú uvedené normy spolu s ich zodpovedajúcimi sigma stupnicami. Predpokladá sa, že ak je ukazovateľ fyzického vývoja dieťaťa v rámci normy (aritmetický priemer) ±σ, potom fyzický vývoj dieťaťa (podľa tohto ukazovateľa) zodpovedá norme. Ak je indikátor v rámci normy ±2σ, potom existuje mierna odchýlka od normy. Ak ukazovateľ prekročí tieto hranice, potom sa fyzický vývoj dieťaťa výrazne líši od normy (patológia je možná).

Okrem variačných ukazovateľov vyjadrených v absolútnych hodnotách štatistický výskum používa variačné ukazovatele vyjadrené v relatívnych hodnotách. Oscilačný koeficient - je to pomer rozsahu variácie k priemernej hodnote vlastnosti. Variačný koeficient - je to pomer smerodajnej odchýlky k priemernej hodnote charakteristiky. Tieto hodnoty sú zvyčajne vyjadrené v percentách.

Vzorce na výpočet ukazovateľov relatívnej variácie:

Z vyššie uvedených vzorcov je zrejmé, že čím väčší koeficient V je bližšie k nule, tým menšia je odchýlka v hodnotách charakteristiky. Viac V, čím je znamienko variabilnejšie.

V štatistickej praxi sa najčastejšie používa variačný koeficient. Používa sa nielen na porovnávacie hodnotenie variácií, ale aj na charakterizáciu homogenity populácie. Populácia sa považuje za homogénnu, ak variačný koeficient nepresahuje 33 % (pre rozdelenia blízke normálu). Aritmeticky pomer σ a aritmetického priemeru neutralizuje vplyv absolútnej hodnoty týchto charakteristík a percentuálny pomer robí z variačného koeficientu bezrozmernú (nepomenovanú) hodnotu.

Výsledná hodnota variačného koeficientu sa odhaduje v súlade s približnými gradáciami stupňa diverzity znaku:

Slabé – do 10 %

Priemer – 10 – 20 %

Silný - viac ako 20%

Použitie variačného koeficientu sa odporúča v prípadoch, keď je potrebné porovnať charakteristiky, ktoré sa líšia veľkosťou a rozmermi.

Rozdiel medzi variačným koeficientom a inými rozptylovými kritériami je jasne demonštrovaný príklad.

stôl 1

Zloženie pracovníkov priemyselného podniku

Na základe štatistických charakteristík uvedených v príklade môžeme vyvodiť záver o relatívnej homogenite vekového zloženia a vzdelanostnej úrovne zamestnancov podniku vzhľadom na nízku odbornú stabilitu skúmaného kontingentu. Je ľahké vidieť, že pokus posúdiť tieto sociálne trendy podľa štandardnej odchýlky by viedol k chybnému záveru a pokus porovnať účtovné charakteristiky „pracovná prax“ a „vek“ s účtovným ukazovateľom „vzdelanie“ by bol vo všeobecnosti nesprávne z dôvodu heterogenity týchto charakteristík.

Medián a percentily

Pre ordinálne (poradové) rozdelenia, kde je kritériom pre stred radu medián, štandardná odchýlka a rozptyl nemôžu slúžiť ako charakteristiky rozptylu variantu.

To isté platí pre otvorené série variácií. Táto okolnosť je spôsobená skutočnosťou, že odchýlky, z ktorých sa počíta rozptyl a σ, sú merané z aritmetického priemeru, ktorý sa nepočíta v otvorených variačných radoch a v radoch rozdelenia kvalitatívnych charakteristík. Preto sa pre komprimovaný popis distribúcií používa ďalší parameter rozptylu - kvantil(synonymum - „percentil“), vhodné na popis kvalitatívnych a kvantitatívnych charakteristík v akejkoľvek forme ich distribúcie. Tento parameter možno použiť aj na premenu kvantitatívnych charakteristík na kvalitatívne. V tomto prípade sa takéto hodnotenia prideľujú v závislosti od poradia kvantilu, ktorému konkrétna možnosť zodpovedá.

V praxi biomedicínskeho výskumu sa najčastejšie používajú tieto kvantily:

– medián;

, – kvartily (štvrtiny), kde – dolný kvartil, horný kvartil.

Kvantily rozdeľujú oblasť možných zmien v sérii variácií do určitých intervalov. Medián (kvantil) je možnosť, ktorá je v strede série variácií a rozdeľuje túto sériu na polovicu na dve rovnaké časti ( 0,5 A 0,5 ). Kvartil rozdeľuje sériu na štyri časti: prvá časť (dolný kvartil) je možnosť, ktorá oddeľuje možnosti, ktorých číselné hodnoty nepresahujú 25 % maximálneho možného množstva v danej sérii; kvartil oddeľuje možnosti s číselnou hodnotou až 50 % maximálneho možného. Horný kvartil () oddeľuje možnosti až do 75 % maximálnych možných hodnôt.

V prípade asymetrického rozdelenia premenná vzhľadom na aritmetický priemer, na jej charakterizáciu sa používa medián a kvartily. V tomto prípade sa používa nasledujúca forma zobrazenia priemernej hodnoty - Meh (;). Napríklad, skúmaný znak – „obdobie, v ktorom dieťa začalo samostatne chodiť“ – má v študijnej skupine asymetrickú distribúciu. Zároveň dolný kvartil () zodpovedá začiatku chôdze - 9,5 mesiaca, medián - 11 mesiacov, horný kvartil () - 12 mesiacov. V súlade s tým bude charakteristika priemerného trendu špecifikovaného atribútu prezentovaná ako 11 (9,5; 12) mesiacov.

Posúdenie štatistickej významnosti výsledkov štúdie

Štatistickou významnosťou údajov sa rozumie miera, do akej zodpovedajú zobrazenej skutočnosti, t.j. štatisticky významné údaje sú tie, ktoré neskresľujú a správne odrážajú objektívnu realitu.

Posúdenie štatistickej významnosti výsledkov výskumu znamená určenie, s akou pravdepodobnosťou je možné preniesť výsledky získané z výberovej populácie na celú populáciu. Posúdenie štatistickej významnosti je potrebné na pochopenie toho, do akej miery sa dá jav použiť na posúdenie javu ako celku a jeho vzorcov.

Hodnotenie štatistickej významnosti výsledkov výskumu pozostáva z:

1. chyby reprezentatívnosti (chyby priemerných a relatívnych hodnôt) - m;

2. medze spoľahlivosti priemerných alebo relatívnych hodnôt;

3. spoľahlivosť rozdielu v priemerných alebo relatívnych hodnotách podľa kritéria t.

Štandardná chyba aritmetického priemeru alebo chyba reprezentatívnosti charakterizuje kolísanie priemeru. Je potrebné poznamenať, že čím väčšia je veľkosť vzorky, tým menší je rozptyl priemerných hodnôt. Štandardná chyba priemeru sa vypočíta podľa vzorca:

V modernej vedeckej literatúre sa aritmetický priemer píše spolu s chybou reprezentatívnosti:

alebo spolu so štandardnou odchýlkou:

Ako príklad si vezmite údaje o 1 500 mestských klinikách v krajine (všeobecná populácia). Priemerný počet obsluhovaných pacientov v ambulancii je 18 150 osôb. Náhodný výber 10 % miest (150 ambulancií) dáva priemerný počet pacientov rovný 20 051 ľuďom. Výberová chyba, zrejme kvôli tomu, že do vzorky nebolo zahrnutých všetkých 1500 kliník, sa rovná rozdielu medzi týmito priemermi – všeobecnému priemeru ( M gén) a priemer vzorky ( M vybraný). Ak z našej populácie vytvoríme inú vzorku rovnakej veľkosti, dostane inú chybovú hodnotu. Všetky tieto výberové prostriedky s dostatočne veľkými vzorkami sú rozdelené normálne okolo všeobecného priemeru s dostatočne veľkým počtom opakovaní vzorky rovnakého počtu objektov z bežnej populácie. Štandardná chyba priemeru m- toto je nevyhnutné rozšírenie priemeru vzorky okolo všeobecného priemeru.

V prípade, že sú výsledky výskumu prezentované v relatívnych množstvách (napríklad v percentách) - vypočítané štandardná chyba zlomku:

kde P je ukazovateľ v %, n je počet pozorovaní.

Výsledok sa zobrazí ako (P ± m) %. Napríklad, percento zotavenia medzi pacientmi bolo (95,2±2,5)%.

V prípade, že počet prvkov obyv, potom pri výpočte smerodajných chýb priemeru a zlomku v menovateli zlomku namiestotreba dať.

Pre normálne rozdelenie (distribúcia priemerov vzorky je normálne) vieme, aká časť populácie spadá do akéhokoľvek intervalu okolo priemeru. Konkrétne:

V praxi je problém, že charakteristiky bežnej populácie sú nám neznáme a vzorka sa robí práve za účelom ich odhadu. To znamená, že ak urobíme vzorky rovnakej veľkosti n z bežnej populácie, potom v 68,3 % prípadov bude interval obsahovať hodnotu M(v 95,5 % prípadov bude na intervale a v 99,7 % prípadov – na intervale).

Keďže sa v skutočnosti odoberá iba jedna vzorka, toto tvrdenie je formulované z hľadiska pravdepodobnosti: s pravdepodobnosťou 68,3 % leží priemerná hodnota atribútu v populácii v intervale, s pravdepodobnosťou 95,5 % - v intervale atď.

V praxi sa okolo hodnoty vzorky vytvorí interval tak, že s danou (dostatočne vysokou) pravdepodobnosťou, pravdepodobnosť spoľahlivosti - by „pokryla“ skutočnú hodnotu tohto parametra v bežnej populácii. Tento interval sa nazýva interval spoľahlivosti.

Pravdepodobnosť spoľahlivostiP toto je miera spoľahlivosti, že interval spoľahlivosti bude skutočne obsahovať skutočnú (neznámu) hodnotu parametra v populácii.

Napríklad, ak pravdepodobnosť spoľahlivosti R je 90 %, to znamená, že 90 vzoriek zo 100 poskytne správny odhad parametra v populácii. Podľa toho pravdepodobnosť chyby, t.j. nesprávny odhad všeobecného priemeru za vzorku sa rovná v percentách: . Pre tento príklad to znamená, že 10 vzoriek zo 100 poskytne nesprávny odhad.

Je zrejmé, že stupeň spoľahlivosti (pravdepodobnosti spoľahlivosti) závisí od veľkosti intervalu: čím širší je interval, tým vyššia je spoľahlivosť, že do neho spadne neznáma hodnota pre populáciu. V praxi sa na vytvorenie intervalu spoľahlivosti používa aspoň dvojnásobok vzorkovacej chyby, aby sa zabezpečila aspoň 95,5 % spoľahlivosť.

Stanovenie hraníc spoľahlivosti priemerov a relatívnych hodnôt nám umožňuje nájsť ich dve extrémne hodnoty - minimálnu možnú a maximálnu možnú, v rámci ktorých sa študovaný ukazovateľ môže vyskytovať v celej populácii. Na základe toho limity spoľahlivosti (alebo interval spoľahlivosti)- sú to hranice priemerných alebo relatívnych hodnôt, za ktorými je v dôsledku náhodných výkyvov nevýznamná pravdepodobnosť.

Interval spoľahlivosti možno prepísať ako: , kde t– kritérium dôvery.

Hranice spoľahlivosti aritmetického priemeru v populácii sú určené vzorcom:

M gén = M vyberte + t m M

pre relatívnu hodnotu:

R gén = P vyberte + t m R

Kde M gén A R gén- hodnoty priemerných a relatívnych hodnôt pre všeobecnú populáciu; M vyberte A R vyberte- hodnoty priemerných a relatívnych hodnôt získaných zo vzorky populácie; m M A m P- chyby priemerných a relatívnych hodnôt; t- kritérium spoľahlivosti (kritérium presnosti, ktoré sa stanovuje pri plánovaní štúdie a môže sa rovnať 2 alebo 3); t m- je to interval spoľahlivosti alebo Δ - maximálna chyba ukazovateľa získaná vo vzorovej štúdii.

Je potrebné poznamenať, že hodnota kritéria t do určitej miery súvisí s pravdepodobnosťou bezchybnej predpovede (p), vyjadrenou v %. Vyberá si ho samotný výskumník, ktorý sa riadi potrebou získať výsledok s požadovaným stupňom presnosti. Pre pravdepodobnosť bezchybnej predpovede 95,5 % je teda hodnota kritéria t je 2, pre 99,7 % - 3.

Dané odhady intervalu spoľahlivosti sú prijateľné len pre štatistické populácie s viac ako 30 pozorovaniami.Pri menšej veľkosti populácie (malé vzorky) sa na určenie t kritéria používajú špeciálne tabuľky. V týchto tabuľkách sa požadovaná hodnota nachádza na priesečníku čiary zodpovedajúcej veľkosti populácie (n-1), a stĺpec zodpovedajúci úrovni pravdepodobnosti bezchybnej predpovede (95,5 %; 99,7 %) zvolenej výskumníkom. V lekárskom výskume je pri stanovovaní limitov spoľahlivosti pre akýkoľvek ukazovateľ pravdepodobnosť bezchybnej predpovede 95,5 % alebo viac. To znamená, že hodnota ukazovateľa získaná z výberovej populácie musí byť zistená v bežnej populácii minimálne v 95,5 % prípadov.

    Otázky na tému lekcie:

    Relevantnosť ukazovateľov diverzity znakov v štatistickej populácii.

    Všeobecné charakteristiky absolútnych variačných ukazovateľov.

    Smerodajná odchýlka, výpočet, aplikácia.

    Relatívne miery variácie.

    Medián, kvartilové skóre.

    Hodnotenie štatistickej významnosti výsledkov štúdie.

    Smerodajná chyba aritmetického priemeru, vzorec výpočtu, príklad použitia.

    Výpočet podielu a jeho štandardnej chyby.

    Koncept pravdepodobnosti spoľahlivosti, príklad použitia.

10. Pojem intervalu spoľahlivosti, jeho aplikácia.

    Testovacie úlohy na danú tému so štandardnými odpoveďami:

1. ABSOLÚTNE UKAZOVATELE VARIÁCIE TÝKAJÚCE SA

1) variačný koeficient

2) koeficient oscilácie

4) medián

2. RELATÍVNE UKAZOVATELE VARIÁCIE SÚVISIACE

1) disperzia

4) variačný koeficient

3. KRITÉRIUM, KTORÉ JE URČENÉ EXTRÉMNYMI HODNOTAMI MOŽNOSTI V SÉRII VARIÁCIÍ

2) amplitúda

3) disperzia

4) variačný koeficient

4. ROZDIEL EXTRÉMNYCH MOŽNOSTÍ JE

2) amplitúda

3) štandardná odchýlka

4) variačný koeficient

5. PRIEMERNÝ ŠTVOREC ODCHÝLOK JEDNOTLIVÝCH HODNOT CHARAKTERISTIKY OD JEJ PRIEMERNÝCH HODNOT JE

1) koeficient oscilácie

2) medián

3) disperzia

6. POMER STUPNE VARIACIÍ K PRIEMERNEJ HODNOTE ZNAKU JE

1) variačný koeficient

2) smerodajná odchýlka

4) koeficient oscilácie

7. POMER PRIEMERNEJ ŠTVOTNEJ ODCHYLKY K PRIEMERNEJ HODNOTE CHARAKTERISTIKY JE

1) disperzia

2) variačný koeficient

3) koeficient oscilácie

4) amplitúda

8. MOŽNOSŤ, KTORÁ JE UPROSTRED SÉRIE VARIÁCIÍ A ROZDEĽUJE HO NA DVE ROVNAKÉ ČASTI, JE

1) medián

3) amplitúda

9. V LEKÁRSKOM VÝSKUME SA PRI STANOVENÍ LIMITOV DÔVERY PRE AKÝKOĽVEK INDIKÁTOR PRIJÍMA PRAVDEPODOBNOSŤ BEZCHÝB

10. AK 90 VZORIEK ZO 100 POSKYTUJE SPRÁVNY ODHAD PARAMETRA V OBYVATEĽSTVE, ZNAMENÁ TO, ŽE PRAVDEPODOBNOSŤ DÔVERY P ROVNAKÉ

11. AK 10 VZORIEK ZO 100 UVÁDZA NESPRÁVNY ODHAD, PRAVDEPODOBNOSŤ CHYBY JE ROVNANÁ

12. HRANICE PRIEMERNÝCH ALEBO RELATÍVNYCH HODNOT, ZA KTORÉ MÁ Z DÔVODU NÁHODNÝCH KMITOV NEVÝZNAMNÚ PRAVDEPODOBNOSŤ – TOTO JE

1) interval spoľahlivosti

2) amplitúda

4) variačný koeficient

13. ZA MALÚ VZORKU SA POVAŽUJE OBYVATEĽSTVO, V KTORÝCH

1) n je menšie alebo rovné 100

2) n je menšie alebo rovné 30

3) n je menšie alebo rovné 40

4) n je blízko 0

14. PRE PRAVDEPODOBNOSŤ BEZCHYBNEJ PROGNÓZY 95 % HODNOTA KRITÉRIA t JE

15. PRE PRAVDEPODOBNOSŤ BEZCHYBNEJ PROGNÓZY 99 % HODNOTA KRITÉRIA t JE

16. PRE ROZDELENIA BLÍZKE NORMÁLNEMU SA OBYVATEĽSTVO POVAŽUJE ZA HOMOGÉNNE, AK KOEFICIENT VARIANTY NEPREŠAHUJE

17. MOŽNOSŤ, ODDELENIE MOŽNOSTÍ, KTORÝCH ČÍSELNÉ HODNOTY NEPRESAHUJÚ 25% MAXIMÁLNEHO MOŽNÉHO V DANEJ SÉRII – TOTO JE

2) dolný kvartil

3) horný kvartil

4) kvartil

18. ÚDAJE, KTORÉ NESKRUTAJÚ A SPRÁVNE ODRAZUJÚ OBJEKTÍVNU SKUTOČNOSŤ, SA TZV.

1) nemožné

2) rovnako možné

3) spoľahlivý

4) náhodný

19. PODĽA PRAVIDLA „TRI SIGMA“, S NORMÁLNYM ROZDELENÍM CHARAKTERISTIKY V RÁMCI
BUDE NÁJDENÝ

1) Možnosť 68,3 %.

Približnou metódou hodnotenia variability série variácií je určenie limitu a amplitúdy, ale hodnoty variantu v rámci série sa neberú do úvahy. Hlavnou všeobecne akceptovanou mierou variability kvantitatívnej charakteristiky v rámci radu variácií je smerodajná odchýlka (σ - sigma). Čím väčšia je štandardná odchýlka, tým vyšší je stupeň fluktuácie tohto radu.

Metóda výpočtu štandardnej odchýlky zahŕňa nasledujúce kroky:

1. Nájdite aritmetický priemer (M).

2. Určte odchýlky jednotlivých možností od aritmetického priemeru (d=V-M). V lekárskej štatistike sa odchýlky od priemeru označujú ako d (odchýlka). Súčet všetkých odchýlok je nula.

3. Druhá mocnina každej odchýlky d 2.

4. Vynásobte druhé mocniny odchýlok príslušnými frekvenciami d 2 *p.

5. Nájdite súčet súčinov å(d 2 *p)

6. Vypočítajte smerodajnú odchýlku pomocou vzorca:

Keď n je väčšie ako 30 alebo keď n je menšie alebo rovné 30, kde n je počet všetkých možností.

Hodnota štandardnej odchýlky:

1. Smerodajná odchýlka charakterizuje rozptyl variantu vzhľadom na priemernú hodnotu (t. j. variabilitu radu variácií). Čím väčšia je sigma, tým vyššia je miera rozmanitosti tejto série.

2. Smerodajná odchýlka sa používa na porovnávacie posúdenie stupňa zhody aritmetického priemeru so sériou variácií, pre ktorú bola vypočítaná.

Variácie hromadných javov sa riadia zákonom normálneho rozdelenia. Krivka predstavujúca toto rozdelenie vyzerá ako hladká symetrická krivka v tvare zvona (Gaussova krivka). Podľa teórie pravdepodobnosti existuje vo javoch, ktoré sa riadia zákonom normálneho rozdelenia, prísny matematický vzťah medzi hodnotami aritmetického priemeru a štandardnou odchýlkou. Teoretické rozdelenie variantu v homogénnom variačnom rade sa riadi pravidlom troch sigma.

Ak sú v systéme pravouhlých súradníc hodnoty kvantitatívnej charakteristiky (varianty) vynesené na osi x a frekvencia výskytu variantu v sérii variácií na osi y, potom varianty s väčšími a menšími hodnoty sú rovnomerne umiestnené po stranách aritmetického priemeru.



Zistilo sa, že pri normálnom rozložení vlastnosti:

68,3 % hodnôt variantu je v rozmedzí M±1s

95,5 % hodnôt variantu je v rozmedzí M±2s

99,7 % hodnôt variantu je v rozmedzí M±3s

3. Smerodajná odchýlka vám umožňuje stanoviť normálne hodnoty klinických a biologických parametrov. V medicíne sa interval M±1s zvyčajne považuje za normálny rozsah pre skúmaný jav. Odchýlka odhadnutej hodnoty od aritmetického priemeru o viac ako 1s indikuje odchýlku študovaného parametra od normy.

4. V medicíne sa pravidlo troch sigma používa v pediatrii na individuálne hodnotenie úrovne telesného vývoja detí (metóda sigma odchýlky), na vypracovanie noriem detského ošatenia.

5. Smerodajná odchýlka je potrebná na charakterizáciu stupňa diverzity skúmanej charakteristiky a na výpočet chyby aritmetického priemeru.

Hodnota smerodajnej odchýlky sa zvyčajne používa na porovnanie variability sérií rovnakého typu. Ak sa porovnávajú dve série s rôznymi charakteristikami (výška a hmotnosť, priemerné trvanie nemocničnej liečby a nemocničná úmrtnosť atď.), potom nie je možné priame porovnanie veľkostí sigma , pretože smerodajná odchýlka je pomenovaná hodnota vyjadrená v absolútnych číslach. V týchto prípadoch použite variačný koeficient (Cv), čo je relatívna hodnota: percentuálny pomer štandardnej odchýlky k aritmetickému priemeru.

Variačný koeficient sa vypočíta podľa vzorca:

Čím vyšší je variačný koeficient , tým väčšia je variabilita tohto radu. Predpokladá sa, že variačný koeficient vyšší ako 30 % indikuje kvalitatívnu heterogenitu populácie.



Podobné články