Čo je interval spoľahlivosti?
Interval spoľahlivosti v štatistikách označuje pravdepodobnosť, že parameter populácie bude po určitú časť časov klesať medzi dvoma nastavenými hodnotami. Intervaly spoľahlivosti merajú mieru neistoty alebo istoty pri metóde odberu vzoriek. Interval spoľahlivosti môže mať ľubovoľný počet pravdepodobností, pričom najbežnejšou je 95% alebo 99% úroveň spoľahlivosti.
Interval spoľahlivosti a úroveň spoľahlivosti sú vzájomne prepojené, ale nie sú úplne rovnaké.
Porozumenie intervalu spoľahlivosti
Štatistici používajú intervaly spoľahlivosti na meranie neistoty. Napríklad vedecký pracovník vyberie rôzne vzorky náhodne z rovnakej populácie a vypočíta interval spoľahlivosti pre každú vzorku. Výsledné súbory údajov sú rôzne; Niektoré intervaly zahŕňajú skutočný parameter populácie a iné nie.
Interval spoľahlivosti je rozsah hodnôt, ktoré by pravdepodobne obsahovali neznámy parameter populácie. Úroveň spoľahlivosti sa vzťahuje na percento pravdepodobnosti alebo istoty, že interval spoľahlivosti by obsahoval skutočný parameter populácie, keď opakovane vyberáte náhodnú vzorku. Alebo verbálne: „Sme si istí 99% ( úroveň spoľahlivosti), že väčšina týchto množín údajov (intervaly spoľahlivosti) obsahuje skutočný parameter populácie.“
Kľúčové jedlá
- Interval spoľahlivosti vypočíta pravdepodobnosť, že parameter populácie klesne medzi dve nastavené hodnoty. Intervaly spoľahlivosti merajú stupeň neistoty alebo istoty v metóde vzorkovania. Intervaly spoľahlivosti najčastejšie odrážajú úrovne spoľahlivosti 95% alebo 99%.
Výpočet intervalu spoľahlivosti
Predpokladajme, že skupina vedcov študuje výšky basketbalových hráčov na strednej škole. Vedci odobrali náhodnú vzorku z populácie a stanovili priemernú výšku 74 palcov. Priemer 74 palcov je bodový odhad priemernej populácie. Samotný bodový odhad má obmedzenú užitočnosť, pretože neodhaľuje neistotu spojenú s odhadom; nemáte dobrý pocit, ako ďaleko môže byť táto 74-palcová priemerná vzorka od priemernej populácie. Chýba tu miera neistoty v tejto jedinej vzorke.
Intervaly spoľahlivosti poskytujú viac informácií ako bodové odhady. Stanovením 95% intervalu spoľahlivosti pomocou strednej a štandardnej odchýlky vzorky a za predpokladu normálneho rozdelenia predstavovaného zvonovou krivkou dospejú výskumníci k hornej a dolnej hranici, ktorá obsahuje skutočný priemer 95% času. Predpokladajme, že interval je medzi 72 palcami a 76 palcami. Ak vedci odoberú 100 náhodných vzoriek z populácie basketbalistov stredných škôl ako celku, priemerná hodnota by mala klesnúť medzi 72 a 76 palcami v 95 z týchto vzoriek.
Ak vedci chcú ešte väčšiu dôveru, môžu interval predĺžiť na 99%. Ak tak urobíte, vždy sa vytvorí širší rozsah, pretože sa tým vytvorí priestor pre väčší počet vzoriek. Ak stanovia interval spoľahlivosti 99% ako 70 až 78 palcov, môžu očakávať, že 99 zo 100 vyhodnotených vzoriek bude obsahovať strednú hodnotu medzi týmito číslami. Úroveň spoľahlivosti 90% znamená, že by sme očakávali, že 90% intervalových odhadov bude obsahovať parameter populácie. Podobne 99% úroveň spoľahlivosti znamená, že 95% intervalov by obsahovalo tento parameter.
Časté mylné predstavy o intervale spoľahlivosti
Najväčšia mylná predstava, pokiaľ ide o intervaly spoľahlivosti, je, že predstavujú percento údajov z danej vzorky, ktoré spadajú medzi hornú a dolnú hranicu. Napríklad by sa mohlo mylne interpretovať vyššie uvedený 99% interval spoľahlivosti 70 až 78 palcov, čo naznačuje, že 99% údajov v náhodnej vzorke spadá medzi tieto čísla. Toto je nesprávne, aj keď na takéto stanovenie existuje osobitná metóda štatistickej analýzy. V takom prípade je potrebné identifikovať priemernú a štandardnú odchýlku vzorky a vyniesť tieto hodnoty do zvonovej krivky.