Čo je distribúcia vzoriek?
Distribúcia vzoriek je distribúcia pravdepodobnosti štatistických údajov získaných prostredníctvom veľkého počtu vzoriek odobratých zo špecifickej populácie. Distribúcia vzorkovania danej populácie je distribúcia frekvencií rôznych výsledkov, ktoré by sa mohli vyskytnúť pre štatistiku populácie.
Pochopenie distribúcie vzoriek
Mnoho údajov, ktoré akademici, štatistici, vedci, obchodníci, analytici atď. Čerpajú a používajú, sú v skutočnosti vzorky, nie populácie. Vzorka je podskupina populácie. Napríklad lekársky výskumník, ktorý chcel porovnávať priemernú hmotnosť všetkých detí narodených v Severnej Amerike od roku 1995 do roku 2005 s tými, ktoré sa narodili v Južnej Amerike v rovnakom časovom období, nemôže v primeranom čase načítať údaje za celú populáciu viac ako milión pôrodov, ku ktorým došlo za desaťročné obdobie. Namiesto toho použije iba váhu, povedzme, 100 detí na každom kontinente, aby urobil záver. Hmotnosť 200 použitých detí je vzorka a vypočítaná priemerná hmotnosť predstavuje priemer vzorky.
Teraz predpokladajme, že namiesto odoberania iba jednej vzorky 100 novonarodených hmotností z každého kontinentu lekársky výskumník odoberá opakované náhodné vzorky z bežnej populácie a vypočítava priemer vzorky pre každú skupinu vzoriek. Pokiaľ ide o Severnú Ameriku, zhromažďuje údaje o 100 novonarodených závažiach zaznamenaných v USA, Kanade a Mexiku takto: štyri 100 vzoriek z vybraných nemocníc v USA, päť 70 vzoriek z Kanady a tri 150 záznamov z Mexika, a to celkom z 1200 hmotností novorodencov zoskupených do 12 sád. Zhromažďuje tiež vzorové údaje o 100 pôrodných hmotnostiach z každej z 12 krajín Južnej Ameriky.
Každá vzorka má svoj vlastný priemer vzorky a distribúcia prostriedkov vzorky je známa ako distribúcia vzorky.
Priemerná hmotnosť vypočítaná pre každú súpravu vzoriek je distribúcia vzorkovania strednej hodnoty. Zo vzorky sa dá vypočítať nielen priemer. Ostatné štatistické údaje, ako napríklad štandardná odchýlka, rozptyl, proporcia a rozsah, sa dajú vypočítať z údajov vzorky. Štandardná odchýlka a rozptyl meria variabilitu distribúcie vzorkovania.
Počet pozorovaní v populácii, počet pozorovaní vo vzorke a postup použitý na zostavenie súborov vzoriek určujú variabilitu distribúcie vzorkovania. Štandardná odchýlka distribúcie vzorkovania sa nazýva štandardná chyba. Zatiaľ čo priemer distribúcie vzoriek sa rovná priemeru populácie, štandardná chyba závisí od štandardnej odchýlky populácie, veľkosti populácie a veľkosti vzorky.
Znalosť toho, ako sú priemery každej zo súborov vzoriek od seba a od priemeru populácie rozložené, bude ukazovať, ako blízko je priemer vzorky k priemeru populácie. S rastúcou veľkosťou vzorky sa štandardná chyba distribúcie vzoriek znižuje.
Osobitné úvahy
Populácia alebo jedna vzorová množina čísel bude mať normálne rozdelenie. Pretože však distribúcia vzorkovania zahŕňa viac sérií pozorovaní, nemusí mať nevyhnutne zvonovito zakrivený tvar.
Podľa nášho príkladu má priemerná hmotnosť detí v Severnej Amerike a Južnej Amerike normálne rozloženie, pretože niektoré deti budú mať podváhu (pod priemerom) alebo nadváhu (nad priemerom), pričom väčšina detí sa bude pohybovať medzi (okolo priemeru)). Ak je priemerná hmotnosť novorodencov v Severnej Amerike sedem libier, priemerná hmotnosť vzorky v každej z 12 sérií pozorovaní vzorky zaznamenaných pre Severnú Ameriku bude rovnako blízka siedmim kilogramom.
Ak však zakreslíte každý z priemerov vypočítaných v každej z 1200 vzoriek, výsledný tvar môže mať za následok rovnomerné rozdelenie, je však ťažké s istotou predpovedať, aký bude skutočný tvar. Čím viac vzoriek výskumník použije z populácie s hmotnosťou vyššou ako milión, tým viac grafu začne tvoriť normálne rozdelenie.
- Distribúcia vzorkovania je distribúcia pravdepodobnosti štatistiky získanej prostredníctvom veľkého počtu vzoriek odobratých zo špecifickej populácie. Distribúcia vzorkovania danej populácie je distribúcia frekvencií rozsahu rôznych výsledkov, ktoré by sa mohli vyskytnúť pri štatistike populácie. Mnoho údajov, ktoré akademici, štatistici, vedci, obchodníci a analytici zostavili a použili, sú v skutočnosti vzorky, nie populácie.
![Definícia distribúcie vzoriek Definícia distribúcie vzoriek](https://img.icotokenfund.com/img/tools-fundamental-analysis/543/sampling-distribution.jpg)