Čo je dvojaký test?
V štatistike je dvojstranný test metóda, pri ktorej je kritická oblasť rozdelenia dvojstranná a testuje, či je vzorka väčšia alebo menšia ako určitý rozsah hodnôt. Používa sa pri testovaní s nulovou hypotézou a pri testovaní štatistickej významnosti. Ak testovaná vzorka spadne do jednej z kritických oblastí, namiesto nulovej hypotézy sa akceptuje alternatívna hypotéza. Názov dvojstranného testu je pomenovaný na základe testovania oblasti pod obidvomi zvyškami normálneho rozdelenia, hoci sa tento test môže použiť na iné neobvyklé rozdelenia.
Kľúčové jedlá
- V štatistike je dvojstranný test metódou, pri ktorej je kritická oblasť distribúcie dvojstranná a testuje, či je vzorka väčšia alebo menšia ako určitý rozsah hodnôt. Používa sa pri testovaní a testovaní s nulovou hypotézou. pre štatistickú významnosť.Ak testovaná vzorka spadne do jednej z kritických oblastí, namiesto nulovej hypotézy sa akceptuje alternatívna hypotéza. Na určenie významnosti sa na konvenčnej úrovni používajú dvojstranné testy, čo znamená, že každá strana distribúcia je znížená na 2, 5%.
Pozor, ak je štatistický test jednostranný alebo dvojstranný, veľmi to ovplyvní interpretáciu modelu.
Test na význam pre dvojité chvosty. Investopedia
Ako funguje dvojaký test
Základným konceptom inferenčnej štatistiky je testovanie hypotéz, ktoré sa vykonáva s cieľom určiť, či je nárok pravdivý alebo nie, vzhľadom na parameter populácie. Testovanie, ktoré je naprogramované tak, aby ukazovalo, či je priemer vzorky podstatne väčší ako a významne menší ako priemer populácie, sa označuje ako test s dvoma sledovanými vzorkami.
Dvojstranný test je určený na preskúmanie obidvoch strán špecifikovaného rozsahu údajov, ako je určené príslušným rozdelením pravdepodobnosti. Rozdelenie pravdepodobnosti by malo predstavovať pravdepodobnosť určitého výsledku založeného na vopred stanovených štandardoch. Vyžaduje si to stanovenie limitu označujúceho najvyššiu (alebo hornú) a najnižšiu (alebo dolnú) akceptovanú hodnotu premennej zahrnutú v rozsahu. Akýkoľvek dátový bod, ktorý existuje nad horným limitom alebo pod dolným limitom, sa považuje za rozsah akceptovania a v oblasti označovanej ako rozsah odmietnutia.
Pokiaľ ide o počet údajových bodov, ktoré musia existovať v rozsahu akceptácie, neexistuje inherentná norma. V prípadoch, keď sa vyžaduje presnosť, ako napríklad pri výrobe farmaceutických liekov, sa môže zaviesť miera odmietnutia 0, 001% alebo menej. V prípadoch, keď je presnosť menej kritická, napríklad počet potravín v obale s výrobkom, môže byť vhodná miera odmietnutia 5%.
Príklad dvojakého testu
Ako hypotetický príklad si predstavte, že nový maklér (XYZ) tvrdí, že jeho poplatky za sprostredkovanie sú nižšie ako poplatky vášho súčasného obchodníka s cennými papiermi (ABC). Údaje dostupné od nezávislej výskumnej spoločnosti naznačujú, že priemerná a štandardná odchýlka všetkých klientov brokerov ABC je 18 USD a 6 USD.
Odoberie sa vzorka 100 klientov ABC a vypočítajú sa maklérske poplatky s novými sadzbami brokera XYZ. Ak je priemer vzorky 18, 75 USD a štandardná odchýlka vzorky je 6 USD, je možné urobiť nejaký záver o rozdiele v priemernej sprostredkovateľskej zmluve medzi brokermi ABC a XYZ?
- H 0: Nulová hypotéza: stredná = 18H 1: Alternatívna hypotéza: stredná <> 18 (To je to, čo chceme dokázať.) Oblasť odmietnutia: Z <= - Z 2, 5 a Z> = Z 2, 5 (pri predpokladanej 5% hladine významnosti, delené 2, 5 na každej strane). Z = (stredný priemer vzorky) / (std-dev / sqrt (počet vzoriek)) = (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25
Táto vypočítaná hodnota Z spadá medzi dva limity definované: - Z 2, 5 = -1, 96 a Z 2, 5 = 1, 96.
Tým sa dospelo k záveru, že neexistujú dostatočné dôkazy, na základe ktorých by bolo možné vyvodiť záver, že existuje rozdiel medzi sadzbami vášho existujúceho makléra a nového makléra. Alternatívne p-hodnota = P (Z <1, 25) + P (Z> 1, 25) = 2 x 0, 1056 = 0, 2112 = 21, 12%, čo je viac ako 0, 05 alebo 5%, vedie k rovnakému záveru.
Zvláštne úvahy: Náhodné vzorkovanie
Test s dvomi koncami sa môže tiež použiť prakticky počas určitých výrobných činností vo firme, napríklad pri výrobe a balení cukroviniek v konkrétnom zariadení. Ak výrobné zariadenie označí za svoj cieľ 50 cukroviniek v jednom vrecku s prijateľnou distribúciou 45 až 55 cukroviniek, akékoľvek vrece nájdené v množstve nižšom ako 45 alebo vyššom ako 55 sa považuje za spadajúce do rozsahu zamietnutia.
Aby sa potvrdilo, že baliace mechanizmy sú správne kalibrované na splnenie očakávaného výstupu, môže sa na potvrdenie presnosti odobrať náhodný výber. Aby sa baliace mechanizmy považovali za presné, je potrebné priemerne 50 cukroviniek na vrece s vhodným rozdelením. Okrem toho musí počet vriec, ktoré spadajú do rozsahu vyradenia, spadať do limitu distribúcie pravdepodobnosti považovaného za prijateľnú ako miera chybovosti.
Ak sa zistí neprijateľná miera odmietnutia alebo priemerná odchýlka príliš ďaleko od požadovaného priemeru, môže byť na opravu chyby potrebné vykonať úpravy zariadenia alebo pridruženého zariadenia. Pravidelné používanie dvojstranných testovacích metód môže pomôcť zaistiť dlhodobé udržanie výrobných limitov.
Test s dvoma oknami verzus test s jedným okamihom
Ak je nastavený test hypotézy, ktorý ukazuje, že priemer vzorky by bol vyšší alebo nižší ako priemer populácie, nazýva sa to jednostranný test. Jednostranný test sa nazýva testovaním oblasti pod jedným z chvostov (strán) normálneho rozdelenia. Pri použití jednostranného testu analytik testuje možnosť vzťahu v jednom smere záujmu a úplne ignoruje možnosť vzťahu v inom smere.
Ak testovaná vzorka spadne do jednostrannej kritickej oblasti, namiesto nulovej hypotézy sa akceptuje alternatívna hypotéza. Jednostranný test je známy aj ako smerová hypotéza alebo smerový test.