Obsah
- Čo je T-test?
- Vysvetlenie testu T
- Nejasné výsledky skúšky
- Predpoklady T-testu
- Výpočet T-testov
- Korelovaná (alebo spárovaná) T-skúška
- T-test s rovnakou variabilitou (združený)
- Test nerovnomernej odchýlky
- Určenie T-testu, ktorý sa má použiť
- Príklad T-testu s nerovnakou odchýlkou
Čo je T-test?
T-test je typ inferenčnej štatistiky, ktorá sa používa na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými znakmi. Používa sa väčšinou, keď súbory údajov, rovnako ako súbory údajov zaznamenané ako výsledok 100-násobného vyhodenia mincí, budú sledovať normálne rozdelenie a môžu mať neznáme odchýlky. T-test sa používa ako nástroj na testovanie hypotéz, ktorý umožňuje testovanie predpokladu uplatniteľného na populáciu.
T-test skúma t-štatistiku, hodnoty distribúcie t a stupne voľnosti, aby sa určila pravdepodobnosť rozdielu medzi dvoma súbormi údajov. Na vykonanie testu s tromi alebo viacerými premennými je potrebné použiť analýzu rozptylu.
T-test
Vysvetlenie testu T
T-test nám v podstate umožňuje porovnať priemerné hodnoty týchto dvoch súborov údajov a určiť, či pochádzajú z tej istej populácie. Ak by sme vo vyššie uvedených príkladoch odobrali vzorku študentov z triedy A a ďalšiu vzorku študentov z triedy B, neočakávali by sme, že budú mať presne rovnakú strednú a štandardnú odchýlku. Podobne vzorky odobraté z kontrolnej skupiny kŕmenej placebom a vzorky odobraté zo skupiny predpísanej liečivám by mali mať mierne odlišnú strednú a štandardnú odchýlku.
Matematicky t-test odoberie vzorku z každej z týchto dvoch sád a stanoví problémové vyhlásenie za predpokladu nulovej hypotézy, že tieto dva prostriedky sú rovnaké. Na základe použiteľných vzorcov sa určité hodnoty vypočítajú a porovnajú so štandardnými hodnotami a predpokladaná nulová hypotéza sa podľa toho akceptuje alebo zamietne.
Ak sa nulová hypotéza kvalifikuje ako zamietnutá, znamená to, že údaje sú silné a nie sú náhodné. T-test je iba jedným z mnohých testov použitých na tento účel. Štatistici musia navyše použiť iné testy ako t-test, aby preskúmali viac premenných a testy s väčšími veľkosťami vzoriek. Pre veľkú veľkosť vzorky používajú štatistici z-test. Medzi ďalšie možnosti testovania patrí test chí-kvadrát a f-test.
Existujú tri typy t-testov a sú klasifikované ako závislé a nezávislé t-testy.
Kľúčové jedlá
- T-test je typ inferenčnej štatistiky, ktorá sa používa na určenie, či existuje významný rozdiel medzi prostriedkami dvoch skupín, ktoré môžu súvisieť s určitými vlastnosťami. T-test je jedným z mnohých testov používaných na účely testovania hypotéz. V štatistike. Výpočet t-testu vyžaduje tri kľúčové hodnoty údajov. Zahŕňajú rozdiel medzi strednými hodnotami z každého súboru údajov (nazývaný stredný rozdiel), smerodajná odchýlka každej skupiny a počet hodnôt údajov pre každú skupinu. Existuje niekoľko rôznych typov t-testov, ktoré je možné vykonať v závislosti od o požadovaných údajoch a type analýzy.
Nejasné výsledky skúšky
Zvážte, že výrobca liekov chce testovať novo vynájdený liek. Postupuje podľa štandardného postupu vyskúšania lieku na jednej skupine pacientov a podania placeba inej skupine, ktorá sa nazýva kontrolná skupina. Placebo podávané kontrolnej skupine je látka bez zamýšľanej terapeutickej hodnoty a slúži ako meradlo na meranie toho, ako reaguje druhá skupina, ktorej je dané skutočné liečivo.
Po liekovej skúške členovia kontrolnej skupiny kŕmenej placebom hlásili zvýšenie priemernej dĺžky života o tri roky, zatiaľ čo členovia skupiny, ktorej bolo predpísané nové liečivo, uviedli zvýšenie priemernej dĺžky života o štyri roky. Okamžité pozorovanie môže naznačovať, že liek skutočne funguje, pretože výsledky sú pre skupinu užívajúcu liek lepšie. Je však tiež možné, že pozorovanie môže byť spôsobené náhodnou udalosťou, najmä prekvapením. T-test je užitočný na záver, či sú výsledky skutočne správne a použiteľné pre celú populáciu.
V škole dosiahlo 100 študentov v triede A priemerne 85% so štandardnou odchýlkou 3%. Ďalších 100 študentov patriacich do triedy B dosiahlo v priemere 87% so štandardnou odchýlkou 4%. Aj keď je priemer triedy B lepší ako výkon triedy A, nemusí byť správne dospieť k záveru, že celkový výkon študentov v triede B je lepší ako výkon študentov v triede A. Je to preto, že spolu s znamená, že štandardná odchýlka triedy B je tiež vyššia ako odchýlka triedy A. Znamená to, že ich extrémne percentá boli na spodných a vyšších stranách oveľa rozmiestnené v porovnaní s triedou A. T-test môže pomôcť určiť ktorá trieda sa darila lepšie.
Predpoklady T-testu
- Prvý predpoklad týkajúci sa t-testov sa týka rozsahu merania. Predpokladom pre t-test je, že mierka použitá na zozbierané údaje sleduje kontinuálnu alebo ordinálnu stupnicu, ako sú skóre pre IQ test. Druhý predpoklad je, že ide o jednoduchú náhodnú vzorku, že údaje sú Zhromaždené od reprezentatívnej, náhodne vybranej časti celkovej populácie. Tretím predpokladom sú údaje, keď sú vynesené do grafu, výsledkom je normálne rozdelenie, krivka tvaru zvončeka. Používa sa štvrtý predpoklad, ktorý je primerane veľký. Väčšia veľkosť vzorky znamená, že rozdelenie výsledkov by sa malo priblížiť k normálnej krivke v tvare zvonu. Konečným predpokladom je homogenita rozptylu. Homogénna alebo rovnaká odchýlka existuje, keď sú štandardné odchýlky vzoriek približne rovnaké.
Výpočet T-testov
Výpočet t-testu vyžaduje tri kľúčové hodnoty údajov. Zahŕňajú rozdiel medzi strednými hodnotami z každého súboru údajov (nazývaný stredný rozdiel), smerodajná odchýlka každej skupiny a počet hodnôt údajov z každej skupiny.
Výsledkom t-testu je hodnota t. Táto vypočítaná t-hodnota sa potom porovná s hodnotou získanou z tabuľky kritických hodnôt (nazývanej tabuľka distribúcie T). Toto porovnanie pomáha určiť, ako pravdepodobný je rozdiel medzi prostriedkami, ktoré sa vyskytli náhodou, alebo či súbory údajov skutočne majú vnútorné rozdiely. T-test kladie otázku, či rozdiel medzi skupinami predstavuje skutočný rozdiel v štúdii alebo či je pravdepodobný nezmyselný štatistický rozdiel.
T-distribučné tabuľky
Tabuľka distribúcie T je k dispozícii vo formáte s jedným chvostom a s dvoma chvostmi. Prvý sa používa na posudzovanie prípadov, ktoré majú pevnú hodnotu alebo rozsah s jasným smerom (pozitívny alebo negatívny). Aká je napríklad pravdepodobnosť, že výstupná hodnota zostane pod -3, alebo sa dostane viac ako sedem pri hádzaní kociek? Ten sa používa na analýzu rozsahu viazania, napríklad na zisťovanie, či súradnice klesajú medzi -2 a +2.
Výpočty je možné vykonávať pomocou štandardných softvérových programov, ktoré podporujú potrebné štatistické funkcie, ako sú funkcie nájdené v MS Excel.
Hodnoty T a stupne slobody
Výsledkom t-testu sú dve hodnoty: t-hodnota a stupne voľnosti. Hodnota t je pomer rozdielu medzi strednou hodnotou dvoch súprav vzoriek a rozdielom, ktorý existuje v súpravách vzoriek. Zatiaľ čo hodnota čitateľa (rozdiel medzi priemerom dvoch vzoriek) je jednoduchý na výpočet, menovateľ (rozdiel, ktorý existuje v súboroch vzoriek) sa môže stať trochu komplikovaným v závislosti od typu použitých dátových hodnôt. Menovateľ pomeru je miera rozptylu alebo variability. Vyššie hodnoty t-hodnoty, tiež nazývané t-skóre, naznačujú, že medzi týmito dvoma súbormi vzoriek existuje veľký rozdiel. Čím je menšia hodnota t, tým väčšia podobnosť existuje medzi dvoma súbormi vzoriek.
- Veľké t-skóre znamená, že skupiny sú rôzne. Malé t-skóre znamená, že skupiny sú podobné.
Stupne slobody sa vzťahujú na hodnoty v štúdii, ktorá má slobodu meniť sa a sú nevyhnutné na posúdenie dôležitosti a platnosti nulovej hypotézy. Výpočet týchto hodnôt zvyčajne závisí od počtu dátových záznamov dostupných vo vzorke.
Korelovaná (alebo spárovaná) T-skúška
Korelovaný t-test sa vykonáva, keď sa vzorky zvyčajne skladajú z párov podobných jednotiek alebo keď sa vyskytnú prípady opakovaných meraní. Napríklad môžu existovať prípady opakovaného testovania tých istých pacientov - pred a po prijatí konkrétnej liečby. V takýchto prípadoch sa každý pacient používa ako kontrolná vzorka proti sebe.
Táto metóda sa uplatňuje aj v prípadoch, keď sú vzorky nejakým spôsobom spojené alebo majú porovnateľné charakteristiky, ako je porovnávacia analýza zahŕňajúca deti, rodičov alebo súrodencov. Korelované alebo párové t-testy sú závislého typu, pretože sa jedná o prípady, keď sú dve súbory vzoriek navzájom prepojené.
Vzorec na výpočet t-hodnoty a stupňov voľnosti pre párový t-test je:
- Priemer 1 a priemer 2 sú priemerné hodnoty každej zo súborov vzoriek, zatiaľ čo var1 a var2 predstavujú rozptyl každej zo súborov vzoriek.
Zostávajúce dva typy patria do nezávislých t-testov. Vzorky týchto typov sa vyberajú navzájom nezávisle - to znamená, že súbory údajov v týchto dvoch skupinách sa netýkajú rovnakých hodnôt. Zahŕňajú prípady, ako je skupina 100 pacientov rozdelená do dvoch skupín po 50 pacientov. Jedna zo skupín sa stáva kontrolnou skupinou a dostáva sa placebo, zatiaľ čo druhá skupina dostáva predpísanú liečbu. Toto predstavuje dve nezávislé skupiny vzoriek, ktoré nie sú vzájomne spárované.
Test T s rovnakou variabilitou (alebo spoločnou)
T-test s rovnakou rozptylom sa používa, keď je počet vzoriek v každej skupine rovnaký alebo rozptyl týchto dvoch súborov údajov je podobný. Na výpočet t-hodnoty a stupňov voľnosti pre t-test s rovnakými rozptylmi sa používa tento vzorec:
T-hodnota = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 stredná1-stredná2, kde: stredná1 a stredná2 = priemerné hodnoty každej sady vzoriekv1 and var2 = Odchýlka každej zo súboru vzorieknn an2 = počet záznamov v každej skupine vzoriek
a
Stupne slobody = n1 + n2−2where: n1 an2 = počet záznamov v každej vzorkovacej sade
Test nerovnomernej odchýlky
Nerovnomerný rozptyl t-test sa používa, keď je počet vzoriek v každej skupine iný a rozptyl oboch súborov údajov je tiež rozdielny. Tento test sa tiež nazýva Welchov t-test. Na výpočet t-hodnoty a stupňov voľnosti pre t-test s nerovnakým rozptylom sa používa tento vzorec:
T-hodnota = n1var12 + n2var22 stredná1-stredná2 kde: stredná1 a stredná2 = priemerné hodnoty každého súboru vzoriekvar1 a var2 = variácia každého súboru vzoriekn1 an2 = počet záznamov v každej skupine vzoriek
a
Stupne slobody = n1-1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2, kde: var1 a var2 = variácia každej sady vzoriekn1 an2 = číslo záznamov v každej vzorkovacej sade
Stanovenie správneho T-testu, ktorý sa má použiť
Nasledujúci vývojový diagram sa môže použiť na určenie toho, ktorý t-test by sa mal použiť na základe charakteristík súborov vzoriek. Medzi kľúčové položky, ktoré je potrebné zvážiť, patrí, či sú záznamy vzoriek podobné, počet záznamov s údajmi v každej sade vzoriek a rozptyl každej sady vzoriek.
Obrázok Julie Bang © Investopedia 2019
Príklad T-testu s nerovnakou odchýlkou
Predpokladajme, že vykonávame diagonálne meranie obrazov získaných v galérii umenia. Jedna skupina vzoriek obsahuje 10 obrazov, zatiaľ čo druhá skupina obsahuje 20 obrazov. Súbory údajov s príslušnými strednými a rozptylovými hodnotami sú nasledujúce:
Sada 1 | Sada 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Priemerný | 19.4 | 21.6 |
odchýlka | 1.4 | 17.1 |
Aj keď priemer sady 2 je vyšší ako priemer sady 1, nemôžeme dospieť k záveru, že všetky maľby majú priemernú dĺžku okolo 21, 6 jednotiek, pretože rozptyl sady 2 je výrazne vyšší ako súprava 1. Je to náhodou alebo skutočne existujú rozdiely? v celkovej populácii všetkých obrazov získaných v galérii? Tento problém zisťujeme predpokladaním nulovej hypotézy, že priemer je rovnaký medzi dvoma súbormi vzoriek a vykonaním t-testu potvrdíme, či hypotéza zostáva pravdivá.
Pretože počet dátových záznamov je rozdielny (n1 = 10 a n2 = 20) a odchýlka je tiež odlišná, pre vyššie uvedenú množinu údajov sa vypočíta t-hodnota a stupne voľnosti pomocou vzorca uvedeného v teste nestejnej variácie T. oddiel.
Hodnota t je -2, 24787. Pretože znamienko mínus môže byť ignorované pri porovnávaní dvoch t-hodnôt, vypočítaná hodnota je 2, 24787.
Hodnota stupňov voľnosti je 24, 38 a je znížená na 24 v dôsledku definície vzorca, ktorá vyžaduje zaokrúhlenie hodnoty nadol na najmenšiu možnú celočíselnú hodnotu.
Vždy, keď sa predpokladá normálne rozdelenie, je možné ako kritérium prijateľnosti určiť úroveň pravdepodobnosti (hladina alfa, hladina významnosti, p ). Vo väčšine prípadov sa dá predpokladať 5% hodnota.
Pri použití hodnoty stupňa voľnosti ako 24 a 5% úrovne významnosti, pohľad na tabuľku distribúcie t-hodnôt dáva hodnotu 2, 064. Porovnanie tejto hodnoty s vypočítanou hodnotou 2, 247 naznačuje, že vypočítaná t-hodnota je vyššia ako hodnota v tabuľke pri hladine významnosti 5%. Preto je bezpečné odmietnuť nulovú hypotézu, že neexistuje žiadny rozdiel medzi prostriedkami. Súbor obyvateľov má vnútorné rozdiely a nie sú náhodné.
Porovnať investičné účty × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých Investopedia dostáva kompenzácie. Názov poskytovateľa PopisSúvisiace podmienky
Ako funguje analýza odchýlok (ANOVA) Analýza rozptylu (ANOVA) je štatistický analytický nástroj, ktorý rozdeľuje celkovú variabilitu zistenú v rámci súboru údajov na dve zložky: náhodné a systematické faktory. viac Definícia Z-testu Z-test je štatistický test, ktorý sa používa na určenie, či sa dva prostriedky populácie líšia, ak sú známe odchýlky a veľkosť vzorky je veľká. viac definícií stupňov slobody Stupne voľnosti sa vzťahuje na maximálny počet logicky nezávislých hodnôt, ktoré sú hodnotami, ktoré sa môžu voľne meniť, vo vzorke údajov. viac Porozumenie distribúcii T Distribúcia AT je typ pravdepodobnostnej funkcie, ktorá je vhodná na odhad parametrov populácie pre malé veľkosti vzorky alebo neznáme odchýlky. viac Aké opatrenia polo-odchýlky Polo-odchýlka je metóda vyhodnotenia podpriemerných výkyvov návratnosti investícií. Používa sa ako alternatíva k štandardnej odchýlke. viac Bonferroni test Bonferroni test je typ viacnásobného porovnávacieho testu používaného pri štatistickej analýze. ďalšie partnerské odkazySúvisiace články
ekonómie
Aké predpoklady sa robia pri vykonávaní t-testu?
Riadenie rizík
Využitie historickej volatility na odhad budúceho rizika
Stratégia obchodovania s akciami a vzdelávanie
Ako používať Excel na simuláciu cien akcií
Finančné ukazovatele
Ako vypočítavate IRR v Exceli?
Matematika a štatistika
Čo je relatívna štandardná chyba
Finančné ukazovatele
Aký je vzorec na výpočet čistej súčasnej hodnoty (NPV) v programe Excel?
