Čo je to homoskedastic?
Homoskedastic (tiež označovaný ako „homoscedastic“) sa týka stavu, v ktorom je rozptyl zvyškového alebo chybového termínu v regresnom modeli konštantný. To znamená, že chybový termín sa príliš nemení, pretože sa mení hodnota predikčnej premennej. Nedostatok homoskedasticity však môže naznačovať, že regresný model bude možno potrebovať zahrnúť ďalšie predikčné premenné na vysvetlenie výkonu závislej premennej.
Kľúčové jedlá
- Homoskedasticita nastáva, keď je rozptyl chybového termínu v regresnom modeli konštantný. Ak je rozptyl chybového termínu homoskedastický, model bol dobre definovaný. Ak je príliš veľa rozptylov, model nemusí byť dobre definovaný. Pridanie ďalších predikčných premenných môže pomôcť vysvetliť výkon závislej premennej.Napríklad, k heteroskedasticite dochádza, keď rozptyl chybového termínu nie je konštantný.
Ako funguje homoskedastic
Homoskedasticita je jedným z predpokladov lineárneho regresného modelovania. Ak sa rozptyl chýb okolo regresnej čiary veľmi líši, regresný model môže byť zle definovaný. Opak homoskedasticity je heteroskedasticity, rovnako ako opak homogénnych je heterogénny. Heteroskedasticita (tiež hláskovaná „heteroscedasticita“) sa týka stavu, v ktorom rozptyl chybového termínu v regresnej rovnici nie je konštantný.
Keď sa vezme do úvahy, že odchýlka je meraným rozdielom medzi predpokladaným výsledkom a skutočným výsledkom danej situácie, určenie homoskedasticity môže pomôcť určiť, ktoré faktory je potrebné upraviť kvôli presnosti.
Osobitné úvahy
Jednoduchý regresný model alebo rovnica sa skladá zo štyroch výrazov. Na ľavej strane je závislá premenná. Predstavuje jav, ktorý sa model snaží „vysvetliť“. Na pravej strane je konštanta, predikčná premenná a zvyškový alebo chybový termín. Chybový termín ukazuje mieru variability v závislej premennej, ktorá nie je vysvetlená predikčnou premennou.
Príklad homoskedastika
Predpokladajme napríklad, že ste chceli vysvetliť skóre študentských testov pomocou množstva času, ktorý každý študent strávil štúdiom. V tomto prípade by skóre testu bolo závislou premennou a čas strávený štúdiom by bol prediktorom.
Termín chyby by ukazoval množstvo rozptylu v skóre testu, ktoré nebolo vysvetlené množstvom času študovania. Ak je táto odchýlka jednotná alebo homoskedastická, potom by to naznačovalo, že model môže byť primeraným vysvetlením výkonu testu - vysvetľuje to z hľadiska času stráveného štúdiom.
Rozptyl však môže byť heteroskedastický. Graf údajov o chybovom termíne môže ukázať, že veľké množstvo času štúdie veľmi úzko korešpondovalo s vysokými skóre testu, ale nízke skóre skóre testu sa veľmi líšilo a dokonca obsahovalo niektoré veľmi vysoké skóre. Rozptyl skóre by teda nebolo možné vysvetliť jednoducho jednou predikčnou premennou - množstvom času na štúdium. V tomto prípade pravdepodobne funguje nejaký iný faktor a možno bude potrebné model vylepšiť, aby sa mohol identifikovať. Ďalšie vyšetrovanie môže odhaliť, že niektorí študenti videli odpovede na test v predstihu alebo že predtým absolvovali podobný test, a preto na tento konkrétny test nemuseli študovať.
Aby sa zlepšil regresný model, výskumník by preto pridal ďalšiu vysvetľujúcu premennú naznačujúcu, či študent videl odpovede pred testom. Regresný model by potom obsahoval dve vysvetľujúce premenné - štúdium času a to, či mal študent predchádzajúce odpovede na odpovede. Pri týchto dvoch premenných by bolo vysvetlené viac rozptylu skóre testu a rozptyl chybového termínu by potom mohol byť homoskedastický, čo naznačuje, že model bol dobre definovaný.
![Homoskedastická definícia Homoskedastická definícia](https://img.icotokenfund.com/img/entrepreneurs/189/homoskedastic.jpg)