Čo je koeficient determinácie?
Koeficient určenia je miera použitá v štatistickej analýze, ktorá hodnotí, ako dobre model vysvetľuje a predpovedá budúce výsledky. Je to ukazovateľ úrovne vysvetlenej variability v súbore údajov. Koeficient určenia, tiež známy ako „R-kvadrát“, sa používa ako návod na meranie presnosti modelu.
Jedným zo spôsobov interpretácie tohto čísla je povedať, že premenné obsiahnuté v danom modeli vysvetľujú približne x% pozorovanej variácie. Ak R2 = 0, 50, potom je možné pomocou modelu vysvetliť približne polovicu pozorovanej variácie.
R-kvadrát
Kľúčové jedlá
- Koeficient determinácie je komplexná myšlienka zameraná na štatistickú analýzu budúceho modelu údajov. Koeficient determinácie sa používa na vysvetlenie, ako veľkú variabilitu jedného faktora môže spôsobiť jeho vzťah k inému faktoru.
Pochopenie koeficientu určenia
Koeficient určenia sa používa na vysvetlenie, do akej miery môže byť variabilita jedného faktora spôsobená jeho vzťahom k inému faktoru. Pri analýze trendov sa veľmi spolieha a predstavuje hodnotu medzi 0 a 1.
Čím bližšia je hodnota 1, tým lepšie sa hodí alebo vzťah medzi týmito dvoma faktormi. Koeficient určenia je druhá mocnina korelačného koeficientu, známa tiež ako „R“, ktorá mu umožňuje zobraziť stupeň lineárnej korelácie medzi dvoma premennými.
Táto korelácia sa nazýva „dobrota fit“. Hodnota 1, 0 označuje dokonalé prispôsobenie, a je teda veľmi spoľahlivým modelom pre budúce predpovede, čo naznačuje, že model vysvetľuje všetky pozorované variácie. Hodnota 0, na druhej strane, by naznačovala, že model vôbec nedokáže správne modelovať údaje. Pre model s niekoľkými premennými, ako je napríklad model viacnásobnej regresie, je upravený R2 lepším koeficientom stanovenia. V ekonómii sa hodnota R2 nad 0, 60 považuje za užitočnú.
Výhody analýzy koeficientu stanovenia
Koeficient určenia je druhá mocnina korelácie medzi predpokladanými skóre v množine údajov v porovnaní so skutočným súborom skóre. Môže byť tiež vyjadrená ako druhá mocnina korelácie medzi skóre X a Y, pričom X je nezávislá premenná a Y je závislá premenná.
Bez ohľadu na reprezentáciu znamená R-druhá mocnina rovná 0, že závislá premenná sa nedá predpovedať pomocou nezávislej premennej. Naopak, ak sa rovná 1, znamená to, že nezávislá premenná vždy predpovedá závislosť premennej.
Koeficient určenia, ktorý spadá do tohto rozsahu, meria rozsah, v akom nezávislá premenná predpovedá závislú premennú. Napríklad R na druhú hodnotu 0, 20 znamená, že nezávislá premenná predpovedá 20% závislej premennej.
Správnosť prispôsobenia alebo stupeň lineárnej korelácie meria vzdialenosť medzi osadenou čiarou v grafe a všetkými údajovými bodmi, ktoré sú rozptýlené okolo grafu. Pevná množina údajov bude mať regresnú priamku, ktorá je veľmi blízko k bodom a má vysokú mieru prispôsobenia, čo znamená, že vzdialenosť medzi čiarou a údajmi je veľmi malá. Dobrý strih má štvorcový tvar R, ktorý je blízko 1.
R-kvadrát však nie je schopný určiť, či sú dátové body alebo predpovede skreslené. Analytikovi ani používateľovi nehovorí, či je koeficient určovacej hodnoty dobrý alebo nie. Napríklad nízka R na druhú nie je zlá a je na osobe, aby sa rozhodla na základe R-druhej mocniny.
Koeficient určenia by sa nemal interpretovať naivne. Napríklad, ak je R-druhá mocnina modelu uvedená na 75%, rozptyl jeho chýb je o 75% menší ako rozptyl závislej premennej a štandardná odchýlka jej chýb je o 50% nižšia ako štandardná odchýlka závislej premennej variabilné. Štandardná odchýlka chýb modelu je asi jedna tretina veľkosti štandardnej odchýlky chýb, ktoré by ste získali pri modeli s konštantnou úrovňou.
Nakoniec, aj keď je hodnota na druhú mocninu veľká, nemusí existovať štatistická významnosť vysvetľujúcich premenných v modeli alebo skutočná veľkosť týchto premenných môže byť veľmi malá.
![Koeficient určenia: prehľad Koeficient určenia: prehľad](https://img.icotokenfund.com/img/financial-analysis/410/coefficient-determination.jpg)