Lineárna regresná analýza

Úvod
Pri regresnej analýze skúmame vzťah medzi dvoma, prípadne medzi viacerými premennými. Predpokladáme, že 1 premenná závisí od druhej premennej, ktorá ju ovplyvňuje. Tých premenných, ktoré ovplyvňujú môže byť aj viacero, nielen jedna. Premenná, ktorá závisí od inej alebo od viacerých sa nazýva závislá, po anglicky dependend variable (DV, v regresnej rovnici sa označuje Y). Tá premenná, alebo ak ich je viac, tak tie premenné, ktoré ju ovplyvňujú sa nazývajú nezávislé premenné, independent variable (IV, v regresnej rovnici označené X) alebo aj prediktor. Ak je medzi premennými lineárny vzťah, potom nám regresná analýza umožní presne matematicky vyjadriť tento vzťah. Napr. ak zvýšime premennú X (nezávislú premennú, IV) o 1 jednotku, tak sa druhá premenná (závislá, DV) zvýši o 1,25. Matematický vzťah premenných v regresnej rovnici sa vyjadruje nasledovne:
Pre 1 nezávislú premennú:
Y = b0+ b1* X + e
Pre viac nezávislých premenných:
Y = b0+ b1* x1 + b2* x2 + … bn* xn + e
kde: Y – je závislá premenná, X je nezávislá premenná(é), b0 je bod, kde regresná priamka pretína osu Y, b1 je regresný koeficient, ktorý určuje smer priamky, e je chyba merania.

 

Zadanie:

Príklad č. 2 Študenti body a pamäť
Študenti boli požiadaní, aby posúdili v limitovanom čase do 3 minúť podnikateľský plán začínajúceho podniku, ktorý bol opísaný 25 charakteristikami ako napríklad súčasná konkurencia, ziskovosť, vzhľad produktu, cena a ostatné. Študenti videli len názov ale ich obsah nevideli, a museli vždy kliknúť na políčko napr. ziskovosť, ak chceli vedieť aká konkrétna je ziskovosť v tomto podnikateľskom pláne. Študenti zároveň vyplnili dotazník PID, ktorý meria preferenciu k intuícii a uvažovaniu – deliberácii pri rozhodovaní.
Vypočítajte či má preferencia k intuícii vplyv na počet otvorených podnikateľských charakteristík pri posudzovaní podnikateľského plánu.
Predpokladáme, že študenti, ktorí sa v rozhodovaní spoliehajú na intuíciu, dokážu prijímať rozhodnutia s menším počtom informácií než rozvažujúci študenti, ktorí viac hĺbajú nad problémom (Betsch, 2004). Teda čím viac bude študent intuitívnejší, tým menej informácií bude potrebovať pri rozhodovaní a otvorí si menej charakteristík podnikateľského plánu.
Hypotézy sme si stanovili nasledovne:
H1: Dosiahnuté skóre v škále intuícia v dotazníku PID je štatisticky významným prediktorom počtu otvorených podnikateľských charakteristík pri posudzovaní podnikateľského plánu.
H0: Dosiahnuté skóre v škále intuícia v dotazníku PID nie je štatisticky významným prediktorom počtu otvorených podnikateľských charakteristík pri posudzovaní podnikateľského plánu.

Riešenie:
Na riešenie použijeme lineárnu regresnú analýzu, ktorej postup v programe PSPP je nasledovný. Klikneme Analyzovať (Analyze) potom na Regresia (Regression) a vyberieme Lineárna regresia (Linear). Ďalej klikneme na Štatistiku (Statistics) a zaškrtneme všetky políčka. Ich obsah si vysvetlíme v časti výsledky.
Pri regresii musíme správne nastaviť jednotlivé parametre analýzy ako aj premenné a ich miesto v analýze. V dialógovom okne určíme najprv závislú (Dependent variable – DV) a nezávislú premennú (Independent variable – IV). V našom prípade nás zaujíma ako preferencia k intuícii ovplyvňuje počet otvorených podnikateľských charakteristík pri posudzovaní podnikateľského plánu. Teda preferencia k intuícii uvedená ako: PID_intu bude nezávislá premenná (Independent variable) a počet otvorených podnikateľských charakteristík uvedený ako: Počet_otv_I bude závislá premenná (Dependent variable). Počet otvorených závisí od intuície študenta. Ďalej v dialógovom okne v ľavej časti dole Štatistika(Statistics) zaškrtneme všetky políčka.

 

Obr. 1. Sprievodca regresnou analýzou

Výsledky:
Program PSPP vytvorí štyri tabuľky, ktoré si podrobne opíšeme.

Obr. 2. Výsledok lineárnej regresie

Prvá tabuľka s názvom Sumarizácia Modelu (Model Summary) opisuje regresný model. Význam jednotlivých koeficientov je nasledovný:
R je korelačný koeficient medzi počtom otvorených podnikateľských charakteristík a škálou intuície. V našom prípade je 0,09, čo je hodnota blízka nule. To znamená že medzi našimi premennými je len veľmi slabý vzťah.
R Square je koeficient determinácie. Je druhou mocninou korelačného R a vysvetľuje koľko percent variability závislej premennej Y – Počet otvorených podnikateľských charakteristík ovplyvňuje nezávislá premenná X – škála intuície. V našom prípade vidíme, že hodnota je veľmi nízka, rovná 0,01, teda 1%. Inými slovami, to ako intuitívni študenti sú, ovplyvnilo len 1 % z toho, koľko podnikateľských charakteristík si otvorili. 99% ovplyvňujú všetky ostatné faktory ako napríklad skúsenosť, sebaistota a iné.
Tabuľka ANOVA udáva ako dobre regresný model opisuje dáta. Posledné dva stĺpce uvádzajú hodnotu F = 0,6 a p = 0,44, čo je oveľa viac než akceptovaná hladina štatistickej významnosti p < 0,05.
V poslednej tabuľke sú uvedené koeficienty regresnej rovnice. V stĺpci B, Neštandardizované koeficienty (Unstandardized coefficients) je hodnota b0 = 14,97 a b1 = – 0,1. Z týchto koeficientov vieme zostaviť regresnú rovnicu, ktorá bude vyzerať nasledovne.
Y = 14,97 – 0,1* X, teda:
Počet otvorených podnikateľských charakteristík = 14,97 – 0,1* Skóre v škále intuícia (PID)
Ďalej je dôležité všimnúť si štandardizovaný koeficient (Standardized Coefficient) Beta, pre PID dotazník škála intuície, ktorý je 0,09 na hladine významnosti p = 0,44. Tá je vyššia než podmienka na prijatie hypotézy H1, ktorá je p < 0,05. V prípade, že máme len jednu nezávislú premennú, čo je aj náš prípad, potom je tento koeficient zhodný s korelačným koeficientom R v prvej tabuľke.
Intervaly spoľahlivosti pre B (95% Confidence Interval for B) sú CI [-0,37, 0,16] nám hovoria o tom kde sa bude pravdepodobne nachádzať hodnota hľadaného parametra. V rámci nášho intervalu sa nachádza 0, to znamená, že hľadaný parameter môže byť nulový.
Na základe hore uvedených výsledkov zamietame hypotézu H1 a prijímame hypotézu H0.
Poznámka:
V tomto príklade sme postupovali ako odporúčajú vedecké postupy, teda že mali sme určité teoretické predpoklady, podľa nich sme si stanovili hypotézy, navrhli výskum, zozbierali dáta na záver sme ich otestovali. Výsledky jednoznačne preukázali, že lineárny regresný vzťah medzi premennými neexistuje a intuícia meraná dotazníkom PID vôbec neovplyvňuje počet otvorených podnikateľských charakteristík. U začiatočníkov mohlo vyvolať sklamanie, že sme nepotvrdili hypotézu H1, avšak naše výsledky sú z vedeckého hľadiska rovnako hodnotné ako keby sme hypotézu potvrdili.

Reportovanie výsledkov:
Dosiahnuté skóre v škále intuícia merané dotazníkom PID nepredikuje počet otvorených podnikateľských charakteristík F(1, 73) = 0,6, p = 0,44. Vzájomný vzťah medzi premennými je takmer nulový a regresný model vysvetľuje len minimum variancie v počte otvorených ponikateľských charakteristík, koeficient determinácie R sq = 0,01 .

Spracoval Róbert Hanák, 7 September 2015