Acest coeficient ne relevă regula de corespondenţă dintre schimbările variabilei independente şi cele ale variabilei dependente, valoarea sa indicând numărul de unităţi cu care creşte/descreşte în medie variabila dependentă y pentru o creştere/descreştere cu o unitate a variabilei independente x.
Parametrul a este denumit termenul liber al ecuaţiei de regresie şi este folosit mai mult ca element de calcul ajutător. Spre deosebire de variabilele y şi x care, în cadrul analizei de regresie, reprezintă valori fluctuante observabile, parametrii b şi a au valori constante pentru populaţia dată şi sunt neobservabili fiind determinaţi matematic.
Pentru estimare poate fi folosită o singură variabilă independentă x sau mai multe astfel de variabile. În primul caz este vorba de regresie simplă, în cel de-al doilea de regresie multiplă.
Între valorile variabilei dependente estimate pe baza ecuaţiei de regresie y’ şi valorile observabile ale aceleiaşi variabile y există diferenţe. Aceste diferenţe se numesc valori reziduale. Cu cât valorile reziduale sunt mai mici, cu atît modelul de regresie este mai adecvat la situaţia la care se aplică.
Variaţia totală a variabilei dependente este dată de suma pătratelor diferenţelor dintre valorile respectivei variabile şi media seriei. Această variaţie poate fi descompusă în variaţie explicată – calculată ca sumă a pătratelor diferenţelor dintre valorile estimate ale variabilei dependente şi media acesteia, şi variaţia neexplicată – calculată ca sumă a pătratelor valorilor reziduale.
Variaţia explicată este folosită pentru a determina cât de adecvat este modelul regresiei pentru datele la care se aplică. Această funcţie o îndeplineşte coeficientul de determinaţie calculat ca raport între variaţia explicată şi variaţia totală. Valoarea sa este cuprinsă între 0şi 1 şi cu cât această valoare este mai mare cu atât variabila independentă aleasă explică mai mult din variaţia totală a variabilei dependente. Dacă regresia este simplă, coeficientul de regresie poartă numele de coeficient de determinaţie simplă şi se notează cu r2. Extrăgând radicalul din coeficientul de determinaţie se obţine coeficientul de corelaţie. Când coeficientul de regresie este pozitiv corelaţia este directă, iar când este negativ, corelaţia este inversă.
Variabilele pentru care coeficientul de regresie are valoarea 0 sunt independente.
Coeficienţii de elasticitate sunt folosiţi atunci când dispersiile variabilelor independente diferă mult mai mult decât mediile acestora, pentru compararea rolului unor variabile independente măsurate cu unităţi diferite. Coeficienţii de elasticitate sunt produsul dintre raportul mediei variabilei dependente şi coeficienţii de regresie. Coeficenţii de elasticitate arată cu câte procente se modifică variabila dependentă în urma modificării unei variabile independente cu un procent, în condiţiile în care celelalte variabiel nu se modifică.
Coeficienţi beta (de regresie standardizaţi) se folosesc pentru aceleaşi comparaţii ca şi coeficienţii de elasticitate, reprezintă produsul dintre coeficienţii de regresie cu raportul dintre abaterea standard a variabilei independente şi cea a variabilei dependente şi ne arată cu cât se modifică abaterea standard a variabilei dependente în urma modificării cu o abatere standard a variabilei independente, atunci când celelalte variabile independente rămân constante. Ei se folosesc atunci când mediile variabilelor independente diferă mai mult decât dispersiile.
Dintre toate metodele de regresie cea mai puţin complicată şi mai des folosită este Regresia liniară simplă exprimată prin ecuaţia:
y = a + bx.
Dificultatea constă în determinarea coeficenţilor a şi b.
Aceştia pot fi calculaţi fie cu ajutorul formulelor:
fie prin rezolvarea sistemului de ecuaţii:
Regresia multiplă poate fi exprimată prin ecuaţia:
y = a + b1x1 + ... + bnxn
Dar modul de rezolvare este în principiu acelaşi.
Bibliografie:
Proiect
Se cere stabilirea unei corelaţii între numărul de ani petrecuţi în grdiniţă de un copil şi nivelul performanţelor şcolare din primele clase de şcoală. Nu se ia în consederare decât primii 4 ani de şcoală deoarece se ştie că evoluţia şcolară ulterioară e legată de foarte mulţi factori, atât genetici cât şi sociali.
Se centralizează media performanţelor şcolare obţinute de o populaţie de 50 de copii împărţită în 5 grupuri:
- grupul 1 = 4 ani de grădiniţă;
- grupul 2 = 3 ani de grădiniţă;
- grupul 3 = 2 ani de grădiniţă;
- grupul 4 = 1 an de grădiniţă;
- grupul 5 = nici un an de grădiniţă.
- TOTAL = 10
Se foloseşte sistemul de evaluare a performanţelor şcolare prin acordarea de note de la 1 la 10.
S-au obţinut următoarele medii:
- grupul 1 = 9,25;
- grupul 2 = 8,50;
- grupul 3 = 7,85;
- grupul 4 = 7,25;
- grupul 5 = 6,50.
- TOTAL = 39,35
Ca metodă de analiză şi previziune se foloseşte regresia liniară simplă:
y = a + bx
-
variabila x reprezintă numărul de ani petrecuţi la grădiniţă şi este variabila independentă a regrsiei;
-
variabila y reprezintă media notelor obţinute şi este variabila dependentă a regresiei;
Întocmim următorul tabel de calcul preliminar:
Vom calcula valorile coeficentului de regresie „b” şi termenului liber „a”:
=[39,3510-(393,5:5)]/[1548,4225-(1548,4225:5)]
b = 0,254
=3,58
a = 3,58
Rezultă următoarea ecuaţie de regresie:
Performanţele în şcoala primară = 3,58 + 0,254 anii de grădiniţă.
Deci pentru o creştere cu 1an a numărului de ani petrecuţi în grădiniţă se va obţine o creştere a mediei notelor în primii ani de şcoală cu (0,254), adică o creştere medie a performanţelor şcolare de 2,54% pentru fiecare an în plus de grădiniţă, dar nu mai mulţi de 5 ani.
Nu vom mai efectua calculele privind fidelitatea ajustării deoarece analiza regresivă efectuată pleacă de la o ipoteză plauzibilă dar imaginară, nu se bazează pe observaţi şi măsurători exacte.