Model de regresie parabolica. Studiul dependenței statistice a modificărilor proprietăților zăcămintelor și fluidelor din zăcământ ca urmare a dezvoltării câmpurilor petroliere Regresia parabolică

Scopul serviciului. Folosind acest calculator online, puteți găsi parametrii unei ecuații de regresie neliniară (exponențială, putere, hiperbolă echilaterală, logaritmică, exponențială) (vezi exemplul).

Instrucţiuni. Specificați cantitatea de date de intrare. Soluția rezultată este salvată într-un fișier Word. Un șablon de soluție este, de asemenea, creat automat în Excel. Nota: dacă trebuie să determinați parametrii unei dependențe parabolice (y = ax 2 + bx + c), atunci puteți utiliza serviciul de aliniere analitică.
Puteți limita un set omogen de unități prin eliminarea obiectelor anormale de observație folosind metoda Irvine sau folosind regula trei sigma (eliminați acele unități pentru care valoarea factorului explicativ se abate de la medie cu mai mult de trei ori deviația standard).

Tipuri de regresie neliniară

Aici ε este o eroare aleatorie (abatere, perturbare), care reflectă influența tuturor factorilor necontabilizați.

Ecuație de regresie de ordinul întâi este o ecuație de regresie liniară pe perechi.

Ecuație de regresie de ordinul doi aceasta este o ecuație de regresie polinomială de ordinul doi: y = a + bx + cx 2 .

Ecuația de regresie de ordinul treiîn consecință, o ecuație de regresie polinomială de ordinul trei: y = a + bx + cx 2 + dx 3.

Pentru a aduce dependențe neliniare la cele liniare, se folosesc metode de liniarizare (vezi metoda de nivelare):

  1. Înlocuirea variabilelor.
  2. Luarea logaritmilor ambelor părți ale ecuației.
  3. Combinate.
y = f(x)ConversieMetoda de liniarizare
y = b x aY = log(y); X = log(x)Logaritm
y = b e axY = log(y); X = xCombinate
y = 1/(ax+b)Y = 1/y; X = xÎnlocuirea variabilelor
y = x/(ax+b)Y = x/y; X = xÎnlocuirea variabilelor. Exemplu
y = aln(x)+bY = y; X = log(x)Combinate
y = a + bx + cx 2x 1 = x; x 2 = x 2Înlocuirea variabilelor
y = a + bx + cx 2 + dx 3x 1 = x; x 2 = x 2 ; x 3 = x 3Înlocuirea variabilelor
y = a + b/xx 1 = 1/xÎnlocuirea variabilelor
y = a + sqrt(x)bx 1 = sqrt(x)Înlocuirea variabilelor
Exemplu. Pe baza datelor preluate din tabelul corespunzător, efectuați următoarele acțiuni:
  1. Construiți un câmp de corelație și formulați o ipoteză despre forma conexiunii.
  2. Calculați parametrii ecuațiilor de regresie liniară, putere, exponențială, semilogaritmică, inversă, hiperbolice.
  3. Evaluați proximitatea conexiunii folosind indicatori de corelare și determinare.
  4. Folosind coeficientul de elasticitate mediu (general), dați o evaluare comparativă a puterii relației dintre factor și rezultat.
  5. Evaluați calitatea ecuațiilor folosind eroarea medie de aproximare.
  6. Evaluați fiabilitatea statistică a rezultatelor modelării regresiei utilizând testul F Fisher. Conform valorilor caracteristicilor calculate la paragrafe. 4, 5 și acest paragraf, alegeți cea mai bună ecuație de regresie și prezentați rațiunea acesteia.
  7. Calculați valoarea estimată a rezultatului dacă valoarea estimată a factorului crește cu 15% față de nivelul său mediu. Determinați intervalul de încredere al prognozei pentru nivelul de semnificație α=0,05.
  8. Evaluează rezultatele obținute și întocmește concluziile într-o notă analitică.
AnConsumul final real al gospodăriilor (la prețuri curente), miliarde de ruble. (1995 - trilioane de ruble), yVenitul mediu pe cap de locuitor în numerar al populației (pe lună), rub. (1995 - mii de ruble), x
1995 872 515,9
2000 3813 2281,1
2001 5014 3062
2002 6400 3947,2
2003 7708 5170,4
2004 9848 6410,3
2005 12455 8111,9
2006 15284 10196
2007 18928 12602,7
2008 23695 14940,6
2009 25151 16856,9

Soluţie. În calculator selectăm secvenţial tipuri de regresie neliniară. Obținem un tabel de tipul următor.
Ecuația de regresie exponențială este y = a e bx
După liniarizare obținem: ln(y) = ln(a) + bx
Obținem coeficienți de regresie empiric: b = 0,000162, a = 7,8132
Ecuația de regresie: y = e 7,81321500 e 0,000162x = 2473,06858e 0,000162x

Ecuația de regresie a puterii este y = a x b
După liniarizare obținem: ln(y) = ln(a) + b ln(x)
Coeficienți de regresie empiric: b = 0,9626, a = 0,7714
Ecuația de regresie: y = e 0,77143204 x 0,9626 = 2,16286x 0,9626

Ecuația de regresie hiperbolică are forma y = b/x + a + ε
După liniarizare obținem: y=bx + a
Coeficienți de regresie empiric: b = 21089190,1984, a = 4585,5706
Ecuația de regresie empirică: y = 21089190,1984 / x + 4585,5706

Ecuația de regresie logaritmică este y = b ln(x) + a + ε
Coeficienți de regresie empiric: b = 7142,4505, a = -49694,9535
Ecuația de regresie: y = 7142,4505 ln(x) - 49694,9535

Ecuația de regresie exponențială este y = a b x + ε
După liniarizare obținem: ln(y) = ln(a) + x ln(b)
Coeficienți de regresie empiric: b = 0,000162, a = 7,8132
y = e 7,8132 *e 0,000162x = 2473,06858*1,00016 x

xy1/xln(x)ln(y)
515.9 872 0.00194 6.25 6.77
2281.1 3813 0.000438 7.73 8.25
3062 5014 0.000327 8.03 8.52
3947.2 6400 0.000253 8.28 8.76
5170.4 7708 0.000193 8.55 8.95
6410.3 9848 0.000156 8.77 9.2
8111.9 12455 0.000123 9 9.43
10196 15284 9.8E-59.23 9.63
12602.7 18928 7.9E-59.44 9.85
14940.6 23695 6.7E-59.61 10.07
16856.9 25151 5.9E-59.73 10.13

Regresia puterii

Funcția putere are forma y = bx a. Să aducem această funcție în formă liniară pentru a face acest lucru, luăm logaritmii ambelor părți: . Fie = y * , = x * , = b * , apoi y * = ax * + b * . Trebuie să găsiți doi parametri: a și b * . Pentru a face acest lucru, să compunem funcția i * - (ax i * +b *)) 2, deschidem parantezele i * - ax i * - b *) 2 și compunem sistemul:

Fie A = i *, B = i *, C = i * x i *, D = i *2, atunci sistemul va lua forma: aD + bA = C

Să rezolvăm acest sistem de ecuații algebrice liniare folosind metoda lui Cramer și să găsim astfel valorile necesare ale parametrilor a și b *:

Masă. Sunt puncte

Folosind metoda de calcul a parametrilor unei funcții de putere, obținem:

a = 1,000922, b = 1,585807. Deoarece exponentul variabilei este aproximativ egal cu unu, graficul funcției va arăta ca o linie dreaptă.

Graficul funcției y = 1,585807x 1,000922:

Diagrama bloc:

Regresia parabolica

Funcția pătratică are forma y = ax 2 + bx + c, prin urmare, este necesar să se găsească trei parametri: a, b, c, cu condiția ca coordonatele n puncte să fie date. Pentru a face acest lucru, vom compune funcția S = i - (ax i 2 + bx i + c)) 2, deschidem parantezele S = i - ax i 2 - bx i - c) 2 și vom compune sistemul:


Să rezolvăm acest sistem de ecuații algebrice liniare folosind metoda lui Cramer și să găsim astfel valorile cerute ale parametrilor a, b și c:

Masă. Există puncte:

Folosind metoda de calcul a parametrilor unei funcții pătratice, obținem:

a = 0,5272728, b = -5,627879, c = 14,87333.

Graficul funcției y = 0,5272728x 2 - 5,627879x + 14,87333:

Diagrama bloc

Rezolvarea ecuațiilor de forma f(x)=0

O ecuație de forma f(x) = 0 este o ecuație algebrică neliniară într-o variabilă, unde funcția f(x) este definită și continuă pe un interval finit sau infinit a< x < b. Всякое значение C???, обращающее функцию f(x) в ноль, называется корнем уравнения f(x) = 0. Большинство алгебраических нелинейных уравнений вида f(x) = 0 аналитически (т.е. точно) не решается, поэтому на практике для нахождения корней часто используются численные методы.

Problema găsirii numerice a rădăcinilor unei ecuații constă în două etape: separarea rădăcinilor, i.e. găsirea unor astfel de vecinătăți ale regiunii luate în considerare care conțin o valoare a rădăcinii și rafinarea rădăcinilor, de ex. calculele lor cu un anumit grad de precizie în aceste împrejurimi.

Un alt tip de regresie cu un singur factor este aproximarea prin polinoame de putere de forma:

Este firesc să dorim să obținem cea mai simplă dependență posibilă, limitându-ne la polinoame de putere de gradul doi, i.e. dependenta parabolica:
(5.5.2)

Să calculăm derivatele parțiale în raport cu coeficienții b 0 , b 1 Şi b 2 :



(5.5.3)

Echivalând derivatele cu zero, obținem un sistem normal de ecuații:

(5.5.4)

Rezolvarea sistemului de ecuații normale (5.5.2) pentru un caz specific de valori x i * , y i * ;
primim valori optime b 0 , b 1 Şi b 2 . Pentru aproximarea prin dependență (5.5.2) și mai ales (5.5.1), nu s-au obținut formule simple de calcul a coeficienților și, de regulă, se calculează folosind proceduri standard sub formă de matrice:

(5.5.5)

Figura 5.5.1 prezintă un exemplu tipic de aproximare printr-o dependență parabolică:

9 (5;9)

(1;1)

1

1 2 3 4 5 x

Fig.5.5.1. Coordonatele punctelor experimentale și aproximate

dependenţa lor parabolică

Exemplul 5.1. Aproximați rezultatele experimentale prezentate în Tabelul 5.1.1 cu o ecuație de regresie liniară
.

Tabelul 5.1.1

Să construim puncte experimentale după coordonatele indicate în Tabelul 5.1.1 pe graficul prezentat în Fig. 5.1.1.

la

9

4

1 2 3 4 5 x

Conform Fig. 5.1.1, pe care vom trasa o linie dreaptă pentru o evaluare preliminară, vom concluziona că există o neliniaritate clar exprimată în localizarea punctelor experimentale, dar nu este foarte semnificativă și, prin urmare, are sens. pentru a le aproxima cu o dependență liniară. Rețineți că pentru a obține o concluzie matematică corectă, este necesar să construiți o linie dreaptă folosind metoda celor mai mici pătrate.

Înainte de a efectua analiza de regresie, este recomandabil să se calculeze

coeficient de corelaţie liniară între variabile XŞi la:

Semnificația relației de corelație este determinată de valoarea critică a coeficientului de corelație liniară, calculată folosind formula:

Valoarea critică a testului Student t Creta găsit conform tabelelor statistice pentru nivelul de semnificație recomandat a=0,05 iar pentru n-2 grade de libertate. Dacă valoarea calculată r xy nu mai mică decât valoarea critică r Creta, apoi corelația dintre variabile x Şi y considerată esenţială. Hai sa facem calculele:










Datorită faptului că
concluzionăm că corelaţia dintre variabile XŞi la este semnificativă și poate fi liniară.

Să calculăm coeficienții ecuației de regresie:

Astfel, am obținut o ecuație de regresie liniară:

Folosind ecuația de regresie, desenăm o linie dreaptă în Fig. 5.1.2.

y (5;9,8)

9

4

(0;-0.2) 1 2 3 4 5 x

Fig.5.1.2. Coordonatele punctelor experimentale și aproximate

dependența lor liniară

Folosind ecuația de regresie, calculăm valorile funcției pe baza punctelor experimentale din tabelul 5.1.1 și diferența dintre valorile experimentale și calculate ale funcției, pe care o prezentăm în tabelul 5.1.2.

Tabelul 5.1.2


Să calculăm eroarea pătratică medie și raportul acesteia la valoarea medie:

În ceea ce privește raportul dintre eroarea standard și valoarea medie, s-a obținut un rezultat nesatisfăcător, deoarece a fost depășită valoarea recomandată de 0,05.

Să evaluăm nivelul de semnificație al coeficienților ecuației de regresie folosind testul t al lui Student:


Din tabelul statistic pentru 3 grade de libertate, să scriem liniile cu nivelul de semnificație - şi valoarea criteriului Studentului t la tabelul 5.1.3.

Tabelul 5.1.3

Nivelul de semnificație al coeficienților ecuației de regresie:


Rețineți că în funcție de nivelul de semnificație pentru coeficient s-a obţinut un rezultat satisfăcător, iar pentru coeficient nesatisfăcător.

Să evaluăm calitatea ecuației de regresie rezultată folosind indicatori calculați pe baza analizei varianței:

Examinare:

Rezultatul verificării este pozitiv, ceea ce indică corectitudinea calculelor efectuate.

Să calculăm criteriul Fisher:

cu două grade de libertate:

Folosind tabele statistice, găsim valorile critice ale criteriului Fisher pentru două gradații recomandate ale nivelului de semnificație:


Deoarece valoarea calculată a testului Fisher depășește valoarea critică pentru nivelul de semnificație de 0,01, vom presupune că nivelul de semnificație conform testului Fisher este mai mic de 0,01, ceea ce va fi considerat satisfăcător.

Să calculăm coeficientul de determinare multiplă:

pentru două grade de libertate

Folosind tabelul statistic pentru nivelul de semnificație recomandat de 0,05 și două grade de libertate găsite, găsim valoarea critică a coeficientului de determinare multiplă:

Deoarece valoarea calculată a coeficientului de determinare multiplă depășește valoarea critică pentru nivelul de semnificație
, apoi nivelul de semnificație conform coeficientului de determinare multiplă
iar rezultatul obţinut pentru indicatorul depus va fi considerat satisfăcător.

Astfel, parametrii calculați obținuți în ceea ce privește raportul dintre eroarea standard și valoarea medie și nivelul de semnificație conform testului Student sunt nesatisfăcători, de aceea este recomandabil să selectați o altă dependență de aproximare pentru aproximare.

Exemplul 5.2. Aproximarea distribuției experimentale a numerelor aleatoare printr-o dependență matematică

Distribuția experimentală a numerelor aleatoare prezentată în Tabelul 5.1.1, când a fost aproximată printr-o dependență liniară, nu a condus la un rezultat satisfăcător, incl. din cauza nesemnificației coeficientului ecuației de regresie cu termen liber, prin urmare, pentru a îmbunătăți calitatea aproximării, vom încerca să o realizăm folosind o dependență liniară fără termen liber:

Să calculăm valoarea coeficientului ecuației de regresie:

Astfel, am obținut ecuația de regresie:

Folosind ecuația de regresie obținută, calculăm valorile funcției și diferența dintre valorile experimentale și calculate ale funcției, pe care le prezentăm sub forma tabelului 5.2.1.

Tabelul 5.2.1

x i

Conform ecuaţiei de regresie
în Fig. 5.2.1 vom trasa o linie dreaptă.

y (5;9.73 )

(0;0) 1 2 3 4 5 x

Fig.5.2.1. Coordonatele punctelor experimentale și aproximate

dependența lor liniară

Pentru a evalua calitatea aproximării, vom efectua calcule ale indicatorilor de calitate similare calculelor date în exemplul 5.1.

(rămâne vechi);

cu 4 grade de libertate;

Pentru

Pe baza rezultatelor aproximării, observăm că în ceea ce privește nivelul de semnificație al coeficientului ecuației de regresie s-a obținut un rezultat satisfăcător; Raportul dintre eroarea standard și medie s-a îmbunătățit, dar rămâne în continuare peste valoarea recomandată de 0,05, așa că se recomandă repetarea aproximării cu o relație matematică mai complexă.

Exemplul 5.3. Pentru a îmbunătăți calitatea aproximării exemplelor 5.1 și 5.2, vom efectua o aproximare neliniară prin dependență
. Pentru a face acest lucru, vom face mai întâi calcule intermediare și vom plasa rezultatele acestora în tabelul 5.3.1.

Valori

Tabelul 5.3.1

X 2

(lnX) 2

lnX lnY

În plus, să calculăm:

Să aproximăm dependența
. Folosind formulele (5.3.7), (5.3.8) calculăm coeficienții b 0 Şi b 1 :

Folosind formulele (5.3.11), calculăm coeficienții O 0 Şi O 1 :


Pentru calcularea erorii standard au fost efectuate calcule intermediare, prezentate în Tabelul 5.3.2.

Tabelul 5.3.2

Y i

y i

Suma: 7,5968

Eroarea standard de aproximare sa dovedit a fi mult mai mare decât în ​​cele două exemple anterioare, așa că considerăm rezultatele aproximării inutilizabile.

Exemplul 5.4. Să încercăm să aproximăm cu o altă dependență neliniară
. Folosind formulele (5.3.9), (5.3.10) conform tabelului 5.3.1, calculăm coeficienții b 0 Şi b 1 :

Avem o dependență intermediară:

Folosind formulele (5.3.13) calculăm coeficienții C 0 Şi C 1 :


Avem dependența finală:

Pentru a calcula eroarea standard, vom efectua calcule intermediare și le vom plasa în tabelul 5.4.1.

Tabelul 5.4.1

Y i

y i

Suma: 21,83152

Să calculăm eroarea standard:

Eroarea standard de aproximare s-a dovedit a fi mult mai mare decât în ​​exemplul anterior, așa că considerăm rezultatele aproximării inutilizabile.

Exemplul 5.5. Aproximarea distribuției experimentale a numerelor aleatoare printr-o dependență matematică y = b · lnx

Datele inițiale, ca și în exemplele precedente, sunt prezentate în Tabelul 5.4.1 și Fig. 5.4.1.

Tabelul 5.4.1

Pe baza analizei din Fig. 5.4.1 și Tabelul 5.4.1, observăm că cu valori mai mici ale argumentului (la începutul tabelului) funcția se modifică mai mult decât cu valori mai mari (la sfârșitul tabel), de aceea pare recomandabil să se schimbe scara argumentului și să se introducă o funcție logaritmică în ecuația de regresie din aceasta și să se aproximeze cu următoarea dependență matematică:

. Folosind formula (5.4.3) calculăm coeficientul b:

Pentru a evalua calitatea aproximării, vom efectua calcule intermediare prezentate în Tabelul 5.4.2, din care vom calcula mărimea erorii și raportul dintre eroarea standard și valoarea medie.

Tabelul 5.4.2


Deoarece raportul dintre eroarea standard și valoarea medie depășește valoarea recomandată de 0,05, rezultatul va fi considerat nesatisfăcător. În special, observăm că cea mai mare abatere este dată de valoare x=1,întrucât cu această valoare lnx=0. Prin urmare, vom aproxima dependența y = b 0 +b 1 lnx

Prezentăm calcule auxiliare sub forma tabelului 5.4.3.

Tabelul 5.4.3

Folosind formulele (5.4.6) și (5.4.7) calculăm coeficienții b 0 și b 1 :

9 (5;9.12)

4

1 (1;0.93)

1 2 3 4 5 x

Pentru a evalua calitatea aproximării, vom efectua calcule auxiliare și vom determina nivelul de semnificație al coeficienților găsiți și raportul dintre eroarea standard și valoarea medie.

Nivel de semnificație ușor peste valoarea recomandată de 0,05 (
).


Datorită faptului că, conform indicatorului principal - raportul dintre eroarea standard și valoarea medie - a fost obținut un exces de aproape dublu față de nivelul recomandat de 0,05, vom considera rezultatele acceptabile. Rețineți că valoarea calculată a testului Studentului t b 0 =2,922 diferit de critic
cu o cantitate relativ mică.

Exemplul 5.6. Să aproximăm datele experimentale din Exemplul 5.1 prin dependența hiperbolică
. Pentru a calcula coeficienţii b 0 și b 1 Să efectuăm calculele preliminare date în Tabelul 5.6.1.

Tabelul 5.6.1

X i

x i =1/X i

x i 2

x i y i

Pe baza rezultatelor din tabelul 5.6.1 folosind formulele (5.4.8) și (5.4.9), calculăm coeficienții b 0 și b 1 :

Astfel, se obține o ecuație de regresie hiperbolică

.

Rezultatele calculelor auxiliare pentru evaluarea calității aproximării sunt prezentate în Tabelul 5.6.2.

Tabelul 5.6.2

X i

Pe baza rezultatelor din Tabelul 5.6.2, calculăm eroarea standard și raportul dintre eroarea standard și valoarea medie:


Datorită faptului că raportul dintre eroarea standard și valoarea medie depășește valoarea recomandată de 0,05, concluzionăm că rezultatele aproximării sunt nepotrivite.

Exemplul 5.7.

Pentru a calcula valori specifice ale veniturilor din exploatarea macaralelor cu braț în funcție de timpul lucrărilor de întreținere, este necesar să se obțină o dependență parabolică.

Să calculăm coeficienții acestei dependențe b 0 , b 1 , b 11 sub formă de matrice conform formulei:

Ecuațiile de regresie neliniară care leagă indicatorul efectiv cu valorile optime pentru efectuarea întreținerii preventive a macaralelor turn au fost obținute folosind procedura de regresie multiplă a pachetului de aplicații Statistica 6.0. În continuare, prezentăm rezultatele analizei de regresie pentru indicatorul de performanță efectivă conform Tabelului 5.7.1.

Tabelul 5.7.1

Tabelul 5.7.2 prezintă rezultatele regresiei neliniare pentru indicatorul de performanță efectivă, iar Tabelul 5.7.3 prezintă rezultatele analizei reziduurilor.

Tabelul 5.7.2

Tabelul 5.7.3

Orez. 3.7.36. Analiza reziduurilor.

Astfel, am obținut o ecuație de regresie multiplă pentru variabilă
:

Raportul erorii standard înseamnă:

14780/1017890=0,0145 < 0,05.

Deoarece raportul dintre eroarea standard și valoarea medie nu depășește valoarea recomandată de 0,05, rezultatele aproximării pot fi considerate acceptabile. Ca un dezavantaj conform Tabelului 5.7.2, trebuie remarcat faptul că toți coeficienții calculați depășesc nivelul de semnificație recomandat de 0,05.

În unele cazuri, datele empirice dintr-o populație statistică, reprezentate vizual folosind o diagramă de coordonate, arată că o creștere a unui factor este însoțită de o creștere mai rapidă a rezultatului. Pentru a descrie teoretic acest tip de corelație între caracteristici, putem lua ecuația de regresie parabolică de ordinul doi:

unde , este un parametru care arată valoarea medie a caracteristicii rezultate în condiția izolării complete a influenței factorului (x=0); – coeficientul de proporționalitate al modificării rezultatului, sub rezerva unei creșteri absolute a atributului factorului pentru fiecare dintre unitățile sale; c este coeficientul de accelerare (decelerație) de creștere a caracteristicii efective pentru fiecare unitate a factorului.

Folosind metoda celor mai mici pătrate ca bază pentru calcularea parametrilor , , și luând ca valoare inițială valoarea medie condiționată a seriei clasate, vom avea Σх = 0, Σх 3 = 0. În acest caz, sistemul de ecuații într-o formă simplificată va fi:

Din aceste ecuații putem găsi parametrii , , с, care în formă generală se pot scrie astfel:

(11.20)

(11.22)

Aceasta arată că pentru a determina parametrii , , c este necesar să se calculeze următoarele valori: Σ y, Σ xy, Σ x 2, Σ x 2 y, Σ x 4. În acest scop, puteți utiliza aspectul tabelului. 11.9.

Să presupunem că există date despre ponderea culturilor de cartofi în structura tuturor suprafețelor însămânțate și a randamentului (recolta brută) a culturii în 30 de organizații agricole. Este necesar să se creeze și să se rezolve o ecuație pentru corelația dintre acești indicatori.

Tabelul 11.9. Calculul indicatorilor auxiliari pentru ecuație

Regresia parabolica

Articol nr. X la xy x 2 x 2 y x 4
x 1 la 1 x 1 y 1
x 2 la 2 x 2 y 2
n x n y n x n y n
Σ Σх Σу Σxy Σx 2 Σx 2 y Σх 4

O reprezentare grafică a câmpului de corelație a arătat că indicatorii studiați sunt legați empiric între ei printr-o linie care se apropie de o parabolă de ordinul doi. Prin urmare, vom calcula parametrii necesari , , s ca parte a ecuației de regresie parabolică dorită folosind aspectul tabelului. 11.10.

Tabelul 11.10. Calculul datelor auxiliare pentru ecuație

Regresia parabolica

Articol nr. X, % y, mii de tone xy x 2 x 2 y x 4
1,0 5,0 5,0 1,0 5,0 1,0
1,5 7,0 10,5 2,3 15,8 5,0
n 8,0 20,0 160,0 64,0
Σ

Să înlocuim valorile specifice Σ y = 495, Σ xy = 600, Σ x 2 = 750, Σ x 2 y = 12375, Σ x 4 = 18750, disponibile în tabel. 11.10, în formulele (11.20), (11.21), (11.22). Primim

Astfel, ecuația de regresie parabolică care exprimă influența ponderii culturilor de cartofi în structura suprafețelor însămânțate asupra randamentului (randamentului brut) al culturii în organizațiile agricole are următoarea formă:

(11.23)

Ecuația 11.23 arată că, în condițiile unei populații eșantion date, randamentul mediu (randamentul brut) de cartofi (10 mii c) poate fi obținut fără influența factorului studiat - creșterea ponderii culturilor în structura semănatului. zone, adică în această condiție, când fluctuațiile de greutate specifică a culturilor nu vor afecta dimensiunea culturii de cartofi (x = 0). Parametrul (coeficientul de proporționalitate) b = 0,8 arată că fiecare creștere procentuală a proporției de culturi asigură o creștere a randamentului cu o medie de 0,8 mii tone, iar parametrul c = 0,1 indică faptul că cu un procent (pătrat) creșterea randamentului este accelerată de o medie de 0,1 mii tone de cartofi.

Analiza de regresie și corelație sunt metode de cercetare statistică. Acestea sunt cele mai comune moduri de a arăta dependența unui parametru de una sau mai multe variabile independente.

Mai jos, folosind exemple practice specifice, vom lua în considerare aceste două analize foarte populare în rândul economiștilor. Vom da, de asemenea, un exemplu de obținere a rezultatelor atunci când le combinăm.

Analiza de regresie în Excel

Arată influența unor valori (independente, independente) asupra variabilei dependente. De exemplu, cum depinde numărul populației active din punct de vedere economic de numărul de întreprinderi, salarii și alți parametri. Sau: cum afectează investițiile străine, prețurile la energie etc. nivelul PIB-ului.

Rezultatul analizei vă permite să evidențiați prioritățile. Și pe baza factorilor principali, anticipați, planificați dezvoltarea zonelor prioritare și luați decizii de management.

Are loc regresia:

  • liniară (y = a + bx);
  • parabolic (y = a + bx + cx 2);
  • exponențial (y = a * exp(bx));
  • putere (y = a*x^b);
  • hiperbolic (y = b/x + a);
  • logaritmică (y = b * 1n(x) + a);
  • exponențial (y = a * b^x).

Să ne uităm la un exemplu de construire a unui model de regresie în Excel și de interpretare a rezultatelor. Să luăm tipul liniar de regresie.

Sarcină. La 6 întreprinderi au fost analizate salariul mediu lunar și numărul de angajați care au demisionat. Este necesar să se determine dependența numărului de angajați care renunță la salariul mediu.

Modelul de regresie liniară are următoarea formă:

Y = a 0 + a 1 x 1 +…+a k x k.

Unde a sunt coeficienți de regresie, x sunt variabile de influență, k este numărul de factori.

În exemplul nostru, Y este indicatorul renunțării angajaților. Factorul de influență este salariul (x).

Excel are funcții încorporate care vă pot ajuta să calculați parametrii unui model de regresie liniară. Dar suplimentul „Pachet de analiză” va face acest lucru mai repede.

Activăm un instrument analitic puternic:

Odată activat, suplimentul va fi disponibil în fila Date.

Acum să facem însăși analiza de regresie.



În primul rând, acordăm atenție R-pătratului și coeficienților.

R-pătrat este coeficientul de determinare. În exemplul nostru – 0,755 sau 75,5%. Aceasta înseamnă că parametrii calculați ai modelului explică 75,5% din relația dintre parametrii studiați. Cu cât coeficientul de determinare este mai mare, cu atât modelul este mai bun. Bun - peste 0,8. Proastă – mai mică de 0,5 (o astfel de analiză nu poate fi considerată rezonabilă). În exemplul nostru – „nu e rău”.

Coeficientul 64,1428 arată ce va fi Y dacă toate variabilele din modelul luat în considerare sunt egale cu 0. Adică valoarea parametrului analizat este influențată și de alți factori nedescriși în model.

Coeficientul -0,16285 arată ponderea variabilei X pe Y. Adică salariul mediu lunar în cadrul acestui model afectează numărul de renunțați cu o pondere de -0,16285 (acesta este un grad mic de influență). Semnul „-” indică un impact negativ: cu cât salariul este mai mare, cu atât mai puține persoane renunță. Ceea ce este corect.



Analiza corelației în Excel

Analiza corelației ajută la determinarea dacă există o relație între indicatorii din unul sau două eșantioane. De exemplu, între timpul de funcționare al unei mașini și costul reparațiilor, prețul echipamentului și durata de funcționare, înălțimea și greutatea copiilor etc.

Dacă există o conexiune, atunci o creștere a unui parametru duce la o creștere (corelație pozitivă) sau o scădere (negativă) a celuilalt. Analiza corelației ajută analistul să determine dacă valoarea unui indicator poate fi utilizată pentru a prezice valoarea posibilă a altuia.

Coeficientul de corelație se notează cu r. Variază de la +1 la -1. Clasificarea corelațiilor pentru diferite zone va fi diferită. Când coeficientul este 0, nu există o relație liniară între probe.

Să vedem cum să găsim coeficientul de corelație folosind Excel.

Pentru a găsi coeficienți perechi, este utilizată funcția CORREL.

Obiectiv: Determinați dacă există o relație între timpul de funcționare al unui strung și costul întreținerii acestuia.

Plasați cursorul în orice celulă și apăsați butonul fx.

  1. În categoria „Statistică”, selectați funcția CORREL.
  2. Argumentul „Matrice 1” - primul interval de valori – timpul de funcționare al mașinii: A2:A14.
  3. Argumentul „Matrice 2” - al doilea interval de valori – costul reparației: B2:B14. Faceți clic pe OK.

Pentru a determina tipul de conexiune, trebuie să vă uitați la numărul absolut al coeficientului (fiecare domeniu de activitate are propria sa scară).

Pentru analiza corelației mai multor parametri (mai mult de 2), este mai convenabil să utilizați „Analiza datelor” (suplimentul „Pachet de analiză”). Trebuie să selectați corelația din listă și să desemnați matricea. Toate.

Coeficienții rezultați vor fi afișați în matricea de corelație. Ca aceasta:

Analiza corelației și regresiei

În practică, aceste două tehnici sunt adesea folosite împreună.

Exemplu:


Acum datele analizei de regresie au devenit vizibile.

Încărcare...Încărcare...