Metóda najmenších štvorcov umožňuje. Metóda najmenších štvorcov v Exceli. Regresná analýza. Niektoré špeciálne prípady využitia MNC v praxi

17.03.2022

Ktorý nachádza najširšie uplatnenie v rôznych oblastiach vedy a praktickej činnosti. Môže to byť fyzika, chémia, biológia, ekonómia, sociológia, psychológia a tak ďalej a tak ďalej. Z vôle osudu sa často musím popasovať s ekonomikou, a preto vám dnes sprostredkujem výlet do úžasnej krajiny tzv. Ekonometria=) ...Ako to nechceš?! Je to tam veľmi dobré – stačí sa rozhodnúť! ...Ale to, čo asi určite chcete, je naučiť sa riešiť problémy metóda najmenších štvorcov. A hlavne pilní čitatelia sa ich naučia riešiť nielen presne, ale aj VEĽMI RÝCHLO ;-) Ale najprv všeobecné vyjadrenie problému+ sprievodný príklad:

Pozrime sa na ukazovatele v určitej tematickej oblasti, ktoré majú kvantitatívne vyjadrenie. Zároveň existujú všetky dôvody domnievať sa, že ukazovateľ závisí od ukazovateľa. Tento predpoklad môže byť buď vedecká hypotéza alebo založená na základnom zdravom rozume. Nechajme však vedu bokom a preskúmajme chutnejšie oblasti – menovite obchody s potravinami. Označme podľa:

– predajná plocha predajne potravín, m2,
– ročný obrat obchodu s potravinami, milióny rubľov.

Je úplne jasné, že čím väčšia je plocha predajne, tým väčší bude vo väčšine prípadov jej obrat.

Predpokladajme, že po vykonaní pozorovaní/experimentov/výpočtov/tancov s tamburínou máme k dispozícii číselné údaje:

Pri obchodoch s potravinami je myslím všetko jasné: - toto je plocha 1. predajne, - jej ročný obrat, - plocha 2. predajne, - jej ročný obrat atď. Mimochodom, vôbec nie je potrebné mať prístup k utajovaným materiálom - pomerne presné posúdenie obchodného obratu je možné získať pomocou matematickej štatistiky. Nenechajme sa však rozptyľovať, kurz komerčnej špionáže je už zaplatený =)

Tabuľkové údaje môžu byť tiež zapísané vo forme bodov a zobrazené v známej forme karteziánsky systém .

Odpovedzme si na dôležitú otázku: Koľko bodov je potrebných na kvalitatívnu štúdiu?

Čím viac, tým lepšie. Minimálna prijateľná sada pozostáva z 5-6 bodov. Okrem toho, keď je množstvo údajov malé, „anomálne“ výsledky nemožno zahrnúť do vzorky. Takže napríklad malý elitný obchod môže zarobiť rádovo viac ako „jeho kolegovia“, čím skresľuje všeobecný vzorec, ktorý musíte nájsť!

Veľmi zjednodušene povedané, musíme vybrať funkciu, harmonogram ktorý prechádza čo najbližšie k bodom . Táto funkcia sa nazýva aproximácia (aproximácia - aproximácia) alebo teoretická funkcia . Vo všeobecnosti sa tu okamžite objaví zjavný „súťažník“ - polynóm vysokého stupňa, ktorého graf prechádza VŠETKÝMI bodmi. Táto možnosť je však komplikovaná a často jednoducho nesprávna. (keďže graf sa bude neustále „zacykliť“ a zle odráža hlavný trend).

Hľadaná funkcia teda musí byť celkom jednoduchá a zároveň primerane odrážať závislosť. Ako asi tušíte, jedna z metód na nájdenie takýchto funkcií je tzv metóda najmenších štvorcov. Najprv sa pozrime na jeho podstatu všeobecne. Nech nejaká funkcia aproximuje experimentálne dáta:

Ako vyhodnotiť presnosť tejto aproximácie? Vypočítajme aj rozdiely (odchýlky) medzi experimentálnymi a funkčnými hodnotami (študujeme kresbu). Prvá myšlienka, ktorá príde na myseľ, je odhadnúť, aká veľká je suma, ale problém je v tom, že rozdiely môžu byť negatívne (napr. ) a odchýlky v dôsledku takéhoto súčtu sa navzájom vyrušia. Preto ako odhad presnosti aproximácie je potrebné brať súčet modulov odchýlky:

alebo zbalené: (pre prípad, že by niekto nevedel: – toto je ikona súčtu a – pomocná premenná „počítadlo“, ktorá nadobúda hodnoty od 1 do ).

Aproximáciou experimentálnych bodov s rôznymi funkciami získame rôzne hodnoty a samozrejme, ak je tento súčet menší, je táto funkcia presnejšia.

Takáto metóda existuje a je tzv metóda najmenšieho modulu. V praxi sa však výrazne rozšíril metóda najmenších štvorcov, v ktorom možné záporné hodnoty nie sú eliminované modulom, ale kvadratúrou odchýlok:

, po ktorom sú snahy zamerané na výber funkcie takej, že súčet štvorcových odchýlok bol čo najmenší. V skutočnosti odtiaľ pochádza názov metódy.

A teraz sa vrátime k ďalšiemu dôležitému bodu: ako je uvedené vyššie, vybraná funkcia by mala byť pomerne jednoduchá - existuje však aj veľa takýchto funkcií: lineárne , hyperbolický, exponenciálny, logaritmický, kvadratický atď. A, samozrejme, tu by som chcel okamžite „zmenšiť pole pôsobnosti“. Ktorú triedu funkcií by som si mal vybrať pre výskum? Primitívna, ale účinná technika:

- Najjednoduchšie je znázorniť body na výkrese a analyzovať ich umiestnenie. Ak majú tendenciu bežať v priamej línii, mali by ste hľadať rovnica priamky s optimálnymi hodnotami a . Inými slovami, úlohou je nájsť TAKÉ koeficienty, aby súčet kvadrátov odchýlok bol najmenší.

Ak sú body umiestnené napr hyperbola, potom je samozrejme jasné, že lineárna funkcia poskytne zlú aproximáciu. V tomto prípade hľadáme „najpriaznivejšie“ koeficienty pre rovnicu hyperboly – tie, ktoré dávajú minimálny súčet štvorcov .

Teraz si všimnite, že v oboch prípadoch hovoríme o funkcie dvoch premenných, ktorých argumenty sú vyhľadávané parametre závislosti:

A v podstate potrebujeme vyriešiť štandardný problém – nájsť minimálna funkcia dvoch premenných.

Spomeňme si na náš príklad: predpokladajme, že „ukladacie“ body majú tendenciu byť umiestnené v priamke a existujú všetky dôvody domnievať sa, že lineárna závislosť obrat z maloobchodných priestorov. Nájdite TAKÉTO koeficienty „a“ a „be“ také, že sú to súčet kvadrátov odchýlok bol najmenší. Všetko je ako obvykle - prvé Parciálne deriváty 1. rádu. Podľa pravidlo linearity Priamo pod ikonou sumy môžete rozlišovať:

Ak chcete použiť tieto informácie na esej alebo semestrálnu prácu, budem veľmi vďačný za odkaz v zozname zdrojov, kde nájdete takéto podrobné výpočty:

Vytvorme štandardný systém:

Každú rovnicu znížime o „dve“ a navyše „rozdelíme“ súčty:

Poznámka : nezávisle analyzovať, prečo je možné „a“ a „byť“ vyňať za ikonu súčtu. Mimochodom, formálne sa to dá urobiť so sumou

Prepíšme systém do „aplikovanej“ formy:

po ktorom sa začína objavovať algoritmus na riešenie nášho problému:

Poznáme súradnice bodov? Vieme. čiastky môžeme to nájsť? Jednoducho. Urobme to najjednoduchšie sústava dvoch lineárnych rovníc o dvoch neznámych(„a“ a „byť“). Systém riešime napr. Cramerova metóda, v dôsledku čoho získame stacionárny bod. Kontrola postačujúca podmienka pre extrém, môžeme overiť, že v tomto bode je funkcia dosiahne presne minimálne. Kontrola zahŕňa dodatočné výpočty, a preto ju necháme v zákulisí (v prípade potreby je možné zobraziť chýbajúci rámček). Vyvodzujeme konečný záver:

Funkcia najlepším možným spôsobom (aspoň v porovnaní s akoukoľvek inou lineárnou funkciou) približuje experimentálne body . Zhruba povedané, jeho graf prechádza čo najbližšie k týmto bodom. V tradícii ekonometrie výsledná aproximačná funkcia sa tiež nazýva párová lineárna regresná rovnica .

Uvažovaný problém má veľký praktický význam. V našej príkladnej situácii, Eq. umožňuje predpovedať, aký obchodný obrat ("Igrek") obchod bude mať jednu alebo druhú hodnotu predajnej plochy (jeden alebo iný význam „x“). Áno, výsledná predpoveď bude len predpoveďou, no v mnohých prípadoch sa ukáže ako celkom presná.

Budem analyzovať iba jeden problém so „skutočnými“ číslami, pretože v ňom nie sú žiadne ťažkosti - všetky výpočty sú na úrovni školských osnov pre 7. - 8. ročník. V 95 percentách prípadov budete vyzvaní, aby ste našli len lineárnu funkciu, ale na samom konci článku ukážem, že nájsť rovnice optimálnej hyperboly, exponenciálnej a niektorých ďalších funkcií nie je o nič ťažšie.

Vlastne ostáva už len rozdávať sľúbené dobroty – aby ste sa takéto príklady naučili riešiť nielen presne, ale aj rýchlo. Starostlivo študujeme štandard:

Úloha

Ako výsledok štúdia vzťahu medzi dvoma ukazovateľmi sa získali nasledujúce dvojice čísel:

Pomocou metódy najmenších štvorcov nájdite lineárnu funkciu, ktorá najlepšie aproximuje empirickú funkciu (skúsený)údajov. Vytvorte nákres, na ktorom zostrojíte experimentálne body a graf aproximačnej funkcie v kartézskom pravouhlom súradnicovom systéme . Nájdite súčet štvorcových odchýlok medzi empirickými a teoretickými hodnotami. Zistite, či by funkcia bola lepšia (z pohľadu metódy najmenších štvorcov) priblížiť experimentálne body.

Upozorňujeme, že význam „x“ je prirodzený a má charakteristický zmysluplný význam, o ktorom budem hovoriť o niečo neskôr; ale, samozrejme, môžu byť aj zlomkové. Okrem toho v závislosti od obsahu konkrétnej úlohy môžu byť hodnoty „X“ aj „hra“ úplne alebo čiastočne negatívne. Dostali sme „netvárnu“ úlohu a začíname s ňou riešenie:

Nájdeme koeficienty optimálnej funkcie ako riešenie systému:

Pre účely kompaktnejšieho záznamu možno premennú „counter“ vynechať, pretože už je jasné, že sčítanie sa vykonáva od 1 do .

Je vhodnejšie vypočítať požadované množstvá v tabuľkovej forme:

Výpočty je možné vykonávať na mikrokalkulačke, ale oveľa lepšie je použiť Excel - rýchlejšie a bez chýb; pozrite si krátke video:

Dostávame teda nasledovné systém:

Tu môžete vynásobiť druhú rovnicu 3 a odčítajte 2. od 1. rovnice člen po člene. Ale to je šťastie - v praxi systémy často nie sú darom a v takýchto prípadoch šetrí Cramerova metóda:
, čo znamená, že systém má jedinečné riešenie.

Skontrolujeme. Chápem, že to nechcete, ale prečo preskakovať chyby tam, kde ich absolútne nemožno vynechať? Nájdené riešenie dosadíme na ľavú stranu každej rovnice systému:

Získajú sa pravé strany zodpovedajúcich rovníc, čo znamená, že systém je vyriešený správne.

Požadovaná aproximačná funkcia: – od všetky lineárne funkcie Je to ona, ktorá najlepšie aproximuje experimentálne údaje.

Na rozdiel od priamy závislosť obratu predajne od jej plochy, zistená závislosť je obrátene (zásada „čím viac, tým menej“), a túto skutočnosť okamžite odhalí negatív sklon. Funkcia nám hovorí, že so zvýšením určitého ukazovateľa o 1 jednotku sa hodnota závislého ukazovateľa znižuje v priemere o 0,65 jednotky. Ako sa hovorí, čím vyššia je cena pohánky, tým menej sa predáva.

Na vykreslenie grafu aproximačnej funkcie nájdeme jej dve hodnoty:

a vykonajte kreslenie:

Zostrojená priamka je tzv trendová čiara (konkrétne lineárna trendová čiara, t. j. vo všeobecnom prípade trend nemusí byť nevyhnutne priamka). Každý pozná výraz „byť v trende“ a myslím si, že tento výraz nepotrebuje ďalší komentár.

Vypočítajme súčet štvorcových odchýlok medzi empirickými a teoretickými hodnotami. Geometricky je to súčet druhých mocnín dĺžok „malinových“ segmentov (dve z nich sú také malé, že ich ani nevidno).

Zhrňme si výpočty do tabuľky:

Opäť sa dajú urobiť ručne, pre prípad uvediem príklad pre 1. bod:

ale oveľa efektívnejšie je to urobiť už známym spôsobom:

Opakujeme ešte raz: Aký je význam získaného výsledku? Od všetky lineárne funkcie y funkciu ukazovateľ je najmenší, to znamená, že vo svojej rodine je to najlepšia aproximácia. A tu, mimochodom, posledná otázka problému nie je náhodná: čo ak navrhovaná exponenciálna funkcia bolo by lepšie priblížiť experimentálne body?

Nájdite zodpovedajúci súčet štvorcových odchýlok - na rozlíšenie ich označím písmenom „epsilon“. Technika je úplne rovnaká:

A ešte raz, pre každý prípad, výpočty k 1. bodu:

V Exceli používame štandardnú funkciu EXP (syntax nájdete v Pomocníkovi programu Excel).

Záver: , čo znamená, že exponenciálna funkcia aproximuje experimentálne body horšie ako priamka .

Tu však treba poznamenať, že „horšie“ je ešte neznamená, čo je zlé. Teraz som vytvoril graf tejto exponenciálnej funkcie - a tiež prechádza blízko k bodom - natoľko, že bez analytického výskumu je ťažké povedať, ktorá funkcia je presnejšia.

Toto uzatvára riešenie a vraciam sa k otázke prirodzených hodnôt argumentu. V rôznych štúdiách, zvyčajne ekonomických alebo sociologických, sa prirodzené „X“ používajú na číslovanie mesiacov, rokov alebo iných rovnakých časových intervalov. Zvážte napríklad nasledujúci problém.

Príklad.

Experimentálne údaje o hodnotách premenných X A pri sú uvedené v tabuľke.

V dôsledku ich zarovnania sa získa funkcia

Používanie metóda najmenších štvorcov, aproximovať tieto údaje lineárnou závislosťou y=ax+b(nájdite parametre A A b). Zistite, ktorá z dvoch čiar lepšie (v zmysle metódy najmenších štvorcov) zarovnáva experimentálne údaje. Urobte si kresbu.

Podstata metódy najmenších štvorcov (LSM).

Úlohou je nájsť lineárne koeficienty závislosti, pri ktorých je funkcia dvoch premenných A A b má najmenšiu hodnotu. Teda daný A A b súčet štvorcových odchýlok experimentálnych údajov od nájdenej priamky bude najmenší. Toto je celý zmysel metódy najmenších štvorcov.

Riešenie príkladu teda vedie k nájdeniu extrému funkcie dvoch premenných.

Odvodzovacie vzorce na hľadanie koeficientov.

Zostaví sa a vyrieši systém dvoch rovníc s dvoma neznámymi. Hľadanie parciálnych derivácií funkcie vzhľadom na premenné A A b, prirovnávame tieto deriváty k nule.

Výslednú sústavu rovníc riešime ľubovoľnou metódou (napr substitučnou metódou alebo ) a získajte vzorce na hľadanie koeficientov pomocou metódy najmenších štvorcov (LSM).

Dané A A b funkciu má najmenšiu hodnotu. Dôkaz tejto skutočnosti je uvedený.

To je celá metóda najmenších štvorcov. Vzorec na nájdenie parametra a obsahuje súčty , , a parameter n- množstvo experimentálnych údajov. Hodnoty týchto súm odporúčame vypočítať samostatne. Koeficient b zistené po výpočte a.

Je čas pripomenúť si pôvodný príklad.

Riešenie.

V našom príklade n=5. Tabuľku vypĺňame pre pohodlie výpočtu súm, ktoré sú zahrnuté vo vzorcoch požadovaných koeficientov.

Hodnoty vo štvrtom riadku tabuľky sa získajú vynásobením hodnôt v 2. riadku hodnotami v 3. riadku pre každé číslo i.

Hodnoty v piatom riadku tabuľky sa získajú umocnením hodnôt v 2. riadku pre každé číslo i.

Hodnoty v poslednom stĺpci tabuľky sú súčty hodnôt v riadkoch.

Na zistenie koeficientov používame vzorce metódy najmenších štvorcov A A b. Do nich nahradíme zodpovedajúce hodnoty z posledného stĺpca tabuľky:

teda y = 0,165 x + 2,184- požadovaná približná priamka.

Zostáva zistiť, ktorý z riadkov y = 0,165 x + 2,184 alebo lepšie aproximuje pôvodné údaje, teda odhady pomocou metódy najmenších štvorcov.

Odhad chyby metódy najmenších štvorcov.

Aby ste to dosiahli, musíte vypočítať súčet štvorcových odchýlok pôvodných údajov z týchto riadkov A , menšia hodnota zodpovedá riadku, ktorý sa lepšie približuje pôvodným údajom v zmysle metódy najmenších štvorcov.

Od , potom rovno y = 0,165 x + 2,184 lepšie sa približuje pôvodným údajom.

Grafické znázornenie metódy najmenších štvorcov (LS).

Všetko je jasne viditeľné na grafoch. Červená čiara je nájdená priamka y = 0,165 x + 2,184, modrá čiara je , ružové bodky sú pôvodné údaje.

Prečo je to potrebné, prečo všetky tieto aproximácie?

Osobne ho používam na riešenie problémov vyhladzovania údajov, interpolácie a extrapolácie (v pôvodnom príklade môžu byť požiadaní, aby našli hodnotu pozorovanej hodnoty r pri x=3 alebo kedy x=6 pomocou metódy najmenších štvorcov). Ale o tom si povieme viac neskôr v inej časti webu.

Dôkaz.

Takže keď sa nájde A A b funkcia nadobúda najmenšiu hodnotu, je potrebné, aby v tomto bode bola matica kvadratického tvaru diferenciálu druhého rádu pre funkciu bol pozitívny jednoznačný. Ukážme to.

Rozdiel druhého rádu má tvar:

Teda

Preto má matica kvadratickej formy tvar

a hodnoty prvkov nezávisia od A A b.

Ukážme, že matica je pozitívne definitívna. Aby to bolo možné, uhlové maloletí musia byť pozitívne.

Uhlová moll prvého rádu . Nerovnosť je prísna, pretože body sa nezhodujú. V nasledujúcom texte to naznačíme.

Uhlová moll druhého rádu

Dokážme to metódou matematickej indukcie.

Záver: nájdené hodnoty A A b zodpovedajú najmenšej hodnote funkcie , preto sú požadované parametre pre metódu najmenších štvorcov.

Metóda najmenších štvorcov

V záverečnej lekcii témy sa zoznámime s najznámejšou aplikáciou FNP, ktorý nachádza najširšie uplatnenie v rôznych oblastiach vedy a praktickej činnosti. Môže to byť fyzika, chémia, biológia, ekonómia, sociológia, psychológia a tak ďalej a tak ďalej. Z vôle osudu sa často musím popasovať s ekonomikou, a preto vám dnes sprostredkujem výlet do úžasnej krajiny tzv. Ekonometria=) ...Ako to nechceš?! Je to tam veľmi dobré – stačí sa rozhodnúť! ...Ale to, čo asi určite chcete, je naučiť sa riešiť problémy metóda najmenších štvorcov. A hlavne pilní čitatelia sa ich naučia riešiť nielen presne, ale aj VEĽMI RÝCHLO ;-) Ale najprv všeobecné vyjadrenie problému+ sprievodný príklad:

– predajná plocha predajne potravín, m2,
– ročný obrat obchodu s potravinami, milióny rubľov.

Je úplne jasné, že čím väčšia je plocha predajne, tým väčší bude vo väčšine prípadov jej obrat.

Tabuľkové údaje môžu byť tiež zapísané vo forme bodov a zobrazené v známej forme karteziánsky systém .

Odpovedzme si na dôležitú otázku: Koľko bodov je potrebných na kvalitatívnu štúdiu?

Veľmi zjednodušene povedané, musíme vybrať funkciu, harmonogram ktorý prechádza čo najbližšie k bodom . Táto funkcia sa nazýva aproximácia (aproximácia - aproximácia) alebo teoretická funkcia . Vo všeobecnosti sa tu okamžite objaví zjavný „súťažník“ - polynóm vysokého stupňa, ktorého graf prechádza VŠETKÝMI bodmi. Táto možnosť je však komplikovaná a často jednoducho nesprávna. (keďže graf sa bude neustále „zacykliť“ a zle odráža hlavný trend).

Hľadaná funkcia teda musí byť celkom jednoduchá a zároveň primerane odrážať závislosť. Ako asi tušíte, jedna z metód na nájdenie takýchto funkcií je tzv metóda najmenších štvorcov. Najprv sa pozrime na jeho podstatu všeobecne. Nech nejaká funkcia aproximuje experimentálne dáta:

Ako vyhodnotiť presnosť tejto aproximácie? Vypočítajme aj rozdiely (odchýlky) medzi experimentálnymi a funkčnými hodnotami (študujeme kresbu). Prvá myšlienka, ktorá príde na myseľ, je odhadnúť, aká veľká je suma, ale problém je v tom, že rozdiely môžu byť negatívne (napr. ) a odchýlky v dôsledku takéhoto súčtu sa navzájom vyrušia. Preto ako odhad presnosti aproximácie je potrebné brať súčet modulov odchýlky:

alebo zbalené: (ak niekto nevie: je ikona súčtu a – pomocná premenná „počítadla“, ktorá nadobúda hodnoty od 1 do ) .

Aproximáciou experimentálnych bodov s rôznymi funkciami získame rôzne hodnoty a samozrejme, ak je tento súčet menší, je táto funkcia presnejšia.

, po ktorom sú snahy zamerané na výber funkcie takej, že súčet štvorcových odchýlok bol čo najmenší. V skutočnosti odtiaľ pochádza názov metódy.

A teraz sa vrátime k ďalšiemu dôležitému bodu: ako je uvedené vyššie, vybraná funkcia by mala byť pomerne jednoduchá - existuje však aj veľa takýchto funkcií: lineárne , hyperbolický , exponenciálny , logaritmický , kvadratický atď. A, samozrejme, tu by som chcel okamžite „zmenšiť pole pôsobnosti“. Ktorú triedu funkcií by som si mal vybrať pre výskum? Primitívna, ale účinná technika:

Teraz si všimnite, že v oboch prípadoch hovoríme o funkcie dvoch premenných, ktorých argumenty sú vyhľadávané parametre závislosti:

A v podstate potrebujeme vyriešiť štandardný problém – nájsť minimálna funkcia dvoch premenných.

Ak chcete použiť tieto informácie na esej alebo semestrálnu prácu, budem veľmi vďačný za odkaz v zozname zdrojov, kde nájdete takéto podrobné výpočty:

Vytvorme štandardný systém:

Každú rovnicu znížime o „dve“ a navyše „rozdelíme“ súčty:

Poznámka : nezávisle analyzovať, prečo je možné „a“ a „byť“ vyňať za ikonu súčtu. Mimochodom, formálne sa to dá urobiť so sumou

Prepíšme systém do „aplikovanej“ formy:

po ktorom sa začína objavovať algoritmus na riešenie nášho problému:

Funkcia najlepším možným spôsobom (aspoň v porovnaní s akoukoľvek inou lineárnou funkciou) približuje experimentálne body . Zhruba povedané, jeho graf prechádza čo najbližšie k týmto bodom. V tradícii ekonometrie sa nazýva aj výsledná aproximačná funkcia párová lineárna regresná rovnica .

Vlastne ostáva už len rozdávať sľúbené dobroty – aby ste sa takéto príklady naučili riešiť nielen presne, ale aj rýchlo. Starostlivo študujeme štandard:

Úloha

Nájdeme koeficienty optimálnej funkcie ako riešenie systému:

Pre účely kompaktnejšieho záznamu možno premennú „counter“ vynechať, pretože už je jasné, že sčítanie sa vykonáva od 1 do .

Dostávame teda nasledovné systém:

Požadovaná aproximačná funkcia: – od všetky lineárne funkcie Je to ona, ktorá najlepšie aproximuje experimentálne údaje.

Na rozdiel od priamy závislosť obratu predajne od jej plochy, zistená závislosť je obrátene (zásada „čím viac, tým menej“), a túto skutočnosť okamžite odhalí negatív sklon. Funkcia nám hovorí, že so zvýšením určitého ukazovateľa o 1 jednotku sa hodnota závislého ukazovateľa znižuje v priemere o 0,65 jednotky. Ako sa hovorí, čím vyššia je cena pohánky, tým menej sa predáva.

Na vykreslenie grafu aproximačnej funkcie nájdeme jej dve hodnoty:

a vykonajte kreslenie:

Zostrojená priamka je tzv trendová čiara (konkrétne lineárna trendová čiara, t. j. vo všeobecnom prípade trend nemusí byť nevyhnutne priamka). Každý pozná výraz „byť v trende“ a myslím si, že tento výraz nepotrebuje ďalší komentár.

Zhrňme si výpočty do tabuľky:

Opäť sa dajú urobiť ručne, pre prípad uvediem príklad pre 1. bod:

ale oveľa efektívnejšie je to urobiť už známym spôsobom:

Záver: , čo znamená, že exponenciálna funkcia aproximuje experimentálne body horšie ako priamka .

K dispozícii sú nasledujúce údaje o maloobchodnom obrate predajne za prvý polrok:

Pomocou analytického priameho zarovnania stanovte objem obratu za júl.

Áno, žiadny problém: očíslujeme mesiace 1, 2, 3, 4, 5, 6 a použijeme zvyčajný algoritmus, výsledkom čoho je rovnica - jediná vec je, že pokiaľ ide o čas, zvyčajne používajú písmeno "te" (aj keď to nie je kritické). Výsledná rovnica ukazuje, že v prvom polroku sa obchodný obrat zvýšil v priemere o 27,74 jednotiek. za mesiac. Zoberme si predpoveď na júl (mesiac č. 7): d.e.

A takýchto úloh je nespočetne veľa. Tí, ktorí si to želajú, môžu využiť doplnkovú službu, a to moju Excel kalkulačka (demo verzia), ktorý rieši analyzovaný problém takmer okamžite! K dispozícii je pracovná verzia programu na výmenu alebo pre symbolický poplatok.

Na konci lekcie stručné informácie o hľadaní závislostí niektorých ďalších typov. V skutočnosti nie je čo povedať, pretože základný prístup a algoritmus riešenia zostávajú rovnaké.

Predpokladajme, že usporiadanie experimentálnych bodov pripomína hyperbolu. Potom, aby ste našli koeficienty najlepšej hyperboly, musíte nájsť minimum funkcie - ktokoľvek môže vykonať podrobné výpočty a dospieť k podobnému systému:

Z formálneho technického hľadiska sa získava z „lineárneho“ systému (označme to hviezdičkou) nahradenie "x" znakom . No a čo tie sumy? vypočítajte, po ktorom sa dosiahnu optimálne koeficienty „a“ a „be“ na dosah ruky.

Ak existujú všetky dôvody domnievať sa, že body sú umiestnené pozdĺž logaritmickej krivky, potom na nájdenie optimálnych hodnôt nájdeme minimum funkcie . Formálne je potrebné v systéme (*) nahradiť:

Pri vykonávaní výpočtov v Exceli použite funkciu LN. Priznám sa, že by pre mňa nebolo zvlášť ťažké vytvoriť kalkulačky pre každý z uvažovaných prípadov, ale stále by bolo lepšie, keby ste si výpočty „naprogramovali“ sami. Lekčné videá, ktoré vám pomôžu.

S exponenciálnou závislosťou je situácia trochu komplikovanejšia. Aby sme to zredukovali na lineárny prípad, vezmeme funkciu logaritmu a použijeme ju vlastnosti logaritmu:

Teraz, porovnaním výslednej funkcie s lineárnou funkciou, dospejeme k záveru, že v systéme (*) musí byť nahradené , a – . Pre pohodlie označme:

Upozorňujeme, že systém je riešený s ohľadom a, a preto po nájdení koreňov nesmiete zabudnúť nájsť samotný koeficient.

Aby sme priblížili experimentálne body optimálna parabola , treba nájsť minimálna funkcia troch premenných . Po vykonaní štandardných akcií dostaneme nasledujúce „pracovné“ systém:

Áno, samozrejme, je tu viac súm, ale pri používaní vašej obľúbenej aplikácie nie sú žiadne ťažkosti. A nakoniec vám poviem, ako rýchlo vykonať kontrolu pomocou programu Excel a vytvoriť požadovanú trendovú čiaru: vytvorte bodový graf, vyberte ľubovoľný z bodov pomocou myši a kliknite pravým tlačidlom myši vyberte možnosť "Pridať trendovú čiaru". Ďalej vyberte typ grafu a na karte "Možnosti" aktivovať možnosť "Zobraziť rovnicu na diagrame". OK

Ako vždy chcem ukončiť článok krásnou frázou a takmer som napísal: „Buďte v trende!“ Časom však zmenil názor. A nie preto, že je to stereotypné. Neviem ako u koho, ale mne sa vôbec nechce nasledovať propagovaný americký a hlavne európsky trend =) Preto prajem každému z vás, aby ste sa držali svojej línie!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metóda najmenších štvorcov je jednou z najbežnejších a najrozvinutejších vďaka jej jednoduchosť a efektívnosť metód odhadu parametrov lineárnych ekonometrických modelov. Zároveň je potrebné pri jeho používaní dbať na určitú opatrnosť, pretože modely skonštruované pomocou neho nemusia spĺňať množstvo požiadaviek na kvalitu svojich parametrov a v dôsledku toho „dobre“ neodrážajú vzorce vývoja procesov. dosť.

Pozrime sa podrobnejšie na postup odhadu parametrov lineárneho ekonometrického modelu metódou najmenších štvorcov. Takýto model môže byť vo všeobecnosti reprezentovaný rovnicou (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

Počiatočný údaj pri odhade parametrov a 0 , a 1 ,..., a n je vektor hodnôt závislej premennej r= (y 1 , y 2 , ... , y T)“ a matica hodnôt nezávislých premenných

v ktorej prvý stĺpec pozostávajúci z jednotiek zodpovedá modelovému koeficientu.

Metóda najmenších štvorcov dostala svoj názov na základe základného princípu, že odhady parametrov získané na jej základe musia spĺňať: súčet štvorcov chyby modelu by mal byť minimálny.

Príklady riešenia úloh metódou najmenších štvorcov

Príklad 2.1. Obchodný podnik má sieť 12 predajní, informácie o činnosti ktorých sú uvedené v tabuľke. 2.1.

Vedenie podniku by chcelo vedieť, ako závisí veľkosť ročného obratu od predajnej plochy predajne.

Tabuľka 2.1

Číslo predajne	Ročný obrat, milióny rubľov.	Predajná plocha, tis. m2
	19,76	0,24
	38,09	0,31
	40,95	0,55
	41,08	0,48
	56,29	0,78
	68,51	0,98
	75,01	0,94
	89,05	1,21
	91,13	1,29
	91,26	1,12
	99,84	1,29
	108,55	1,49

Riešenie metódou najmenších štvorcov. Označme ročný obrat tohto obchodu, milióny rubľov; - predajná plocha predajne, tisíc m2.

Obr.2.1. Bodový graf pre príklad 2.1

Na určenie tvaru funkčného vzťahu medzi premennými a zostrojíme rozptylový diagram (obr. 2.1).

Na základe rozptylového diagramu môžeme konštatovať, že ročný obrat je pozitívne závislý od maloobchodnej plochy (t. j. y sa bude zvyšovať s rastúcim ). Najvhodnejšia forma funkčného spojenia je lineárne.

Informácie pre ďalšie výpočty sú uvedené v tabuľke. 2.2. Pomocou metódy najmenších štvorcov odhadujeme parametre lineárneho jednofaktorového ekonometrického modelu

Tabuľka 2.2

t	y t	x 1 t	y t 2	x 1t 2	x 1t r t

	19,76	0,24	390,4576	0,0576	4,7424
	38,09	0,31	1450,8481	0,0961	11,8079
	40,95	0,55	1676,9025	0,3025	22,5225
	41,08	0,48	1687,5664	0,2304	19,7184
	56,29	0,78	3168,5641	0,6084	43,9062
	68,51	0,98	4693,6201	0,9604	67,1398
	75,01	0,94	5626,5001	0,8836	70,5094
	89,05	1,21	7929,9025	1,4641	107,7505
	91,13	1,29	8304,6769	1,6641	117,5577
	91,26	1,12	8328,3876	1,2544	102,2112
	99,84	1,29	9968,0256	1,6641	128,7936
	108,55	1,49	11783,1025	2,2201	161,7395
S	819,52	10,68	65008,554	11,4058	858,3991
Priemerná	68,29	0,89

teda

Preto so zvýšením maloobchodnej plochy o 1 000 m2, ak sú ostatné veci rovnaké, priemerný ročný obrat sa zvyšuje o 67,8871 milióna rubľov.

Príklad 2.2. Vedenie spoločnosti si všimlo, že ročný obrat nezávisí len od predajnej plochy predajne (pozri príklad 2.1), ale aj od priemernej návštevnosti. Príslušné informácie sú uvedené v tabuľke. 2.3.

Tabuľka 2.3

Riešenie. Označme - priemerný počet návštevníkov th obchodu za deň, tisíc ľudí.

Na určenie tvaru funkčného vzťahu medzi premennými a zostrojíme rozptylový diagram (obr. 2.2).

Na základe bodového grafu môžeme konštatovať, že ročný obrat je pozitívne závislý od priemerného počtu návštevníkov za deň (t. j. y sa bude zvyšovať s rastúcim ). Forma funkčnej závislosti je lineárna.

Ryža. 2.2. Bodový graf pre príklad 2.2

Tabuľka 2.4

t	x 2t	x 2t 2	y t x 2 t	x 1t x 2t

	8,25	68,0625	163,02	1,98
	10,24	104,8575	390,0416	3,1744
	9,31	86,6761	381,2445	5,1205
	11,01	121,2201	452,2908	5,2848
	8,54	72,9316	480,7166	6,6612
	7,51	56,4001	514,5101	7,3598
	12,36	152,7696	927,1236	11,6184
	10,81	116,8561	962,6305	13,0801
	9,89	97,8121	901,2757	12,7581
	13,72	188,2384	1252,0872	15,3664
	12,27	150,5529	1225,0368	15,8283
	13,92	193,7664	1511,016	20,7408
S	127,83	1410,44	9160,9934	118,9728
Priemerná	10,65

Vo všeobecnosti je potrebné určiť parametre dvojfaktorového ekonometrického modelu

y t = a 0 + a 1 x 1 t + a 2 x 2 t + ε t

Informácie potrebné pre ďalšie výpočty sú uvedené v tabuľke. 2.4.

Odhadnime parametre lineárneho dvojfaktorového ekonometrického modelu metódou najmenších štvorcov.

teda

Odhad koeficientu =61,6583 ukazuje, že pri nezmenených ostatných okolnostiach sa pri zvýšení predajnej plochy o 1 tis. m 2 zvýši ročný obrat v priemere o 61,6583 mil. rubľov.

Odhad koeficientu = 2,2748 ukazuje, že pri ostatných nezmenených pomeroch pri náraste priemernej návštevnosti na 1 tisíc ľudí. za deň sa ročný obrat zvýši v priemere o 2,2748 milióna rubľov.

Príklad 2.3. Použitie informácií uvedených v tabuľke. 2.2 a 2.4 odhadnite parameter jednofaktorového ekonometrického modelu

kde je stredná hodnota ročného obratu tohto obchodu, milióny rubľov; - centrovaná hodnota priemerného denného počtu návštevníkov t-tej predajne, tisíc ľudí. (pozri príklady 2.1-2.2).

Riešenie.Ďalšie informácie potrebné pre výpočty sú uvedené v tabuľke. 2.5.

Tabuľka 2.5



	-48,53	-2,40	5,7720	116,6013
	-30,20	-0,41	0,1702	12,4589
	-27,34	-1,34	1,8023	36,7084
	-27,21	0,36	0,1278	-9,7288
	-12,00	-2,11	4,4627	25,3570
	0,22	-3,14	9,8753	-0,6809
	6,72	1,71	2,9156	11,4687
	20,76	0,16	0,0348	3,2992
	22,84	-0,76	0,5814	-17,413
	22,97	3,07	9,4096	70,4503
	31,55	1,62	2,6163	51,0267
	40,26	3,27	10,6766	131,5387
Suma			48,4344	431,0566

Pomocou vzorca (2.35) dostaneme

teda

http://www.cleverstudents.ru/articles/mnk.html

Príklad.

Experimentálne údaje o hodnotách premenných X A pri sú uvedené v tabuľke.

V dôsledku ich zarovnania sa získa funkcia

Riešenie.

V našom príklade n=5. Tabuľku vypĺňame pre pohodlie výpočtu súm, ktoré sú zahrnuté vo vzorcoch požadovaných koeficientov.

Hodnoty vo štvrtom riadku tabuľky sa získajú vynásobením hodnôt v 2. riadku hodnotami v 3. riadku pre každé číslo i.

Hodnoty v piatom riadku tabuľky sa získajú umocnením hodnôt v 2. riadku pre každé číslo i.

Hodnoty v poslednom stĺpci tabuľky sú súčty hodnôt v riadkoch.

Na zistenie koeficientov používame vzorce metódy najmenších štvorcov A A b. Do nich nahradíme zodpovedajúce hodnoty z posledného stĺpca tabuľky:

teda y = 0,165 x + 2,184- požadovaná približná priamka.

Zostáva zistiť, ktorý z riadkov y = 0,165 x + 2,184 alebo lepšie aproximuje pôvodné údaje, teda odhady pomocou metódy najmenších štvorcov.

Dôkaz.

Rozdiel druhého rádu má tvar:

Teda

Preto má matica kvadratickej formy tvar

a hodnoty prvkov nezávisia od A A b.

Ukážme, že matica je pozitívne definitívna. Aby to bolo možné, uhlové maloletí musia byť pozitívne.

Uhlová moll prvého rádu . Nerovnosť je prísna, keďže body

Úvodná lekcia zadarmo;
Veľký počet skúsených učiteľov (rodinných a rusky hovoriacich);
Kurzy NIE sú na konkrétne obdobie (mesiac, šesť mesiacov, rok), ale na konkrétny počet hodín (5, 10, 20, 50);
Viac ako 10 000 spokojných zákazníkov.
Cena jednej hodiny s rusky hovoriacim učiteľom je od 600 rubľov, s rodeným hovorcom - od 1500 rubľov

Podstatou metódy najmenších štvorcov je pri hľadaní parametrov trendového modelu, ktorý najlepšie vystihuje tendenciu vývoja akéhokoľvek náhodného javu v čase alebo priestore (trend je čiara, ktorá charakterizuje tendenciu tohto vývoja). Úlohou metódy najmenších štvorcov (LSM) je nájsť nielen nejaký trendový model, ale nájsť najlepší alebo optimálny model. Tento model bude optimálny, ak súčet štvorcových odchýlok medzi pozorovanými skutočnými hodnotami a zodpovedajúcimi vypočítanými trendovými hodnotami je minimálny (najmenší):

kde je štvorcová odchýlka medzi pozorovanou skutočnou hodnotou

a zodpovedajúcu vypočítanú trendovú hodnotu,

skutočná (pozorovaná) hodnota skúmaného javu,

vypočítaná hodnota trendového modelu,

Počet pozorovaní skúmaného javu.

MNC sa samostatne používa pomerne zriedka. Spravidla sa najčastejšie používa len ako nevyhnutná technická technika v korelačných štúdiách. Malo by sa pamätať na to, že informačnou základňou OLS môže byť iba spoľahlivý štatistický rad a počet pozorovaní by nemal byť menší ako 4, inak môžu vyhladzovacie postupy OLS stratiť zdravý rozum.

Súprava nástrojov MNC sa scvrkáva na nasledujúce postupy:

Prvý postup. Ukazuje sa, či vôbec existuje tendencia meniť výsledný atribút, keď sa mení vybraný faktor-argument, alebo inými slovami, existuje spojenie medzi „ pri "A" X ».

Druhý postup. Určuje sa, ktorá línia (trajektória) môže najlepšie opísať alebo charakterizovať tento trend.

Tretí postup.

Príklad. Povedzme, že máme informácie o priemernej úrode slnečnice pre skúmanú farmu (tabuľka 9.1).

Tabuľka 9.1

Číslo pozorovania

Produktivita, c/ha

Keďže technologická úroveň produkcie slnečnice sa u nás za posledných 10 rokov prakticky nezmenila, znamená to, že kolísanie úrody v analyzovanom období zrejme veľmi záviselo od výkyvov počasia a klimatických podmienok. Je to naozaj pravda?

Prvý postup OLS. Testuje sa hypotéza o existencii trendu zmien úrod slnečnice v závislosti od zmien počasia a klimatických podmienok za analyzovaných 10 rokov.

V tomto príklade pre " r "je vhodné vziať úrodu slnečnice a pre" x » – číslo sledovaného roku v analyzovanom období. Testovanie hypotézy o existencii akéhokoľvek vzťahu medzi „ x "A" r "možno vykonať dvoma spôsobmi: manuálne a pomocou počítačových programov. Samozrejme, s dostupnosťou výpočtovej techniky sa tento problém dá vyriešiť sám. Aby sme však lepšie porozumeli nástrojom MNC, je vhodné otestovať hypotézu o existencii spojenia medzi „ x "A" r » manuálne, keď máte po ruke iba pero a obyčajnú kalkulačku. V takýchto prípadoch je hypotéza o existencii trendu najlepšie overená vizuálne umiestnením grafického obrazu analyzovanej série dynamiky - korelačného poľa:

Korelačné pole v našom príklade sa nachádza okolo pomaly rastúcej čiary. To samo osebe naznačuje existenciu určitého trendu zmien úrod slnečnice. O prítomnosti akejkoľvek tendencie nemožno hovoriť iba vtedy, keď korelačné pole vyzerá ako kruh, kruh, striktne vertikálny alebo striktne horizontálny oblak alebo pozostáva z chaoticky rozptýlených bodov. Vo všetkých ostatných prípadoch platí hypotéza o existencii vzťahu medzi „ x "A" r “ a pokračujte vo výskume.

Druhý postup OLS. Určuje sa, ktorá línia (trajektória) môže najlepšie opísať alebo charakterizovať trend zmien v úrode slnečnice za analyzované obdobie.

Ak máte výpočtovú techniku, výber optimálneho trendu prebieha automaticky. Pri „ručnom“ spracovaní sa výber optimálnej funkcie vykonáva spravidla vizuálne - umiestnením korelačného poľa. To znamená, že na základe typu grafu sa vyberie rovnica priamky, ktorá najlepšie zodpovedá empirickému trendu (skutočnej trajektórii).

Ako je známe, v prírode existuje veľké množstvo funkčných závislostí, takže je mimoriadne ťažké vizuálne analyzovať aj malú časť z nich. Našťastie v reálnej ekonomickej praxi sa dá väčšina vzťahov celkom presne opísať buď parabolou, alebo hyperbolou, alebo priamkou. V tomto ohľade sa s „manuálnou“ možnosťou výberu najlepšej funkcie môžete obmedziť iba na tieto tri modely.

		Hyperbola:

Parabola druhého rádu: :

Je ľahké si všimnúť, že v našom príklade trend zmien úrody slnečnice za analyzovaných 10 rokov najlepšie charakterizuje priamka, takže regresná rovnica bude rovnicou priamky.

Tretí postup. Vypočítajú sa parametre regresnej rovnice charakterizujúce túto čiaru, alebo inými slovami, určí sa analytický vzorec, ktorý popisuje najlepší trendový model.

Hľadanie hodnôt parametrov regresnej rovnice, v našom prípade parametrov a , je jadrom OLS. Tento proces spočíva v riešení systému normálnych rovníc.

(9.2)

Tento systém rovníc sa dá celkom jednoducho vyriešiť Gaussovou metódou. Pripomeňme, že v dôsledku riešenia sa v našom príklade nájdu hodnoty parametrov a. Nájdená regresná rovnica teda bude mať nasledujúci tvar:

Má široké využitie v ekonometrii vo forme prehľadnej ekonomickej interpretácie jej parametrov.

Lineárna regresia vedie k nájdeniu rovnice tvaru

alebo

Rovnica formulára umožňuje na základe špecifikovaných hodnôt parametrov X mať teoretické hodnoty výslednej charakteristiky, pričom do nej nahrádzajú skutočné hodnoty faktora X.

Konštrukcia lineárnej regresie spočíva v odhade jej parametrov - A A V. Odhady parametrov lineárnej regresie možno nájsť pomocou rôznych metód.

Klasický prístup k odhadu parametrov lineárnej regresie je založený na metóda najmenších štvorcov(MNC).

Metóda najmenších štvorcov nám umožňuje získať takéto odhady parametrov A A V, pri ktorej súčet štvorcových odchýlok skutočných hodnôt výslednej charakteristiky (y) z vypočítaného (teoretického) minimum:

Ak chcete nájsť minimum funkcie, musíte vypočítať parciálne derivácie pre každý z parametrov A A b a nastavte ich na nulu.

Označme S, potom:

Transformáciou vzorca získame nasledujúci systém normálnych rovníc na odhad parametrov A A V:

Riešením sústavy normálnych rovníc (3.5) buď metódou sekvenčnej eliminácie premenných alebo metódou determinantov nájdeme požadované odhady parametrov. A A V.

Parameter V nazývaný regresný koeficient. Jeho hodnota zobrazuje priemernú zmenu výsledku so zmenou faktora o jednu jednotku.

Regresná rovnica je vždy doplnená o indikátor blízkosti súvislosti. Pri použití lineárnej regresie je takýmto ukazovateľom lineárny korelačný koeficient. Existujú rôzne modifikácie vzorca koeficientu lineárnej korelácie. Niektoré z nich sú uvedené nižšie:

Ako je známe, koeficient lineárnej korelácie je v medziach: -1 ≤ ≤ 1.

Na posúdenie kvality výberu lineárnej funkcie sa vypočíta štvorec

Lineárny korelačný koeficient tzv koeficient determinácie. Koeficient determinácie charakterizuje podiel rozptylu výslednej charakteristiky y, vysvetlené regresiou v celkovom rozptyle výsledného znaku:

Podľa toho hodnota 1 charakterizuje podiel rozptylu y, spôsobené vplyvom iných faktorov nezohľadnených v modeli.

Otázky na sebaovládanie

1. Podstata metódy najmenších štvorcov?

2. Koľko premenných poskytuje párová regresia?

3. Aký koeficient určuje tesnosť súvislosti medzi zmenami?

4. V akých medziach sa určuje koeficient determinácie?

5. Odhad parametra b v korelačno-regresnej analýze?

1. Christopher Dougherty. Úvod do ekonometrie. - M.: INFRA - M, 2001 - 402 s.

2. S.A. Borodich. Ekonometria. Minsk LLC „Nové poznatky“ 2001.

3. R.U. Rakhmetova Krátky kurz ekonometrie. Študijný sprievodca. Almaty. 2004. -78 s.

4. I.I. Eliseeva. - M.: „Financie a štatistika“, 2002

5. Mesačný informačný a analytický časopis.

Nelineárne ekonomické modely. Nelineárne regresné modely. Transformácia premenných.

Nelineárne ekonomické modely..

Transformácia premenných.

Koeficient elasticity.

Ak existujú nelineárne vzťahy medzi ekonomickými javmi, potom sú vyjadrené pomocou zodpovedajúcich nelineárnych funkcií: napríklad rovnostranná hyperbola , paraboly druhého stupňa a pod.

Existujú dve triedy nelineárnych regresií:

1. Regresie, ktoré sú nelineárne vzhľadom na vysvetľujúce premenné zahrnuté v analýze, ale lineárne vzhľadom na odhadované parametre, napríklad:

Polynómy rôznych stupňov - , ;

Rovnostranná hyperbola - ;

Semilogaritmická funkcia - .

2. Regresie, ktoré sú nelineárne v odhadovaných parametroch, napríklad:

Výkon - ;

Demonštratívne - ;

Exponenciálny - .

Celkový súčet štvorcových odchýlok jednotlivých hodnôt výslednej charakteristiky pri z priemernej hodnoty je spôsobené vplyvom mnohých príčin. Podmienečne rozdeľme celý súbor dôvodov do dvoch skupín: skúmaný faktor x A iné faktory.

Ak faktor neovplyvňuje výsledok, potom je regresná čiara na grafe rovnobežná s osou Oh A

Potom je celý rozptyl výslednej charakteristiky spôsobený vplyvom iných faktorov a celkový súčet štvorcových odchýlok sa bude zhodovať so zvyškom. Ak iné faktory neovplyvňujú výsledok, potom y viazaný s X funkčne a zvyškový súčet štvorcov je nula. V tomto prípade je súčet štvorcových odchýlok vysvetlených regresiou rovnaký ako celkový súčet druhých mocnín.

Keďže nie všetky body korelačného poľa ležia na regresnej priamke, k ich rozptylu vždy dochádza v dôsledku vplyvu faktora X, teda regresia pri Autor: X, a spôsobené inými príčinami (nevysvetliteľná variácia). Vhodnosť regresnej priamky na predikciu závisí od toho, aká časť celkovej variácie znaku je pri zodpovedá vysvetlenej variácii

Je zrejmé, že ak súčet štvorcových odchýlok v dôsledku regresie je väčší ako zvyškový súčet štvorcov, potom je regresná rovnica štatisticky významná a faktor X má výrazný vplyv na výsledok u.

, t.j. s počtom voľnosti nezávislej variácie charakteristiky. Počet stupňov voľnosti súvisí s počtom jednotiek populácie n a počtom konštánt z neho určených. Vo vzťahu k skúmanému problému by počet stupňov voľnosti mal ukazovať od koľkých nezávislých odchýlok n

Posúdenie významnosti regresnej rovnice ako celku je uvedené pomocou F- Fisherovo kritérium. V tomto prípade je predložená nulová hypotéza, že regresný koeficient sa rovná nule, t.j. b = 0, a teda faktor X neovplyvňuje výsledok u.

Okamžitému výpočtu F-testu predchádza analýza rozptylu. Centrálne miesto v nej zaujíma rozklad celkového súčtu kvadrátov odchýlok premennej pri z priemernej hodnoty pri na dve časti – „vysvetlené“ a „nevysvetlené“:

Celkový súčet štvorcových odchýlok;

Súčet druhej mocniny odchýlky vysvetlenej regresiou;

Zvyškový súčet kvadrátov odchýlok.

Akýkoľvek súčet štvorcových odchýlok súvisí s počtom stupňov voľnosti , t.j. s počtom voľnosti nezávislej variácie charakteristiky. Počet stupňov voľnosti súvisí s počtom populačných jednotiek n a s počtom konštánt z nej určeným. Vo vzťahu k skúmanému problému by počet stupňov voľnosti mal ukazovať od koľkých nezávislých odchýlok n na vytvorenie daného súčtu štvorcov.

Rozptyl na stupeň voľnostiD.

F-pomery (F-test):

Ak je nulová hypotéza pravdivá, potom sa faktor a reziduálne rozptyly navzájom nelíšia. Pre H 0 je potrebné vyvrátenie, aby disperzia faktorov niekoľkonásobne prevyšovala zvyškovú disperziu. Anglický štatistik Snedekor vypracoval tabuľky kritických hodnôt F-vzťahy na rôznych úrovniach významnosti nulovej hypotézy a rôznych počtoch stupňov voľnosti. Tabuľková hodnota F-kritérium je maximálna hodnota pomeru rozptylov, ktoré môžu nastať v prípade náhodnej divergencie pre danú úroveň pravdepodobnosti prítomnosti nulovej hypotézy. Vypočítaná hodnota F-vzťahy sa považujú za spoľahlivé, ak o je väčšie ako tabuľka.

V tomto prípade sa zamietne nulová hypotéza o absencii vzťahu medzi znakmi a vyvodí sa záver o význame tohto vzťahu: F fakt > F tabuľka H0 sa zamietne.

Ak je hodnota menšia ako uvedená v tabuľke F fakt ‹, F tabuľka, potom je pravdepodobnosť nulovej hypotézy vyššia ako špecifikovaná úroveň a nemožno ju zamietnuť bez vážneho rizika vyvodenia nesprávneho záveru o prítomnosti vzťahu. V tomto prípade sa regresná rovnica považuje za štatisticky nevýznamnú. Ale nevybočuje.

Smerodajná chyba regresného koeficientu

Na posúdenie významnosti regresného koeficientu sa jeho hodnota porovnáva s jeho štandardnou chybou, t.j. určí sa skutočná hodnota t-Studentov t-test: ktorý sa potom porovnáva s tabuľkovou hodnotou na určitej hladine významnosti a počte stupňov voľnosti ( n- 2).

Štandardná chyba parametra A:

Významnosť koeficientu lineárnej korelácie sa kontroluje na základe veľkosti chyby korelačný koeficient t r:

Celkový rozptyl vlastností X:

Viacnásobná lineárna regresia

Stavba modelu

Viacnásobná regresia predstavuje regresiu efektívnej charakteristiky s dvoma alebo viacerými faktormi, teda model formy

Regresia môže poskytnúť dobré výsledky v modelovaní, ak možno zanedbať vplyv iných faktorov ovplyvňujúcich predmet štúdia. Správanie jednotlivých ekonomických premenných nie je možné kontrolovať, t. j. nie je možné zabezpečiť rovnosť všetkých ostatných podmienok na posúdenie vplyvu jedného skúmaného faktora. V takom prípade by ste sa mali pokúsiť identifikovať vplyv iných faktorov ich zavedením do modelu, t. j. zostaviť rovnicu viacnásobnej regresie: y = a+b 1 x 1 +b 2 +…+b p x p + .

Hlavným cieľom viacnásobnej regresie je zostaviť model s veľkým množstvom faktorov, pričom sa určí vplyv každého z nich samostatne, ako aj ich kombinovaný vplyv na modelovaný ukazovateľ. Špecifikácia modelu zahŕňa dva okruhy problémov: výber faktorov a výber typu regresnej rovnice