Regresná analýza dát v exceli. Koeficient determinácie

  • 13.09.2019

Balík MS Excel vám umožňuje vykonať väčšinu práce veľmi rýchlo pri zostavovaní lineárnej regresnej rovnice. Je dôležité pochopiť, ako interpretovať výsledky.

Na fungovanie vyžaduje doplnok Analytický balík, ktorý musí byť povolený v položke menu Služba\Doplnky

Ak chcete v Exceli 2007 povoliť analytický balík, kliknite na položku Prejsť na blok Možnosti programu Excel kliknutím na tlačidlo v ľavom hornom rohu a potom na tlačidlo " Možnosti programu Excel» v spodnej časti okna:



Ak chcete vytvoriť regresný model, vyberte položku Služba\Analýza údajov\Regresia. (V Exceli 2007 je tento režim v Údaje/analýza údajov/regresia). Zobrazí sa dialógové okno, ktoré je potrebné vyplniť:

1) Interval vstupu Y¾ obsahuje odkaz na bunky, ktoré obsahujú hodnoty výsledného atribútu r. Hodnoty musia byť v stĺpci;

2) Interval vstupu X¾ obsahuje odkaz na bunky, ktoré obsahujú hodnoty faktorov. Hodnoty musia byť v stĺpcoch;

3) Podpíšte sa Tagy nastaviť, ak prvé bunky obsahujú vysvetľujúci text (označenie údajov);

4) Úroveň spoľahlivosti¾ je úroveň spoľahlivosti, ktorá sa štandardne považuje za 95 %. Ak vám táto hodnota nevyhovuje, musíte túto funkciu povoliť a zadať požadovanú hodnotu;

5) Podpíšte sa Nulová konštanta je zahrnutá, ak je potrebné zostrojiť rovnicu, v ktorej je voľná premenná ;

6) Možnosti výstupu určiť, kde majú byť výsledky umiestnené. Predvolený režim zostavenia Nový pracovný list;

7) Blokovať Zvyšky umožňuje zahrnúť výstup rezíduí a konštrukciu ich grafov.

V dôsledku toho sa zobrazia informácie, ktoré obsahujú všetky potrebné informácie a sú zoskupené do troch blokov: Regresná štatistika, Analýza rozptylu, Výber zostatku. Zvážme ich podrobnejšie.

1. Regresná štatistika:

viacnásobné R je definovaný vzorcom ( Pearsonov korelačný koeficient);

R (koeficient determinácie);

Normalizované R-štvorec sa vypočíta podľa vzorca (používa sa na viacnásobnú regresiu);

štandardná chyba S vypočítané podľa vzorca ;

Pozorovania ¾ je množstvo údajov n.

2. Analýza rozptylu, riadok Regresia:

Parameter df rovná sa m(počet súborov faktorov X);

Parameter SS je určený vzorcom ;

Parameter PANI je určený vzorcom ;

Štatistiky F je určený vzorcom ;

Význam F. Ak výsledné číslo presiahne , potom je hypotéza prijatá (bez lineárneho vzťahu), v opačnom prípade je hypotéza prijatá (existuje lineárny vzťah).


3. Analýza rozptylu, riadok Zvyšok:

Parameter df rovná sa ;

Parameter SS sa určuje podľa vzorca ;

Parameter PANI sa určuje podľa vzorca .

4. Analýza rozptylu, riadok Celkom obsahuje súčet prvých dvoch stĺpcov.

5. Analýza rozptylu, riadok Priesečník Y obsahuje hodnotu koeficientu , smerodajnú chybu a t-štatistika.

P-hodnota ¾ je hodnota hladín významnosti zodpovedajúcich vypočítaným t- štatistici. Určené ŠTUDISTOM( t-štatistika; ). Ak P-hodnota presahuje , potom je príslušná premenná štatisticky nevýznamná a môže byť z modelu vylúčená.

spodných 95 % a 95 % najlepších¾ sú dolné a horné hranice 95-percentného intervalu spoľahlivosti pre koeficienty teoretickej lineárnej regresnej rovnice. Ak bola v bloku zadávania údajov štandardne ponechaná hodnota pravdepodobnosti spoľahlivosti, posledné dva stĺpce budú duplikovať predchádzajúce. Ak používateľ zadal vlastnú hodnotu spoľahlivosti, potom posledné dva stĺpce obsahujú hodnoty dolnej a hornej hranice pre zadanú úroveň spoľahlivosti.

6. Analýza rozptylu, riadky obsahujú hodnoty koeficientov, štandardné chyby, t- štatistik, P-hodnoty a intervaly spoľahlivosti pre zodpovedajúce .

7. Blokovať Výber zostatku obsahuje predpovedané hodnoty r(v našom zápise je to ) a zvyšky .

Pre štatistické modely je v mnohých prípadoch potrebné určiť presnosť prognózy. Robí sa to pomocou špeciálnych výpočtov v programe Microsoft Excel a použije sa koeficient determinácie. Označuje sa ako R^2.

Štatistické modely možno rozdeliť do kvalitatívnych úrovní v závislosti od koeficientu. Kvalitné modely sú od 0,8 do 1, kvalitné modely majú úroveň od 0,5 do 0,8 a nízka kvalita má rozsah od 0 do 0,5.

Metóda na určenie presnosti pomocou funkcie QVPIRSON

V lineárnej funkcii sa koeficient determinácie bude rovnať druhej mocnine korelačného koeficientu. Dá sa vypočítať pomocou špeciálnej funkcie. Najprv si vytvoríme tabuľku s údajmi.

Potom je potrebné vybrať miesto, kde sa zobrazí výsledok výpočtu, a kliknúť na tlačidlo funkcie vložiť.

Potom sa otvorí špeciálne okno. Musíte vybrať kategóriu "Statistical" a vybrať QVPIRSON. Táto funkcia umožňuje určiť korelačný koeficient vzhľadom na Pearsonovu funkciu, respektíve druhú mocninu korelačného koeficientu = koeficient determinácie.

Po potvrdení akcie sa zobrazí okno, v ktorom je potrebné v poliach nastaviť "Známe hodnoty X" a "Známe hodnoty Y". Klikneme myšou na pole „Známe hodnoty Y“ a v pracovnom okne vyberieme údaje stĺpca Y. To isté urobíme s druhým poľom, pričom vyberieme údaje z tabuľky X.

V dôsledku týchto akcií sa zobrazí hodnota koeficientu determinácie v bunke, ktorá bola predtým vybratá na zobrazenie výsledku.

Určenie koeficientu determinácie, ak funkcia nie je lineárna.

Ak je funkcia nelineárna, potom vám súprava nástrojov Excel umožňuje vypočítať koeficient aj pomocou nástroja Regresia. Nájdete ho v balíku analýzy údajov. Najprv však musíte tento balík aktivovať tak, že prejdete do sekcie „Súbor“ a v zozname otvoríte „Možnosti“.

Potom sa vám zobrazí nové okno, v ktorom musíte z ponuky vybrať „Doplnky“ a v špeciálnom poli na správu doplnkov vyberte „Doplnky Excelu“ a prejdite na ne.

Po prechode na doplnky Excelu sa zobrazí nové okno. V ňom môžete vidieť doplnky, ktoré má používateľ k dispozícii. Začiarknite políčko vedľa položky „Analytický balík“ a potvrďte akciu.

Nájdete ho v sekcii "Údaje", po prejdení do ktorej klikneme na "Analýza údajov" na pravej strane obrazovky.

Po jej otvorení vyberte v zozname "Regresia" a potvrďte akciu.

Potom sa zobrazí nové okno, v ktorom môžete vykonať nastavenia. Vstupné údaje umožňujú nastaviť hodnotu intervalov X a Y, stačí vybrať zodpovedajúce bunky argumentov iného argumentu. V poli úrovne spoľahlivosti môžete nastaviť požadovaný indikátor. Možnosti výstupu vám umožňujú určiť, kde sa zobrazí výsledok. Ak napríklad vyberiete zobrazenie na aktuálnom hárku, musíte najskôr vybrať položku „Interval výstupu“ - a kliknúť na oblasť hlavného okna, kde sa v budúcnosti zobrazí výsledok a súradnice buniek sa zobrazia v príslušnom poli. Na konci akciu potvrdíme.

Výsledok sa zobrazí v pracovnom okne. Keďže počítame koeficient determinácie, potrebujeme vo výsledkoch R-koeficient. Ak sa pozriete na hodnotu, môžete vidieť, že ide o najlepšiu kvalitu.

Metóda stanovenia koeficientu determinácie pre trendovú čiaru

Po vytvorení tabuľky so zodpovedajúcimi hodnotami vytvoríme graf. Ak chcete na ňu nakresliť trendovú čiaru, musíte kliknúť na graf, konkrétne na oblasť, kde sa čiara vytvára. Na paneli s nástrojmi v hornej časti vyberte časť „Rozloženie“ a v nej vyberte „Trendová čiara“. Potom v kontexte tohto príkladu vyberte zo zoznamu "Exponenciálna aproximácia".

Trendová čiara sa na grafe zobrazí ako krivka s čiernou farbou.

Ak chcete zobraziť koeficient determinácie, musíte kliknúť pravým tlačidlom myši na čiernu krivku a v zozname vybrať „Formát čiary trendu“.

Potom sa zobrazí nové okno. V ňom musíte začiarknuť políčko a vybrať požadovanú akciu (zobrazenú na snímke obrazovky). Vďaka tomu sa koeficient zobrazí na grafe. Po vykonaní tohto kroku zatvorte okno.

Po zatvorení okna formátu trendovej čiary môžete v pracovnom okne vidieť hodnotu determinačného koeficientu.

Ak používateľ potrebuje iný typ trendovej čiary, môžete si ju vybrať v okne „Formát trendovej čiary“. Nezabudnite ho nastaviť skôr pri vytváraní trendovej čiary v sekcii „Rozloženie“ alebo v kontextovom menu. Tiež nezabudnite zaškrtnúť políčko pre funkciu R^2.

V dôsledku toho môžete vidieť zmenu trendovej čiary a čísla spoľahlivosti.

Po prezretí rôznych variácií trendových čiar môže užívateľ určiť tú najvhodnejšiu pre seba, pretože indikátor spoľahlivosti sa môže líšiť v závislosti od výberu čiary. Maximálny koeficient je jedna, čo znamená maximálnu spoľahlivosť, no túto hodnotu nie je možné vždy dosiahnuť.

Zvažovalo sa teda niekoľko spôsobov, ako nájsť koeficient determinácie. Používateľ si môže vybrať to najoptimálnejšie pre svoje účely.

Regresná a korelačná analýza - štatistické metódy výskumu. Toto sú najbežnejšie spôsoby zobrazenia závislosti parametra od jednej alebo viacerých nezávislých premenných.

Nižšie na konkrétnych praktických príkladoch zvážime tieto dve medzi ekonómami veľmi obľúbené analýzy. Uvedieme aj príklad získania výsledkov pri ich kombinácii.

Regresná analýza v Exceli

Zobrazuje vplyv niektorých hodnôt (nezávislých, nezávislých) na závislú premennú. Napríklad ako závisí počet ekonomicky aktívneho obyvateľstva od počtu podnikov, miezd a iných parametrov. Alebo: ako vplývajú na úroveň HDP zahraničné investície, ceny energií atď.

Výsledok analýzy vám umožňuje určiť priority. A na základe hlavných faktorov predvídať, plánovať rozvoj prioritných oblastí, prijímať manažérske rozhodnutia.

Regresia sa deje:

  • lineárny (y = a + bx);
  • parabolický (y = a + bx + cx 2);
  • exponenciálna (y = a * exp(bx));
  • mocnina (y = a*x^b);
  • hyperbolický (y = b/x + a);
  • logaritmické (y = b * ln(x) + a);
  • exponenciálna (y = a * b^x).

Zvážte príklad vytvorenia regresného modelu v Exceli a interpretácie výsledkov. Zoberme si lineárny typ regresie.

Úloha. V 6 podnikoch sa analyzovala priemerná mesačná mzda a počet zamestnancov, ktorí odišli. Je potrebné určiť závislosť počtu zamestnancov na dôchodku od priemernej mzdy.

Lineárny regresný model má nasledujúci tvar:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Kde a sú regresné koeficienty, x sú ovplyvňujúce premenné a k je počet faktorov.

V našom príklade je Y indikátorom ukončenia pracovného pomeru. Ovplyvňujúcim faktorom sú mzdy (x).

Excel má vstavané funkcie, ktoré možno použiť na výpočet parametrov lineárneho regresného modelu. Ale doplnok Analysis ToolPak to urobí rýchlejšie.

Aktivujte si výkonný analytický nástroj:

Po aktivácii bude doplnok dostupný na karte Údaje.

Teraz sa budeme zaoberať priamo regresnou analýzou.



V prvom rade venujeme pozornosť R-štvorcu a koeficientom.

R-štvorec je koeficient determinácie. V našom príklade je to 0,755 alebo 75,5 %. To znamená, že vypočítané parametre modelu vysvetľujú vzťah medzi skúmanými parametrami na 75,5 %. Čím vyšší je koeficient determinácie, tým lepší je model. Dobré - nad 0,8. Slabá - menej ako 0,5 (takúto analýzu možno len ťažko považovať za primeranú). V našom príklade - "nie je to zlé".

Koeficient 64,1428 ukazuje, aké bude Y, ak sa všetky premenné v uvažovanom modeli rovnajú 0. To znamená, že hodnotu analyzovaného parametra ovplyvňujú aj iné faktory, ktoré nie sú v modeli popísané.

Koeficient -0,16285 ukazuje váhu premennej X na Y. To znamená, že priemerná mesačná mzda v rámci tohto modelu ovplyvňuje počet odchádzajúcich s váhou -0,16285 (to je malý stupeň vplyvu). Znamienko „-“ označuje negatívny vplyv: čím vyšší plat, tým menej výpovede. Čo je spravodlivé.



Korelačná analýza v Exceli

Korelačná analýza pomáha určiť, či existuje vzťah medzi ukazovateľmi v jednej alebo dvoch vzorkách. Napríklad medzi prevádzkovou dobou stroja a nákladmi na opravy, cenou zariadenia a dobou prevádzky, výškou a hmotnosťou detí atď.

Ak existuje vzťah, potom či zvýšenie jedného parametra vedie k zvýšeniu (pozitívna korelácia) alebo zníženiu (negatívnemu) druhého. Korelačná analýza pomáha analytikovi určiť, či hodnota jedného ukazovateľa môže predpovedať možnú hodnotu iného ukazovateľa.

Korelačný koeficient sa označuje r. Pohybuje sa od +1 do -1. Klasifikácia korelácií pre rôzne oblasti bude odlišná. Keď je hodnota koeficientu 0, medzi vzorkami neexistuje lineárny vzťah.

Zvážte, ako použiť Excel na nájdenie korelačného koeficientu.

Funkcia CORREL sa používa na nájdenie párových koeficientov.

Úloha: Zistite, či existuje vzťah medzi dobou prevádzky sústruhu a nákladmi na jeho údržbu.

Umiestnite kurzor do ľubovoľnej bunky a stlačte tlačidlo fx.

  1. V kategórii "Štatistické" vyberte funkciu CORREL.
  2. Argument "Pole 1" - prvý rozsah hodnôt - čas stroja: A2: A14.
  3. Argument "Pole 2" - druhý rozsah hodnôt - náklady na opravy: B2:B14. Kliknite na tlačidlo OK.

Ak chcete určiť typ pripojenia, musíte sa pozrieť na absolútne číslo koeficientu (každá oblasť činnosti má svoju vlastnú stupnicu).

Pre korelačnú analýzu viacerých parametrov (viac ako 2) je vhodnejšie použiť "Data Analysis" (doplnok "Analysis Package"). V zozname musíte vybrať koreláciu a určiť pole. Všetky.

Výsledné koeficienty sa zobrazia v korelačnej matici. Ako tento:

Korelačno-regresná analýza

V praxi sa tieto dve techniky často používajú spoločne.

Príklad:


Teraz sú viditeľné údaje z regresnej analýzy.

Regresná čiara je grafickým odrazom vzťahu medzi javmi. V Exceli môžete ľahko vytvoriť regresnú čiaru.

Na to potrebujete:

1. Otvorte program Excel

2. Vytvorte stĺpce s údajmi. V našom príklade vybudujeme regresnú líniu alebo vzťah medzi agresivitou a pochybnosťami o sebe u prvákov. Experimentu sa zúčastnilo 30 detí, údaje sú uvedené v tabuľke programu Excel:

1 stĺpec - číslo predmetu

2 stĺpec - agresivita v bodoch

3 stĺpec - nedostatok sebaúcty v bodoch

3. Potom je potrebné vybrať oba stĺpce (bez názvu stĺpca), stlačiť tabulátor vložiť , vybrať bod a z navrhovaných rozložení vyberte úplne prvé bodka s fixkami .

4. Tak sme dostali blank pre regresnú priamku - tzv. bodový diagram. Ak chcete prejsť na regresnú čiaru, musíte kliknúť na výsledný obrázok a kliknúť na kartu konštruktér, nájsť na paneli rozloženia grafov a vyberte si M a ket9 , hovorí tiež f(x)

5. Máme teda regresnú priamku. V grafe je znázornená aj jeho rovnica a druhá mocnina korelačného koeficientu

6. Zostáva doplniť názov grafu, názov osí. Ak chcete, môžete tiež odstrániť legendu, znížiť počet vodorovných čiar mriežky (karta rozloženie , potom mriežka ). Hlavné zmeny a nastavenia sa vykonávajú na karte Rozloženie

Regresná čiara je vytvorená v MS Excel. Teraz ho možno doplniť do textu práce.

Toto je najbežnejší spôsob, ako ukázať závislosť niektorej premennej od iných, napr úroveň HDP z hodnoty zahraničná investícia alebo z úverovej sadzby národnej banky alebo z ceny kľúčových energetických zdrojov.

Modelovanie vám umožňuje zobraziť veľkosť tejto závislosti (koeficienty), vďaka čomu môžete priamo predpovedať a na základe týchto predpovedí realizovať nejaký druh plánovania. Na základe regresnej analýzy je tiež možné robiť manažérske rozhodnutia zamerané na stimuláciu prioritných príčin ovplyvňujúcich konečný výsledok a samotný model pomôže tieto prioritné faktory zvýrazniť.

Všeobecný pohľad na model lineárnej regresie:

Y = a 0 + a 1 x 1 +...+ak x k

kde a - parametre (koeficienty) regresie, X - ovplyvňujúce faktory, k je počet faktorov modelu.

Počiatočné údaje

Medzi počiatočnými údajmi potrebujeme určitý súbor údajov, ktorý by pozostával z niekoľkých po sebe nasledujúcich alebo vzájomne prepojených hodnôt konečného parametra Y (napríklad HDP) a rovnakého počtu hodnôt ukazovateľov, ktorých vplyv študujeme ( napríklad zahraničné investície).

Vyššie uvedený obrázok ukazuje tabuľku s rovnakými počiatočnými údajmi, Y je ukazovateľ ekonomicky aktívneho obyvateľstva a počet podnikov, výška investícií do kapitálu a príjmy obyvateľstva sú ovplyvňujúce faktory, teda x.

Z obrázku je tiež možné urobiť mylný záver, že pri modelovaní môžeme hovoriť len o dynamických radoch, teda o momentových radoch fixovaných sekvenčne v čase, ale nie je to tak, s rovnakým úspechom je možné modelovať v kontext štruktúry, napríklad hodnoty uvedené v tabuľke možno rozdeliť nie podľa rokov, ale podľa regiónov.

Na zostavenie adekvátnych lineárnych modelov je žiaduce, aby počiatočné dáta nemali silné poklesy alebo kolapsy, v takýchto prípadoch je žiaduce vykonať vyhladzovanie, ale o vyhladzovaní si povieme nabudúce.

Analytický balík

Parametre lineárneho regresného modelu je možné vypočítať aj manuálne pomocou metódy najmenších štvorcov (OLS), čo je však časovo dosť náročné. O niečo rýchlejšie sa to dá vypočítať pomocou rovnakej metódy pomocou vzorcov v Exceli, kde program urobí výpočty sám, ale aj tak musíte vzorce zadávať ručne.

Excel má doplnok Analytický balík, čo je dosť silný nástroj na pomoc analytikom. Táto sada nástrojov je okrem iného schopná vypočítať regresné parametre podľa rovnakého OLS len niekoľkými kliknutiami, v skutočnosti sa bude diskutovať o tom, ako ďalej používať tento nástroj.

Aktivácia analytického balíka

V predvolenom nastavení je tento doplnok zakázaný a nenájdete ho v ponuke kariet, poďme sa teda pozrieť krok za krokom, ako ho aktivovať.

V Exceli vľavo hore aktivujte kartu Súbor, v ponuke, ktorá sa otvorí, vyhľadajte položku možnosti a kliknite naň.

V okne, ktoré sa otvorí, vľavo vyhľadajte položku doplnky a aktivujte ho, v tejto záložke v spodnej časti bude rozbaľovací zoznam ovládacích prvkov, kde bude štandardne napísané Excel doplnky, napravo od rozbaľovacieho zoznamu bude tlačidlo Choď, musíte naň kliknúť.

Vyskakovacie okno vás vyzve na výber dostupných doplnkov, v ktorých musíte začiarknuť políčko vedľa Analytický balík a zároveň, pre každý prípad, Hľadanie riešenia(tiež užitočná vec), a následne výber potvrďte kliknutím na tlačidlo OK.

Pokyny na nájdenie parametrov lineárnej regresie pomocou analytického balíka

Po aktivácii doplnku Analysis Pack bude vždy dostupný na karte hlavného menu Údaje pod odkazom Analýza dát

V aktívnom okne nástroja Analýza dát zo zoznamu možností vyhľadajte a vyberte Regresia

Ďalej sa otvorí okno pre nastavenie a výber počiatočných údajov pre výpočet parametrov regresného modelu. Tu musíte špecifikovať intervaly počiatočných údajov, konkrétne opísaný parameter (Y) a faktory, ktoré ho ovplyvňujú (X), ako na obrázku nižšie, zostávajúce parametre sú v zásade voliteľné.

Po výbere zdrojových údajov a kliknutí na tlačidlo OK Excel zobrazí výpočty na novom hárku aktívneho zošita (ak to nebolo v nastaveniach nastavené inak), tieto výpočty vyzerajú takto:

Kľúčové bunky som vyplnil žltou, práve na ne si treba dávať pozor predovšetkým, dôležité sú aj ostatné parametre, no ich podrobná analýza si snáď vyžaduje samostatný príspevok.

takže, 0,865 - toto je R2- koeficient determinácie, ktorý ukazuje, že 86,5 % vypočítaných parametrov modelu, teda modelu samotného, ​​vysvetľuje závislosť a zmeny študovaného parametra - Y zo skúmaných faktorov - X. Ak je to prehnané, tak je indikátorom kvality modelu a čím vyššie, tým lepšie. Je jasné, že nemôže byť viac ako 1 a považuje sa za dobré, keď je R2 vyššie ako 0,8, a ak je menšie ako 0,5, potom možno rozumnosť takéhoto modelu bezpečne spochybniť.

Teraz prejdime k modelové koeficienty:
2079,85 - toto je - koeficient, ktorý ukazuje, čo bude Y, ak sa všetky faktory použité v modeli rovnajú 0, rozumie sa, že ide o závislosť od iných faktorov, ktoré nie sú opísané v modeli;
-0,0056 - 1- koeficient, ktorý ukazuje váhu vplyvu faktora x 1 na Y, to znamená, že počet podnikov v rámci tohto modelu ovplyvňuje ukazovateľ ekonomicky aktívneho obyvateľstva s váhou len -0,0056 (dosť malá miera vplyvu ). Znamienko mínus ukazuje, že tento vplyv je negatívny, to znamená, že čím viac podnikov, tým menej ekonomicky aktívneho obyvateľstva, bez ohľadu na to, aký paradoxný môže byť význam;
-0,0026 - a 2- koeficient vplyvu objemu investícií do kapitálu na veľkosť ekonomicky aktívneho obyvateľstva, podľa modelu je aj tento vplyv negatívny;
0,0028 - a 3- koeficient vplyvu príjmov obyvateľstva na veľkosť ekonomicky aktívneho obyvateľstva, tu je vplyv pozitívny, to znamená, že podľa modelu zvýšenie príjmov prispeje k zvýšeniu veľkosti ekonomicky aktívneho obyvateľstva.

Vypočítané koeficienty zhromažďujeme v modeli:

Y = 2079,85 - 0,0056 x 1 - 0,0026 x 2 + 0,0028 x 3

V skutočnosti ide o lineárny regresný model, ktorý vyzerá presne takto pre počiatočné údaje použité v príklade.

Modelové odhadované hodnoty a predpoveď

Ako sme diskutovali vyššie, model je zostavený nielen na zobrazenie veľkosti závislostí študovaného parametra na ovplyvňujúcich faktoroch, ale aj na to, aby bolo možné pri znalosti týchto ovplyvňujúcich faktorov urobiť predpoveď. Aby bola táto predpoveď pomerne jednoduchá, stačí do výslednej modelovej rovnice nahradiť hodnoty ovplyvňujúcich faktorov na miesto zodpovedajúcich x. Na obrázku nižšie sú tieto výpočty vykonané v Exceli v samostatnom stĺpci.

Skutočné hodnoty (tie, ktoré sa odohrali v skutočnosti) a vypočítané hodnoty pre model na rovnakom obrázku sú zobrazené vo forme grafov, aby sa znázornil rozdiel, a teda aj chyba modelu.

Opakujem ešte raz, na vytvorenie prognózy na modeli je potrebné, aby boli známe ovplyvňujúce faktory, a ak hovoríme o časovom rade a teda aj prognóze do budúcnosti, napr. rok alebo mesiac, potom nie je vždy možné vedieť, aké faktory budú ovplyvňovať práve v tejto budúcnosti. V takýchto prípadoch je tiež potrebné urobiť prognózu ovplyvňujúcich faktorov, najčastejšie sa to robí pomocou autoregresného modelu - modelu, v ktorom sú ovplyvňujúcimi faktormi skúmaný objekt a čas, teda závislosť ukazovateľa od čo to bolo v minulosti je modelované.

Ako zostaviť autoregresný model zvážime v nasledujúcom článku a teraz budeme predpokladať, že vieme, aké budú hodnoty ovplyvňujúcich faktorov v budúcom období (v príklade 2008), pričom tieto hodnoty nahradíme. do výpočtov dostaneme našu predpoveď na rok 2008.