Bayesovské informační kritérium nebo Schwarzovo kritérium je metoda zaměřená na součet čtverců reziduí, aby se zjistil počet zpožděných období p které tento model minimalizují.
Jinými slovy, chceme najít minimální počet zpožděných období, které zahrneme do autoregrese, abychom nám pomohli s predikcí závislé proměnné.
Tímto způsobem budeme mít kontrolu nad počtem zpožděných období p které zahrnujeme do regrese. Když tuto optimální úroveň překročíme, Schwarzův model přestane klesat, a proto jsme dosáhli minima. To znamená, že dosáhneme počtu zpožděných období p které minimalizují Schwarzův model.
Nazývá se také Bayesovo informační kritérium (BIC).
Doporučené články: autoregrese, součet čtverců reziduí (SCE).
Bayesovské vzorec informačního kritéria
I když to na první pohled vypadá jako složitý vzorec, projdeme částmi, abychom tomu porozuměli. Nejprve musíme obecně:
- Logaritmy v obou faktorech vzorce představují okrajový účinek zahrnutí zpožděného období p více v seberegresi.
- N je celkový počet pozorování.
- Můžeme rozdělit vzorec na dvě části: levou část a pravou část.
Část vlevo:
Představuje součet čtverců zbytků (SCE) autoregresep zpožděné období děleno celkovým počtem pozorování (N).
Pro odhad koeficientů používáme běžné nejmenší čtverce (OLS). Když tedy zahrneme nová zpožděná období, lze SCE (p) pouze udržovat nebo snižovat.
Zvýšení zpožděného období v autoregrese pak způsobí:
- SCE (p): klesá nebo zůstává konstantní.
- Koeficient stanovení: zvyšuje se.
- CELKOVÝ EFEKT: nárůst zpožděného období způsobí pokles v levé části vzorce.
Nyní správná část:
(p + 1) představuje celkový počet koeficientů v autoregrese, tj. regresory s jejich zpožděnými obdobími (p) a odposlech (1).
Zvýšení zpožděného období v autoregrese pak způsobí:
- (p + 1): zvyšuje se, protože začleňujeme zpožděné období.
- CELKOVÝ EFEKT: nárůst zpožděného období způsobí nárůst v pravé části vzorce.
Praktický příklad
Předpokládáme, že chceme předpovědět cenyskipasy pro příští sezónu 2020 s 5letým vzorkem, ale nevíme, kolik zpožďovacích období použít: AR (2) nebo AR (3)?
- Stahujeme data a počítáme přirozené logaritmy cen skipasy.
1. Odhadneme koeficienty pomocí OLS a získáme:
Součet čtverců reziduí (SCE) pro AR (2) = 0,011753112
Koeficient stanovení pro AR (2) = 0,085
2. Přidáme 1 další zpožděné období, abychom viděli, jak se mění SCE:
Součet čtverců zbytků pro AR (3) = 0,006805295
Koeficient stanovení pro AR (3) = 0,47
Vidíme, že když do autoregrese přidáme zpožděné období, koeficient stanovení se v tomto případě zvýší a SCE se sníží.
- Vypočítáme Bayesovské informační kritérium:
Čím menší je model BIC, tím výhodnější je model. Pak by AR (3) byl preferovaným modelem vzhledem k AR (2), protože jeho koeficient stanovení je vyšší, SCE je nižší a Schwarzův model nebo Bayesovské informační kritérium je také nižší.