Jednoduchá autokorelační funkce - příklad v R

Obsah:

Jednoduchá autokorelační funkce - příklad v R
Jednoduchá autokorelační funkce - příklad v R
Anonim

Jinými slovy, funkce Simple Autocorrelation (FAS) nebo z angličtiny, Funkce autokorelace, Jedná se o matematickou funkci, která nám pomáhá zjistit, jak závislá jsou data daného období na stejných datech z předchozích období.

Generujeme roční časovou řadu X, která sleduje normální rozdělení plus setrvačnost. Můžeme také použít reálná data.

Metodologie

Programy jsou nezbytné pro práci na autokorelační analýze. Lze použít programy jako Python, ale pro statistickou analýzu a správu dat doporučujeme R nebo jeho vylepšenou verzi R Studio. Zde budeme pracovat s R.

Výpočet

A jak zapíšeme vzorec FAS do R kódu?

R i Python mají knihovny, kde jsou vzorce spojeny se jménem. Pak stačí, že jsme nainstalovali knihovnu obsahující vzorec, který chceme použít, a zavoláme ji do skriptu.

Do quionu R musíme napsat:

Funkce je to uvnitř knihovny statistiky.

X -> Časové řady, které používáme jako vzorek pro výpočet FAS.

acf (X, ylim = c (-1,1)) -> Jednoduchá autokorelační funkce na X s limity na svislé ose mezi -1 a 1, což jsou hodnoty, které může mít autokorelační koeficient.

Ověření

Tento krok není nutný, pokud jsme použili předchozí kód, protože vypočítává pásma spolehlivosti sám.

Abychom zjistili, zda jsou vypočítané autokorelační koeficienty statisticky významné, budeme muset stanovit pásma spolehlivosti s kritickými hodnotami. Tímto způsobem, vzhledem k procentuálnímu podílu významnosti, můžeme se statistickou jistotou říci, zda v datech je či není přítomna autokorelace.

Stejně jako korelační koeficient i autokorelační koeficient předpokládá normálnost, a proto vypočítáme interval spolehlivosti následovně:

Testování hypotéz definujeme jako:

Při 95% spolehlivosti s hladinou významnosti 5% najdeme v normálních tabulkách slavných 1,96. Kritická hodnota je dána:

Kde je rozptyl koeficientů dán aproximací:

I když dáme vzorec, doporučujeme použít statistické programy pro větší přesnost a rychlost.

Výsledek

Všechny řádky končící mimo pásmo spolehlivosti znamenají, že časová řada vykazuje autokorelaci v uvedeném období.

Na základě grafu tedy vidíme, že v této časové řadě existuje autokorelace v obdobích, kdy čára vyčnívá z nespojitého pásma.

První řádek, který je na 0 a vystřeluje směrem k 1, lze ignorovat, protože t musí být přísně větší než 0 a v tomto případě tomu tak není. Nemá moc smysl dělat všechny předchozí kroky, abychom poznali autokorelaci nyní s nyní, protože ji již známe: korelace proměnné sama se sebou je 1, takže již máme odpověď.