Gauss-Markovova věta je soubor předpokladů, které musí splňovat odhadce OLS (Ordinary Least Squares), aby jej bylo možné považovat za ELIO (Optimal Linear Nestranný odhad). AGauss-Markovovu větu formulovali Carl Friederich Gauss a Andrej Markov.
Carl Friederich Gauss a Andréi Márkov stanovili určité předpoklady, aby se odhadovatel OLS mohl stát ELIO.
Pokud je těchto 5 předpokladů splněno, můžeme potvrdit, že odhad je ten s minimální odchylkou (nejpřesnější) všech lineárních a nezaujatých odhadů. V případě, že některý z předpokladů prvních tří selže (Linearita, Nulová střední přísná exogenita nebo Žádná dokonalá multicolinearita), odhad OLS již není nezaujatý. Pokud selže pouze 4 nebo 5 (homoscedasticita a žádná autokorelace), odhad je stále lineární a nezaujatý, ale již není nejpřesnější. Shrneme-li, Gauss-Markovova věta uvádí, že:
- Za předpokladu 1, 2 a 3 je odhad OLS lineární a nestranný. Nyní, pokud jsou splněny první tři předpoklady, lze zajistit, že odhadce bude nestranný. Aby byl odhad konzistentní, musíme mít velký vzorek, čím více, tím lépe.
- Za předpokladu 1, 2, 3, 4 a 5 je odhad OLS lineární, nestranný a optimální (ELIO).
Předpoklady Gauss-Markovovy věty
Konkrétně existuje 5 předpokladů:
1. Lineární model v parametrech
Je to poměrně flexibilní předpoklad. Umožňuje používat funkce sledovaných proměnných.
2. Nulová průměrnost a přísná exogenita
Znamená to, že střední hodnota chyby podmíněné vysvětlením se rovná bezpodmínečné očekávané hodnotě a rovná se nule. Přísná exogenita navíc vyžaduje, aby chyby modelu nebyly korelovány s žádnými pozorováními.
Null znamená:
Přísná exogenita:
Nulová střední hodnota a přísná exogenita selžou, pokud:
- Model je špatně specifikován (například vynechání příslušných proměnných).
- V proměnných jsou chyby měření (data nebyla zkontrolována).
- V časových řadách striktní exogenita selhává v modelech opožděné endogenity (i když může existovat současná exogenita) a v případech, kdy existují účinky zpětné vazby.
V průřezových datech je mnohem snazší dosáhnout předpokladu exogenity než v případě časových řad.
3. Žádná přesná multicollinearita
Ve vzorku není žádná z vysvětlujících proměnných konstantní. Mezi vysvětlujícími proměnnými neexistují přesné lineární vztahy. Nevylučuje to nějakou (ne dokonalou) korelaci mezi proměnnými. Podle Gaussa a Markova, když má model přesnou multicollinearitu, je to obvykle kvůli chybě analytika.
4. Homoscedasticita
Rozptyl chyby, a tedy Y, je nezávislý na vysvětlujících hodnotách a navíc na rozptylu konstantní chyby. Matematicky je to vyjádřeno jako:
Zde je řada dat s homoscedastickým vzhledem.
5. Žádná autokorelace
Chybové podmínky dvou různých pozorování podmíněných X jsou nesouvisející. Pokud je vzorek náhodný, nedojde k žádné autokorelaci.
Kde musím mít jinou hodnotu než h. Pokud je vzorek náhodný, budou data a chyby pozorování „i“ a „h“ nezávislé pro jakoukoli dvojici pozorování „i“ a „h“.