Vlastnosti odhadů jsou vlastnosti, které mohou mít, a které slouží k výběru těch, které jsou schopny přinést dobré výsledky.
Začneme definováním pojmu odhadce, řekneme, že vzhledem k libovolnému náhodnému vzorku (x1, X2, X3,…, Xn) odhad představuje populaci, která závisí na φ parametru, který neznáme.
Tento parametr, který označujeme řeckým písmenem fi (φ), může být například průměrem libovolné náhodné proměnné.
Matematicky jeden parametr Q odhad je závislý na náhodných pozorováních ve vzorku (x1, X2, X3,…, Xn) a známá funkce (h) vzorku. Odhadovač (Q) bude náhodná proměnná, protože závisí na vzorku, který obsahuje náhodné proměnné.
Q = h (x1, X2, X3,…, Xn)
Nestrannost odhadce
Q odhadce φ je nestranný odhad, pokud E (Q) = φ pro všechny možné hodnoty φ. Definujeme E (Q) jako očekávanou hodnotu nebo očekávání odhadce Q.
V případě zkreslených odhadů by toto zkreslení bylo reprezentováno jako:
Bias (Q) = E (Q) - φ
Vidíme, že zkreslení je rozdíl mezi očekávanou hodnotou odhadce, E (Q), a skutečnou hodnotou parametru populace, φ.
Bodový odhadÚčinnost odhadce
Ano Q1 a Q2 jsou dva nezaujaté odhady φ, jejich vztah s Q bude efektivní2 když Var (Q1) ≤ Var (Q2) pro jakoukoli hodnotu φ, pokud je statistický vzorek φ přísně větší než 1, n> 1. Kde Var je rozptyl an je velikost vzorku.
Intuitivně řečeno, za předpokladu, že máme dva odhady s objektivní vlastností, můžeme říci, že jeden (Q1) je účinnější než jiné (Q2) pokud je variabilita výsledků jednoho (Q1) je menší než u ostatních (Q2). Je logické si myslet, že jedna věc, která se liší více než jiná, je méně „přesná“.
Proto můžeme toto kritérium použít pro výběr odhadů, pouze když jsou nestranné. V předchozím prohlášení, když definujeme účinnost, již předpokládáme, že odhady musí být nestranné.
Chcete-li porovnat odhady, které nemusí být nutně nestranné, to znamená, že může existovat zkreslení, doporučuje se vypočítat střední chybu čtverce (MSE) odhadů.
Pokud je Q odhadem φ, pak je ECM Q definována jako:
Střední kvadratická chyba (MSE) vypočítá průměrnou vzdálenost, která existuje mezi očekávanou hodnotou odhadce vzorku Q a odhadcem populace. Kvadratická forma ECM je způsobena skutečností, že chyby mohou být ve výchozím nastavení záporné nebo nadměrné kladné s ohledem na očekávanou hodnotu. Tímto způsobem bude ECM vždy počítat kladné hodnoty.
ECM závisí na rozptylu a zkreslení (pokud existují), což nám umožňuje porovnat dva odhady, když je jeden nebo oba zkreslené. Ten, jehož NDE je větší, bude chápán jako méně přesný (má více chyb), a proto méně účinný.
Konzistence odhadce
Konzistence je asymptotická vlastnost. Tato vlastnost se podobá vlastnosti účinnosti s tím rozdílem, že konzistence měří pravděpodobnou vzdálenost mezi hodnotou odhadce a skutečnou hodnotou parametru populace, jak se velikost vzorku zvyšuje na neurčito. Toto neurčité zvětšení velikosti vzorku je základem asymptotické vlastnosti.
K provedení asymptotické analýzy existuje minimální rozměr vzorku (při zvyšování vzorku zkontrolujte konzistenci odhadce). Velké aproximace vzorků fungují dobře pro vzorky přibližně 20 pozorování (n = 20). Jinými slovy, chceme vidět, jak se odhadovatel chová, když zvětšíme vzorek, ale toto zvýšení má sklon k nekonečnu. Vzhledem k tomu provedeme aproximaci a z 20 pozorování ve vzorku (n ≥ 20) je vhodná asymptotická analýza.
Matematicky definujeme Q1n jako odhadce φ z libovolného náhodného vzorku (x1, X2, X3,…, Xn) velikosti (n). Můžeme tedy říci, že Qn je konzistentní odhadce φ, pokud:
To nám říká, že rozdíly mezi odhadcem a jeho populační hodnotou | Qn - φ |, musí být větší než nula. Z tohoto důvodu to vyjadřujeme v absolutní hodnotě. Pravděpodobnost tohoto rozdílu má tendenci k 0 (zmenšuje se a zmenšuje), když velikost vzorku (n) má sklon k nekonečnu (zvětšuje se a zvětšuje se).
Jinými slovy, je stále méně pravděpodobné, že Qn když se zvětší velikost vzorku, pohybuje se příliš daleko od φ.