Dostatečná statistika - co to je, definice a koncept

Obsah:

Anonim

Dostatečnou statistikou pro parametr Θ je statistika schopná shromáždit nebo shrnout všechny informace, které obsahuje vzorek náhodné proměnné X.

Víme, že statistika je skutečnou funkcí vzorku. To znamená, že přebírá skutečné hodnoty obsažené ve vzorku. Odtud, jak jsme viděli v článku, ve kterém je definován koncept statistiky, musíme zajistit, aby statistik měl určité vlastnosti. Proč požadovat takové vlastnosti? Aby byla zajištěna užitečnost statistik pro naše účely.

Jednou z těchto vlastností je dostatečnost. Mnohem jednodušším způsobem řekneme, že statistika je dostačující, pokud využívá všechny informace obsažené ve vzorku.

Jak zjistit, zda stačí statistika?

Logicky vyvstává otázka: Jak mohu zjistit, zda statistika T splňuje vlastnost dostatečnosti? Nebo Jak najdu, pokud existuje, statistiku, která splňuje vlastnost dostatečnosti. Odpověď na tyto dvě otázky lze nalézt ve dvou větách:

  • Kritérium faktorizace Fisher-Neyman: Toto kritérium uvádí, že při dané statistice T, pokud splňuje určité podmínky, bude to dostatečná statistika.
  • Darmoisova věta: Tato věta odpovídá na druhou otázku. To znamená, že nám umožňuje najít dostatečnou statistiku pomocí řady postupů.

Příklad dostatečné statistiky

Předpokládejme, že chceme vypočítat průměrný roční příjem rodin s bydlištěm v Chile. K tomu použijeme následující postup:

  1. Shromáždit informace (ukázka): Protože se nemůžeme zeptat každé rodiny žijící v Chile, kolik ročně vydělají, vezmeme reprezentativní vzorek například 1 000 rodin.
  2. Určete studovanou náhodnou proměnnou: Studovanou náhodnou veličinou je rodinný příjem. Tedy: X → Rodinný příjem
  3. Zvolte správnou statistiku: Vhodná statistika pro výpočet průměrného příjmu není nic jiného než očekávání X. Jinými slovy, průměr vzorku X.
  4. Jak mohu vědět, zda je statistika průměrného vzorku dostatečná? Protože již máme matematické vyjádření statistiky, použijeme Fisherovo-Neymanovo faktoringové kritérium. Nebo Darmoisova věta. Jsou to vzorce vytvořené pro tento účel.

Po použití správných výpočtů jsme dospěli k závěru, že statistika průměrného vzorku splňuje požadavek nebo vlastnost dostatečnosti. Zajištěním toho, že splňuje tento požadavek, zajišťujeme, aby tato (statistická) funkce, která nám umožňuje syntetizovat informace (průměrný příjem), využívala všechny informace obsažené ve vzorku (1 000 rodin).

Proč je důležité, abych použil všechny informace ve vzorku?

Nyní, když víme, že průměr vzorku je dostatečná statistika, předpokládejme případ. Jaký by měl smysl chtít vypočítat průměrný příjem na základě těchto 1000 chilských rodin a že použijeme pouze údaje 500 rodin?

Samozřejmě by to nedávalo smysl. Chceme shrnutí všech informací. To je to, co jsme definovali jako dostatečnou statistiku.