Centrální limitní věta (TCL)

Obsah:

Centrální limitní věta (TCL)
Centrální limitní věta (TCL)
Anonim

The Central Limit Theorem (TCL) je statistická teorie, která uvádí, že vzhledem k dostatečně velkému náhodnému vzorku populace bude distribuce prostředku vzorku následovat normální rozdělení.

Kromě toho TCL uvádí, že jak se zvětšuje velikost vzorku, průměr vzorku se přiblíží k průměru populace. Proto můžeme pomocí TCL definovat distribuci výběrového průměru určité populace se známou odchylkou. Distribuce tedy bude následovat normální distribuci, pokud je velikost vzorku dostatečně velká.

Hlavní vlastnosti centrální limitní věty

Centrální limitní věta má řadu velmi užitečných vlastností ve statistické a pravděpodobnostní oblasti. Mezi hlavní patří:

  • Pokud je velikost vzorku dostatečně velká, distribuce prostředku vzorku bude přibližně následovat normální distribuci. TCL považuje vzorek za velký, když je jeho velikost větší než 30. Proto je-li vzorek větší než 30, bude mít průměr vzorku distribuční funkci blízkou normální. A to platí bez ohledu na formu distribuce, se kterou pracujeme.
  • Průměr populace a průměr vzorku budou stejné. To znamená, že průměr distribuce všech průměrných vzorků se bude rovnat průměru celkové populace.
  • Rozptyl distribuce průměrů vzorku bude σ² / n. Což je rozptyl populace dělený velikostí vzorku.

To, že se distribuce prostředku vzorku podobá normálnímu, je nesmírně užitečné. Protože normální rozdělení je velmi snadné použít k provedení hypotézních testů a konstrukci intervalů spolehlivosti. Ve statistikách je normální normální distribuce, protože mnoho statistik vyžaduje tento typ distribuce. Kromě toho nám TCL umožní odvodit populační průměr prostřednictvím průměrného vzorku. A to je velmi užitečné, když kvůli nedostatku prostředků nemůžeme shromažďovat údaje od celé populace.

Příklad centrální limitní věty

Představme si, že chceme analyzovat průměrné historické výnosy indexu S&P 500, který, jak víme, má kolem 500 společností. Ale nemáme dostatek informací k tomu, abychom analyzovali všech 500 společností v indexu. V tomto případě by průměrná ziskovost S&P 500 byla průměrem populace.

Podle TCL můžeme nyní provést analýzu těchto 500 společností. Jediným omezením, které máme, je, že ve vzorku musí existovat více než 30 společností, aby mohla být věta splněna. Představme si tedy, že náhodně vybereme 50 společností z indexu a postup několikrát zopakujeme. Postup v tomto příkladu by byl následující:

  • Vybereme vzorek asi 50 společností a získáme průměrnou ziskovost celého vzorku.
  • Průběžně vybíráme 50 společností a získáváme průměrnou ziskovost.
  • Distribuce všech průměrných výnosů všech vybraných vzorků se bude blížit normálnímu rozdělení.
  • Průměrné výnosy všech vybraných vzorků se budou přibližovat průměrným výnosům celkového indexu. Jak ukazuje centrální limitní věta.

Odvozením z průměrného výnosu vzorku se tedy můžeme přiblížit průměrnému výnosu indexu.