Statistická normalizace - co to je, definice a pojem

Statistická normalizace je měřítková transformace distribuce proměnné, aby bylo možné provádět srovnání s ohledem na množiny prvků a průměr eliminováním účinků vlivů.

Jinými slovy, normalizace jsou proporce bez měrných jednotek (bezrozměrné nebo neměnné měřítko), které nám umožňují porovnat prvky různých proměnných a různých měrných jednotek.

Ve statistice a ekonometrii se standardizované tabulky rozdělení pravděpodobnosti používají k nalezení pravděpodobnosti, kterou pozorování získá, vzhledem k distribuční funkci, kterou proměnná následuje.

Je důležité neomezovat normalizační termín pouze na množiny prvků, kde je normální rozdělení dobré přiblížení jejich frekvenci.

Statistická proměnná

Stůl

V následující tabulce jsou uvedeny nejběžnější standardizace ve statistikách aplikovaných na finance a ekonomiku.

  • Typizované nebo standardní skóre normalizuje chyby, když můžeme vypočítat parametry vzorku.
  • Normalizace ve Studentově t rozdělení normalizuje rezidua, když parametry nejsou známy, a provedeme odhad, abychom je získali.
  • Variační koeficient používá průměr jako měřítko, na rozdíl od standardizovaného skóre a Studentova t, které používají směrodatnou odchylku. Distribuce je normalizována pro Poissonovo a exponenciální rozdělení.
  • Standardizovaný moment lze použít na jakékoli rozdělení pravděpodobnosti, které má funkci generující moment. Jinými slovy, že integrály momentů jsou konvergentní.

Aplikace

Kolikrát jsme četli, že normální rozdělení pravděpodobnosti se jeví jako dostatečně dobré přiblížení četnosti pozorování a jsme požádáni, abychom zjistili pravděpodobnost, že proměnná X nabere určitou hodnotu?

Jinými slovy, nastavíme X ~ N (μ, σ2) a jsme požádáni, abychom našli P (X ≤ xi)

Víme, že najít P (X ≤ xi), musíme vyhledat pravděpodobnost v tabulkách rozdělení pravděpodobnosti. V tomto případě v tabulkách rozdělení normálního rozdělení. Nejčastěji používané tabulky rozdělení pravděpodobnosti v ekonometrii a kvantitativním financování jsou: chi-square, Student's t, Fisher-Snedecor's F, Poisson, exponential, cauchy, and the standard normal.

Pravděpodobnosti vypočítané v distribučních tabulkách splňují vlastnost:

To znamená, že pravděpodobnosti (čísla v tabulce) jsou typizovaná. Poté budeme muset také zadat naši proměnnou podle parametrů distribuční funkce, pokud chceme zjistit pravděpodobnost P (X ≤ xi).

Praktický příklad

Chceme vědět pravděpodobnost, že počet lyžařů, kteří v pátek ráno lyžují, je 288.

Lyžařské středisko nám říká, že frekvence proměnné lyžaři se může přiblížit normálnímu rozložení střední hodnoty 280 a rozptylu 16.

Takže máme:

X ~ N (μ, σ2)

kde X je definována jako proměnná „lyžaři“

Ptají se nás na pravděpodobnost, že počet lyžařů, kteří se chystají v pátek lyžovat, je menší nebo roven 288. To je:

P (X ≤ 288)

Proces

Abychom zjistili pravděpodobnost, že se počet lyžařů rovná 288, musíme nejprve zadat proměnnou.

Pak se podíváme na distribuční tabulku spojitého standardního normálu:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Pravděpodobnost, že v pátek ráno půjde lyžovat 288 lyžařů, je 97,72% vzhledem k průměrným a variačním parametrům.

Vám pomůže rozvoji místa, sdílet stránku s přáteli

wave wave wave wave wave