Stupně svobody - co to je, definice a pojem

Obsah:

Anonim

Stupně volnosti jsou kombinací počtu pozorování v datové sadě, která se mění náhodně a nezávisle po odečtení pozorování podmíněných těmito libovolnými hodnotami.

Jinými slovy, stupně volnosti jsou počet čistě volných pozorování (které se mohou lišit), když odhadujeme parametry.

Hlavně rozlišujeme mezi statistikami, které používají populační a vzorové parametry ke zjištění jejich stupňů volnosti. Diskutujeme o rozdílech mezi průměrem a směrodatnou odchylkou, když jsou parametry populace nebo vzorek:

Populace a parametry vzorku

  • Populační parametry:

Protože v populacích neznáme všechny hodnoty, stupně volnosti budou všechny prvky populace: N.

Obě statistiky umožňují, aby všechna pozorování v sadě byla náhodná, a proto pokaždé, když odhadneme statistiku, získáme různé výsledky. Pozorování, která mají plné právo měnit, jsou pak všechna pozorování souboru populace. Jinými slovy, stupně volnosti jsou v tomto případě všechny prvky populace: N. Z tohoto důvodu vydělíme obě statistiky celkovou velikostí populace (N).

  • Ukázkové parametry (odhady):

Ve vzorcích známe všechny hodnoty.

Rozlišujeme velikost populace (N) velikostí vzorku (n).

Protože známe všechny hodnoty ve vzorcích, nemáme problém vypočítat průměr, protože umožňuje, aby všechna pozorování v sadě byla náhodná.

V případě směrodatné odchylky zavedeme omezení stupňů volnosti: všechny prvky vzorku (n) a odečteme 1 prvek.

Ale … Proč odebereme od vzorku (n) pouze 1 a ne 5 nebo 10 prvků?

Čím více prvků odečteme, znamená to, že čím více informací o parametru vzorku máme, v tomto případě standardní odchylka.

Čím více informací máme, tím méně volnosti (stupňů volnosti) musí mít vzorkovaná pozorování náhodné hodnoty. Čím více prvků odebereme ze vzorku, tím větší omezení ukládáme a tím méně stupňů volnosti bude mít parametr vzorku.

Příklad

Předpokládáme, že pojedeme do Andorry na finále světového poháru v lyžování, protože máme opravdu rádi alpské lyžování. Přinášíme mapu, která nám řekne, kde se nacházejí různé disciplíny a jméno některých soutěžících, ale startovní číslo každého účastníka není uvedeno. Pokaždé, když řeknou jméno konkurenta, poškrábáme jeho jméno. Vzhledem k tomu, že seznam soutěžících je omezený, dojde k bodu, že budeme znát jméno soutěžícího, než ho oznámí přes reproduktory.

Analyzujeme kroniku z matematického hlediska:

  • Velikost vzorku (n), protože nám sdělují pouze jméno některých účastníků.
  • Každý účastník může startovat náhodně, na pořadí nezáleží a nemůže znovu soutěžit (kombinace bez opakování).
  • Posledním účastníkem bude známý prvek (n-1). Pak mohou všichni ostatní účastníci náhodně vyjít, kromě posledního, o kterém víme jistě.

Přečtěte si příklad stupňů volnosti