Studentova distribuce - Co je to, definice a koncept

Obsah:

Studentova distribuce - Co je to, definice a koncept
Studentova distribuce - Co je to, definice a koncept
Anonim

Studentova t distribuce nebo t distribuce je teoretický model používaný k aproximaci momentu prvního řádu normálně distribuované populace, když je velikost vzorku malá a standardní odchylka není známa.

Jinými slovy, t-rozdělení je rozdělení pravděpodobnosti, které odhaduje hodnotu průměru malého vzorku odebraného z populace, která sleduje normální rozdělení a pro kterou neznáme jeho směrodatnou odchylku.

Doporučené články: stupně volnosti, stupně volnosti (příklad) a normální rozdělení.

Studentův t-distribuční vzorec

Vzhledem ke spojité náhodné proměnné L říkáme, že frekvenci jejích pozorování lze uspokojivě přiblížit t-rozdělení s g stupni volnosti tak, že:

Zastoupení Studentovy distribuce

Funkce hustoty distribuce t se 3 stupni volnosti (df).

Jak vidíme, reprezentace t-distribuce vypadá hodně jako normální rozdělení kromě toho, že normální rozdělení má širší ocasy a je více podepřeno. Jinými slovy, měli bychom přidat více stupňů volnosti do t-distribuce, aby distribuce „rostla“ a vypadala spíše jako normální distribuce.

Specialita

A … Proč je t-distribuce tak speciální?

Protože na rozdíl od normálního rozdělení, které závisí na střední hodnotě a rozptylu, rozdělení t závisí pouze na stupních volnosti, z angličtiny, stupně svobody (df). Jinými slovy, řízením stupňů volnosti řídíme distribuci.

Studentská aplikace

Distribuce t se používá, když:

  • Chceme odhadnout průměr normálně distribuované populace z malého vzorku.
  • Velikost vzorku je menší než 30 položek, tj. N <30.

Z 30 pozorování se t-distribuce velmi podobá normálnímu rozdělení, takže použijeme normální rozdělení.

  • Směrodatná odchylka populace není známa a musí být odhadnuta z pozorování vzorku.

Příklad

Předpokládáme, že máme 28 pozorování náhodné proměnné G, která sleduje Studentovo t rozdělení s 27 stupni volnosti (df).

Matematicky,

Protože pracujeme s reálnými daty, mezi daty a distribucí bude vždy chyba aproximace. Jinými slovy, průměr, medián a režim nebudou vždy nulové (0) nebo přesně stejné.

Frekvenci každého pozorování proměnné G reprezentujeme pomocí histogramu.

Může náhodná proměnná G aproximovat t-rozdělení?

Důvody pro zvážení, že proměnná G sleduje distribuci t:

  • Distribuce je symetrická. To znamená, že existuje stejný počet pozorování vpravo i vlevo od centrální hodnoty. Také průměr a medián mají tendenci být blízké stejné hodnotě. Průměr je přibližně nula, průměr = 0,016.
  • Pozorování s největší frekvencí nebo pravděpodobností se pohybují kolem centrální hodnoty. Pozorování s menší frekvencí nebo pravděpodobností jsou daleko od centrální hodnoty.