Studentova t distribuce nebo t distribuce je teoretický model používaný k aproximaci momentu prvního řádu normálně distribuované populace, když je velikost vzorku malá a standardní odchylka není známa.
Jinými slovy, t-rozdělení je rozdělení pravděpodobnosti, které odhaduje hodnotu průměru malého vzorku odebraného z populace, která sleduje normální rozdělení a pro kterou neznáme jeho směrodatnou odchylku.
Doporučené články: stupně volnosti, stupně volnosti (příklad) a normální rozdělení.
Studentův t-distribuční vzorec
Vzhledem ke spojité náhodné proměnné L říkáme, že frekvenci jejích pozorování lze uspokojivě přiblížit t-rozdělení s g stupni volnosti tak, že:
Zastoupení Studentovy distribuce
Funkce hustoty distribuce t se 3 stupni volnosti (df).
Jak vidíme, reprezentace t-distribuce vypadá hodně jako normální rozdělení kromě toho, že normální rozdělení má širší ocasy a je více podepřeno. Jinými slovy, měli bychom přidat více stupňů volnosti do t-distribuce, aby distribuce „rostla“ a vypadala spíše jako normální distribuce.
Specialita
A … Proč je t-distribuce tak speciální?
Protože na rozdíl od normálního rozdělení, které závisí na střední hodnotě a rozptylu, rozdělení t závisí pouze na stupních volnosti, z angličtiny, stupně svobody (df). Jinými slovy, řízením stupňů volnosti řídíme distribuci.
Studentská aplikace
Distribuce t se používá, když:
- Chceme odhadnout průměr normálně distribuované populace z malého vzorku.
- Velikost vzorku je menší než 30 položek, tj. N <30.
Z 30 pozorování se t-distribuce velmi podobá normálnímu rozdělení, takže použijeme normální rozdělení.
- Směrodatná odchylka populace není známa a musí být odhadnuta z pozorování vzorku.
Příklad
Předpokládáme, že máme 28 pozorování náhodné proměnné G, která sleduje Studentovo t rozdělení s 27 stupni volnosti (df).
Matematicky,
Protože pracujeme s reálnými daty, mezi daty a distribucí bude vždy chyba aproximace. Jinými slovy, průměr, medián a režim nebudou vždy nulové (0) nebo přesně stejné.
Frekvenci každého pozorování proměnné G reprezentujeme pomocí histogramu.
Může náhodná proměnná G aproximovat t-rozdělení?
Důvody pro zvážení, že proměnná G sleduje distribuci t:
- Distribuce je symetrická. To znamená, že existuje stejný počet pozorování vpravo i vlevo od centrální hodnoty. Také průměr a medián mají tendenci být blízké stejné hodnotě. Průměr je přibližně nula, průměr = 0,016.
- Pozorování s největší frekvencí nebo pravděpodobností se pohybují kolem centrální hodnoty. Pozorování s menší frekvencí nebo pravděpodobností jsou daleko od centrální hodnoty.