Hodnota p, z angličtiny, p-hodnota, je minimální nevolitelná úroveň významnosti, s níž můžeme odmítnout nulovou hypotézu (H0) danou distribuční funkcí a statistikou testu.
Jinými slovy, hodnota p je minimální pravděpodobnost definovaná distribucí, s níž můžeme odmítnout nulovou hypotézu (H0), aniž bychom museli definovat a priori úroveň významnosti kontrastu.
Pokud si pamatujete, budete si pamatovat, že oblast pod křivkou distribuční funkce je pravděpodobnost. Z tohoto pohledu tedy bude p-hodnota pravděpodobnost pozorování takové extrémní testovací statistiky, aby byla nulová hypotéza pravdivá.
Doména
Protože p-hodnota je pravděpodobnost, bude tato hodnota mezi 0 a 1.
Není svévolné
Na rozdíl od úrovní významnosti, na které jsme více zvyklí, například 1%, 5% a 10%, závisí hodnota p na distribuční funkci, kterou má statistika testu. O úrovních 1%, 5% a 10% se tedy rozhoduje na začátku kontrastu. Tento výběr se nazývá libovolný.
Vzorec hodnoty P.
Hodnota p není jedinou hodnotou, jako je kritická hodnota, ale bude záviset na statistice. Pro různé hodnoty statistiky testu bude kritická hodnota stejná. Na druhou stranu pro různé hodnoty statistik testu bude hodnota p také odlišná, protože hodnota p závisí na hodnotě, kterou statistika testu nabere.
Kde,
- D, je náhodná proměnná, která sleduje určité rozdělení.
- d, je hodnota statistiky testu.
Výpočet
Je možné vypočítat hodnotu p ručně, ale museli byste mít velmi přesné distribuční tabulky, tj. S mnoha desetinnými místy, protože hodnota p má tendenci být malá. Většina statistických programů již p-hodnotu začlenila a obvykle se objevuje ve výstupu výsledků odhadu pomocí Obyčejných nejmenších čtverců (OLS). Může se to zdát obtížné, ale v praxi je to velmi užitečný nástroj.
Pro výpočet hodnoty p potřebujeme:
- Statistika kontrastu.
- Rozložení statistiky kontrastu a znalost jeho parametrů.
Pravidlo odmítnutí
Pokud je p-hodnota < hladina významnosti => odmítnutí H0.
Pokud je p-hodnota > hladina významnosti => Žádné odmítnutí H0.
Zastoupení
V případě Studentova t rozdělení se 2 stupni volnosti a statistikou kontrastu rovnou 3 je pravděpodobnost nalezení takové extrémní statistiky, když platí nulová hypotéza (H0), 4,77%.
Jinými slovy, pokud by byla nulová hypotéza (H0) pravdivá, statistika velká jako 3 by byla pozorována pouze 4,77% času.
Proč se tomu říká p-hodnota?
Název p-hodnoty má původ v definici, která odkazuje na to, že je to oblast pod křivkou distribuční funkce mimo interval spolehlivosti. Jelikož tato oblast představuje minimální pravděpodobnost odmítnutí nulové hypotézy, „p“ hodnoty p se vztahuje k pravděpodobnost. A protože hodnota p odpovídá číslu, a tedy hodnotě, je číslu přiřazeno slovo „hodnota“ hodnoty p. V některých knihách můžeme najít „hodnotu pravděpodobnosti“ odkazující na hodnotu p. Možná říkat „minimální pravděpodobnost odmítnutí nulové hypotézy“ bylo příliš dlouhé a pro studenty nebylo tajemstvím …