Kvantil - co to je, definice a koncept

Obsah:

Anonim

Kvantil je ten bod, který rozděluje distribuční funkci náhodné proměnné na pravidelné intervaly.

Proto nejde o nic jiného než o statistickou techniku, která odděluje data od distribuce. Samozřejmě musí být splněno, že skupiny jsou si rovny. Z tohoto důvodu existují různé typy kvantilu, jak uvidíme později, v závislosti na počtu oddílů, které vytvářejí.

Jsou velmi užitečné v mnoha praktických aplikacích, v příkladu, který si ukážeme.

Formulář pro výpočet kvantilu

Kvantily lze vypočítat z parametrického a neparametrického hlediska. Podívejme se na oba podrobněji a také na takzvanou „kvantilovou funkci“.

  • Parametrické: Používají se v distribucích, jejichž tvar známe. To znamená, že rozdělení bude normální, rovnoměrné, exponenciální atd. Tímto způsobem se předpokládá, že je znám a také jeho hlavní parametry (aritmetický průměr a rozptyl).
  • Neparametrické: Je vhodný pro malé vzorky, kde je obtížné znát jeho přesný tvar, a proto neznáme jeho distribuční funkci. Tato metoda poskytuje podobné hodnoty jako předchozí, když se vzorek zvýší, a proto je použití obou indiferentní.
  • Kvantilní funkce: Čelíme pravděpodobnostní formě výpočtu. Cílem je vypočítat hodnotu, která má určitou pravděpodobnost v distribuční funkci. Nebudeme se zabývat matematickými otázkami, které tento koncept komplikují.

Nejčastější kvantily

Ukážeme si, které jsou ve statistice nejpoužívanější kvantily. Většina z nich se běžně používá k tomu, aby bylo možné podrobně analyzovat distribuci dat. Kromě toho je dalším z jeho použití rozdělení dat do skupin, přičemž je možné zvolit nejvyšší nebo nejnižší. V příkladu to uvidíme podrobněji.

  • Kvartil: Rozdělte hodnoty do čtyř stejných skupin a existují tři kvartily. Je to nejčastější. Kvartil jedna (Q1) je nejnižší údaj a kvartil tři (Q3) je nejvyšší. Na druhou stranu kvartil dva (Q2) odpovídá mediánu (Me), což je statistika polohy, která rozděluje distribuci dat na polovinu. Hodnoty kvantilu by byly 0,25 (Q1), 0,5 (Q2) a 0,75 (Q3).
  • Kvintil: Podobně jako předchozí, je méně častý a rozděluje data na pět stejných částí. Proto existují čtyři kvintily. Hodnoty kvantilu by v tomto případě byly 0,20, 0,40, 0,60, 0,80.
  • Decile: V tomto případě jsou rozděleny na deset částí, a proto existuje devět decilů. Ani to není příliš časté. Jejich hodnoty by byly 0,1 až 0,9.
  • Percentily: Čelíme variantě, ve které je distribuce rozdělena na sto stejných částí. Může to být zajímavé pro velmi velké vzorky. Jejich hodnoty se pohybují od 0,01 do 0,99.

Kvantilní příklad

Podívejme se na příklad, ve kterém máme řadu údajů o příjmech obyvatel určité obce. Vypočítali jsme tři nejreprezentativnější kvartily a tři decily. Zahrneme použité vzorce, přičemž vezmeme v úvahu, že pro decily použijeme ekvivalent v percentilech. Pamatujte, že data v Q2 a D5 jsou ekvivalentní mediánu.

Můžeme pozorovat, že příjem jednotlivců představujících nejméně zvýhodněných 25% (Q1) je 2 900. Ve vztahu k decilu je příjem 10% (D1) jednotlivců, kteří dostávají nejméně, 2800. Stejný výklad se provádí u nadřízených, ale obráceně. Těch 25% (Q3), kteří vydělávají nejvíce, získá příjem 4 100 a 10% 4 800. Kvantil proto odráží relevantní informace, díky nimž se o proměnné dozvíte více.