Odchylka kvartilu - co to je, definice a koncept

Obsah:

Odchylka kvartilu - co to je, definice a koncept
Odchylka kvartilu - co to je, definice a koncept
Anonim

Odchylka kvartilu je statistická míra rozptylu, která vrací centrální hodnotu mezikvartilového rozsahu a používá se v zkosených souborech dat.

Jinými slovy, kvartilní odchylka spočívá v výpočtu mediánu mezikvartilového rozsahu (IQR) a používá se v souborech dat s několika extrémními hodnotami.

Zkratkou pro kvartilovou odchylku je DQ.

Rozsah interkvartilní

Mezikvartilový rozsah je měřítkem rozptylu souboru dat, který se obecně používá v grafu pole. Jinými slovy, mezikvartilní rozsah je rozdíl mezi předposledním a prvním kvartilem distribuce použité v krabicovém grafu.

IQR = Q3 - Q1

Výhodou použití mezikvartilového rozsahu je, že lze vypočítat kvartilní odchylku (DQ), což je velmi adekvátní míra rozptylu, když máme zkreslené datové sady.

Vzorec odchylky kvartilu

Odchylka kvartilu se vypočítá jako dělení mezikvartilového rozsahu 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Jelikož uvažujeme pouze rozptyl mezi třetím a prvním kvartilem, ignorujeme všechna data mimo tento rozsah. A proto jsou všechny hodnoty extrémní. Pokud tedy vydělíme mezikvartilní rozsah dvěma, získáme střední hodnotu disperze.

Příklad kvartilové odchylky

Předpokládáme, že chceme vypočítat mezikvartilní rozsah a kvartilní odchylku počtu cyklistů, kteří projdou naším domem během roku.

  1. Nejprve spočítáme cyklisty a shromáždíme informace do tabulky.
  1. Za druhé, vypočítáme první a třetí kvartil, abychom získali mezikvartilový rozsah.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550-200 = 350

  1. Za třetí, vypočítáme disperzi kvartilu jednoduchým dělením mezikvartilového rozsahu dvěma.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Kvartilové rozpětí pro tuto sadu dat je 175. Toto číslo je centrální hodnotou mezikvartilového rozsahu.

Je důležité si uvědomit, že údaje za měsíc červenec jsou extrémní údaje, protože jsou několikanásobně vyšší než všechna ostatní data. Dalo by se tedy říci, že tento soubor dat je k danému měsíci předpojatý. Díky „neznalosti“ kvartilového rozptylu směrem k extrémním údajům je výsledek tohoto opatření velmi podobný, jako kdyby v červenci obíhalo pouze 600 cyklistů. Pokud by v červenci bylo jen 600 cyklistů, rozptyl kvartilu by byl 162,5, což je velmi blízko 175 vzhledem k tomu, že počet cyklistů v daném měsíci je 10krát menší.