Box Plot - co to je, definice a koncept

Obsah:

Anonim

Boxplot, z angličtiny, boxplot, je reprezentace kvantitativní nebo kategorické proměnné za účelem rychlé identifikace kvartilů datové sady.

Jinými slovy, boxplot je graf, který představuje kvantitativní nebo kvalitativní proměnnou v kvartilech.

Ve statistikách je to užitečný nástroj pro reprezentaci diskrétních i spojitých datových sad.

Je důležité mít na paměti, že kvalitativní proměnné proměnné nebo ty, které mají představovat pořadí nebo kategorii, musí být vždy spojeny s číselným indexem větším než 0, aby se mohly objevit v grafu a bylo možné vypočítat odpovídající statistiku.

Krabicový graf a histogram

Krabicový graf není nic jiného než histogram při pohledu shora a stejným způsobem je histogram krabicový graf při pohledu z boku. Níže je uveden příklad.

První charakteristikou, kterou oba grafy sdílejí, je minimum a maximum datové sady. Koncové pruhy za pomlčkami označují minimální (spodní pruh) a maximální (horní pruh). Odlehlé hodnoty by byly zastoupeny mimo rozsah maxima a minima. To znamená, že za mřížkami po pomlčkách. Můžeme také najít vodorovné rámečky.

Na první pohled vidíte, že většina dat je v obou grafech soustředěna na pozorování blízko minima. To je naznačeno grafem rámečku, ve kterém je rámeček blíže k minimu, než je maximum. Podíváme-li se na histogram, uvidíme, že nejčastějšími pozorováními jsou pozorování blízká minimu a daleko od maxima.

Informace o políčku

Informace poskytované rámečkovým grafem jsou následující:

  1. Spodní část pole je první kvartil (Q1).
  2. Sloupec uprostřed rámečku je střední nebo druhý kvartil (Q2).
  3. Horní část rámečku je třetí kvartil (Q3).
  4. Mezikvartilní rozsah nebo IQR by byla výška pole, tj. Rozdíl mezi Q3 a Q1.

Klíč pole spiknutí

Toto grafické znázornění se nazývá krabicový graf, protože vypadá jako rámeček. Abychom si tento graf zapamatovali, museli bychom myslet pouze na čtvercový objekt nebo krabici.

Pro čtenáře, kteří jsou obeznámeni s cenou finančních aktiv, uvidí více podobnosti se svíčkou. Svíčky, které vidíte v nabídce, jsou grafy polí přizpůsobené zvolenému časovému oknu.

Výhody a nevýhody grafu pole

Mezi výhody a nevýhody tohoto diagramu najdeme následující:

Výhoda

  • Globalizovaná vize absolutní frekvence kvantitativní nebo kvalitativní proměnné.
  • Znalost minima, maxima a kvartilů souboru dat, aniž byste je museli počítat.
  • Rozpoznávání extrémních hodnot rychleji než s histogramem, protože extrémní hodnoty jsou označeny kruhy mimo maximum a minimum.

Nevýhody

  • Pokud je datová sada malá, vytvoření pole pro vyjádření těchto dat znesnadní pochopení.

Příklad pole grafu

Předpokládáme, že chceme reprezentovat počet cyklistů, kteří projdou kolem našeho domu v průběhu roku. Nejprve spočítáme cyklisty a shromáždíme informace do tabulky.

Prostřednictvím některých programů, jako je R nebo Excel, můžeme vygenerovat graf zobrazený níže.

Díky reprezentaci počtu cyklistů skrz graf pole můžeme rychle intuitivně zjistit, kde je medián, ostatní kvartily, maximum a minimum. V tomto případě nemáme atypická data, protože za maximem a minimem nic není.

Použití tohoto typu grafu je velmi běžné vzhledem k jeho jednoduchosti a užitečnosti v mnoha oblastech mimo finance a ekonomiku.