Kategorická proměnná - co to je, definice a pojem

Obsah:

Kategorická proměnná - co to je, definice a pojem
Kategorická proměnná - co to je, definice a pojem
Anonim

Kategorická proměnná je proměnná, která umožňuje klasifikaci řady dat pomocí pevných hodnot spojených s konkrétní kvalitou nebo kategorií.

Kategorická proměnná, na rozdíl od hlavních nebo spojitých proměnných (které umožňují numerické výpočty), klasifikuje jednotlivce nebo případy. Obvykle berou hodnoty reprezentované celými čísly, jako je jedna nebo nula, ale to jsou jen reprezentace.

V příkladu to uvidíme podrobněji.

Rozdíly mezi kategorickou a spojitou proměnnou

Mezi kategorickou proměnnou a spojitou nebo základní proměnnou, kterou je třeba znát, existují určité rozdíly. Podívejme se na nejrelevantnější.

  • Nejprve se pro seskupení použije kategorická proměnná a pro počítání spojitá proměnná. Jinými slovy, první umožňuje vytváření kategorií pomocí řady dat. Například pohlaví nebo počet dětí. Druhý nám poskytuje číselné informace. Například věk.
  • Kardinální proměnná umožňuje numerické výpočty, ostatní nikoli. Tímto způsobem v první z nich můžeme znát prostředky nebo odchylky, zatímco v ostatních pouze některá data, jako je režim nebo procento kategorií.
  • Ty kategorické jsou velmi užitečné pro znalost kvalitativních informací, tedy určité kvality dat. Kontinuální nám poskytují kvantitativní data, tj. Množství a hodnoty představované čísly.

Statistické techniky pro kategorické proměnné

Dále se podívejme na statistické techniky nejpoužívanější v kategorických proměnných a porovnáme je se statistickými technikami spojitých nebo hlavních proměnných.

  • Deskriptivní statistika: U tohoto typu proměnných jsou analýzy obvykle založeny mimo jiné na sloupcových a procentních diagramech. Kardinálové umožňují použití analytických technik k výpočtu statistik polohy, jako jsou kvantily, nebo statistik rozptylu, jako jsou odchylky.
  • Kontrast hypotézy: V kategorickém lze výsledky extrapolovat pomocí neparametrických testů hypotéz. Na druhé straně kontinuální používají parametrické kontrasty, které lze také odvodit.
  • Regresní techniky: V tomto případě se pro první případy mimo jiné používá logistická regrese apod. U ostatních typů proměnných je nejpoužívanější technikou lineární regrese.

Příklad kategorické proměnné

Na závěr se podívejme na velmi běžný příklad v marketingu. Představme si, že chceme prodat produkt a zajímá nás rodinný stav.

Za tímto účelem přidělíme 1 svobodným, 2 ženatým, 3 rozvedeným, 4 partnerům a 5 dalším.

Podívejme se na obrázek a poté jej okomentujte:

V něm vidíme, že nejvyšší procento jednotlivců je svobodných, ženatých a rozvedených, přičemž další dvě možnosti jsou pouze 5%.

Jak vidíme, kategorické proměnné jsou užitečné pro seskupování. Sloupcový graf nám umožňuje lépe sledovat tato procenta, protože je snazší porovnat velikost sloupců.