Diskriminační analýza - co to je, definice a pojem

Obsah:

Anonim

Lineární diskriminační analýza nebo Lineární diskriminační analýza (LDA) je statistická technika, která vytváří funkci schopnou klasifikovat jevy s přihlédnutím k řadě diskriminačních proměnných a pravděpodobnosti příslušnosti.

Proto máme co do činění s typem statistického postupu, který se snaží seskupit na základě určitých podobností. Tímto způsobem umožňuje kvantifikovat pravděpodobnost příslušnosti k jedné nebo druhé skupině. Tyto skupiny jsou známé a priori, na rozdíl od klastrové analýzy.

Matematický model diskriminační analýzy

Podívejme se, jak by vypadal matematický model diskriminační analýzy.

Je to velmi jednoduché, protože je založeno na systému lineárních rovnic. Analýza je samozřejmě složitější, ale to by bylo mimo práci Economy-Wiki.com, jednoduché ekonomiky.

Jak vidíme, jedná se o množinu rovnic, jejichž závislá proměnná (y) představuje určité skóre. Jedná se zase o lineární funkce jiných diskriminačních proměnných (X) a řady parametrů (a).

Cílem těchto lineárních kombinací je maximalizovat rozptyl mezi skupinami a minimalizovat ten, který se mezi skupinami vyskytuje. Tímto způsobem lze nové případy seskupit s určitou pravděpodobností, o které můžeme znát jejich hodnotu, pokud splňují tato kritéria.

Následný proces k provedení diskriminační analýzy

Podívejme se, jak lze provést analýzu tohoto typu:

  1. Nejprve musíte vytvořit datovou tabulku s případy a proměnnými. Zahrnuta je také kategorická proměnná, která definuje každou ze skupin.
  2. Dále je matematický model generován s číselnými údaji. Bude vycházet z toho, který jsme viděli v předchozí části. Statistický software jako SPSS nebo free R automatizuje celý proces.
  3. A konečně, s touto analýzou budeme schopni vysvětlit, proč každý případ patří do jedné nebo jiné skupiny, a navíc stanovit kritérium členství pro nové případy. To bude založeno na pravděpodobnosti, že bude zahrnut do jednoho nebo druhého.

Příklady použití diskriminační analýzy

Na závěr se podívejme na několik příkladů použití diskriminační analýzy.

Pamatujme také, že u všech je cílem vytvořit diskriminační funkci, která seskupí každý nový případ podle pravděpodobnosti.

  • Chceme klasifikovat různé země na základě jejich makroekonomických údajů: Nerozvinuté, rozvíjející se nebo rozvinuté země (skupiny). Vytvoříme diskriminační funkci, abychom mohli vypočítat pravděpodobnost, že země bude patřit k jedné nebo druhé skupině.
  • Chceme provést marketingovou kampaň a zajímá nás, do jakých skupin klasifikovat jednotlivce: Můžeme tedy odpovědět na určité otázky, například na to, jaké by byly vlastnosti příležitostného zákazníka.
  • Chceme znát míru rizika (skupiny) určitých klientů ohledně poskytnutí půjčky: Použijeme proměnné týkající se vašeho příjmu, měsíčních výdajů, historie nebo typu práce. Diskriminační funkce nám poskytuje relevantní informace o solventnosti.

Jak vidíme, diskriminační analýza je v mnoha situacích velmi užitečná. Nejenže se týká ekonomiky, ale mimo jiné se používá také v medicíně, geologii nebo biologii.